Semiòtica Símbols ( Evolució dels llenguatges Sistemes d’escriptura Català: Etimologies ) Un món que parla, escolta, escriu i llegeix | Psicologia: desenvolupament, Intel·ligència (la veu humana)
Introducció: nocions Origen Teories Pragmàtica Semàntica Morfosintaxi Discussió
Introducció
Un món que parla, escolta, escriu i llegeix . Tenim un món bàsicament oral fins a la impremta i fins al s19 no comença l’alfabetització i la lectura generalitzada (tot i que el 1900 només sabia llegir un 12% de la població mundial). Al s20 som un món que a escolta la ràdio i mira la televisió. Al s21 som un món que mira el mòbil. Tenim converses interpersonals, recitals, teatre, cinema, discursos, educació, publicacions de llibres i revistes, ràdio i televisió, xarxes.
[Nocions bàsiques]
La lingüística és l’estudi del llenguatge, una forma de comunicació que permet referir coses a signes que poden ser fonemes (fonètica) o grafemes. És el “segon sistema de senyals” (Pavlov). Aquests items poden no ser presents (propietat de desplaçament). Aquest aspecte és la semàntica. Els signes s’organitzen formant mots i oracions: la morfosintaxi. Un missatge té diferents efectes segons el context, pot ser una ordre que espera ser obeïda, o una pregunta que espera una resposta: la pragmàtica.
La semiòtica ens distingeix significant i significat. Llenguatge (language) seria el sistema de comunicació en general, que existeix en uns 5000-7000 llengües o llenguatges (langue, tongue) de diferents comunitats culturals. Cada persona o grup tindrà una parla (parole, speech) particular amb el seu accent.
Els teòrics de la comunicació proposen el model SMCR): Source (Emissor) – Message (Missatge) – Channel (Canal) – Receiver (Receptor). (David Berlo 1960).
[Tenim un subjecte en un cert estat mental i en un moment donat es desencadena una pauta de conducta comunicativa
- saludar, explicar, preguntar, escriure què ha passat avui [pragmàtica]
- “què vull dir”? Vull descriure el que m’envolta? Busco els mots que corresponen als objectes. Vull explicar com em sento? identifico el meu estat [semàntica]
- construeixo una frase, modificant si cal els mots de singular a plural, modificant-los amb adjectius o frases subordinades. [morfosintaxi]
(Charles Morris ho resumia dient que la semàntica estudia la relació entre les paraules i el món, la pragmàtica, la relació entre les paraules i els usuaris, i la sintaxi en la relació entre paraules]
Origen
Origen i evolució
Possiblement evolucionat a partir del gest, impulsat per la necessitat de coordinació a les comunitats juntament amb avantatges evolutius per emetre sons i augment del cervell.
Fa uns 20.000 anys s’haurien separat les grans famílies, llengües africanes, Dene Caucasià (E Xinès), Nostratic (NW dins del qual hi ha l’arbre indoeuropeu i l’Amerindi). La separació vindria donada pels talls geogràfics, el Sahara, els mars separant Austràlia i Amèrica.
Hocket va identificar com a característiques pròpies dels humans: Displacement (fer referència al que no està present), productivitat (recursivitat, generació de missatges nous), dualitat de patrons (sons que individualment no volen dir res s’uneixen i se’ls assigna significat) i arbitrarietat (sense relació natural entre el signe i el significat).
La neurologia ha identificat al cervell l’àrea de Broca com a associada a la producció de llenguatge (si està afectada el subjecte entén però no pot parlar) i la de Wernicke (el subjecte no processa el llenguatge però pot emetre sons i frases sense sentit). (Cervell: Estudi a partir de lesions i mapes per histologia)
[Amb el llenguatge, el “subjecte simbòlic”, s’introdueix el segon sistema de senyals. Si la percepció i representació constitueixen un senyal de primer ordre, referència a un objecte, un mot és un senyal d’un senyal, que remet a un concepte. S’ha dit que els sers vius converteixen tota experiència en signes (Cerdà) [l’experiència es projecta en els paràmetres significatius, per exemple, el contacte amb plantes es dividirà entre entorn indiferent, comestible o perillós]. Cerdà indica que el real es presenta com un continu indiscriminat mentre que el llenguatge és discret i diferenciat. Plett diu que “Das Denotat stellt einen Auschnitt aus einem Wirklichkeitsmodell dar; dieses ist weder eine objektive (d.h. verifizierbare) noch eine bloß subjektive (d.h. willkürliche) Größe, sondern ein kommunikativer Beziungsfaktor, der jeder Textübermittlung vorausliegt”. [Aquest tall, del real al pensat i expressat és prou complex com per merèixer la Crítica de la Raó pura de Kant].
En l’home la representació és prou complexa com per arribar a formar conceptes (agrupació organitzada de dades sensorials) i abstreure’n les propietats comunes i diferencials. D’altra banda l’organització social de la comunitat humana es caracteritza per la cooperació en la reproducció i producció, la qual cosa fa necessària la comunicació per coordinar les accions. Conceptes, necessitat de comunicació i possibilitat d’articular sons fan que en l’home aquesta transformació d’experiències en signes arribi a tenir un codi comunitari [si fem l’analogia de la societat amb un organisme, la comunicació lingüística tindria el paper del sistema nerviós].
Al Cràtil Plató presenta personatges preguntant si les paraules són arbitràries o bé si es basen en característiques dels objectes que referencien. Sòcrates veurà insuficients les dues teories i dirà que cal anar més enllà del llenguatge, a les idees mateixes [veure més avall el mentalese de Fodor].
Etapa prelingüística (0–12 mesos), balbuceigs. Etapa de la paraula única (12–18 mesos):“mama”. Etapa de les dues paraules (18–24 mesos): frases telegràfiques com “mama cotxe”. Expansió gramatical (2–3 anys). Verbs conjugat. Domini bàsic del llenguatge (3–4 anys). Frases més llargues i complexes, coordinació (“i”, “però”) i subordinació (“perquè”, “quan”). Consolidació i refinament (4–6 anys i més enllà).
Estudis i teòrics
- [inicis] [Com etiquetem el món? quin és el lèxic mínim per sobreviure? ] → vocabulari (semàntica), Com pronunciem i escrivim correctament? → ortografia
- [Com generem significat, infinits significats, amb un grup reduït de signes? → les combinacions de fonemes per generar diferents signes, el significat depenent de la relació d’un signe amb els altres [no n’hi ha prou amb una llista de paraules i coses, segons s’organitzen sintàcticament tenim diferentes significats → semiòtica, teoria dels signes, valor a partir de les relacions, Saussure, estructuralisme. → la idea d’una estructura lògica subjacent: Port Royal, Chomsky [morfosintaxi]
- la diversitat de les llengües i com evolucionen. Humboldt. Labov i sociolingüística de dialectes. Greenberg i la Tipologia de llengües.
- [Què volem fer amb els missatges?] funcionament de la llengua, pragmàtica, Jakobson, Morris, Austin, Searle, Halliday, Grice.
- Influència del llenguatge en el pensament. Humboldt. Relativisme lingüístic de Sapir-Whorf. Lakoff i Johnson, La metàfora com a recurs per entendre un domini en termes d’un altre.
- [podem automatitzar la comprensió del llenguatge?] NLP (Natural language processing): ontologies [prolog, semàntica], i morfosintaxi. LLMs en AI.
Fins al s19
Grècia i Roma: Aristòtil, Plató i els estoics van analitzar la relació entre llengua i significat. Aristòtil va tractar la relació entre llenguatge i referència en la seva “Categoriae”. Dionís de Tràcia (s. II aC) va escriure la primera gramàtica grega distingint entre diferents categories gramaticals (el que seria morfosintaxi en el futur.) [Al banquet dels erudits es discuteixen a vegades diferents expressions o conjugacions].
A la Índia del s IV aC es coneix una de les primeres gramàtiques, la de Pāṇini (Aṣṭādhyāyī).
A l’edat mitjana els estudis lingüístics es van centrar en la gramàtica llatina i l’anàlisi dels textos religiosos. Els estudis superiors s’estructuraven en el Trivium, les arts de la paraula, i el Quadrivium (aritmètica, geometria, música i astronomia). Al Trivium s’estudiava la gramàtica (llengua llatina, estructura i regles), retòrica (tècniques per parlar i escriure de manera persuasiva, amb atenció als discursos i a la composició literària) i Dialèctica, l’art del raonament correcte i de la discussió filosòfica, basada en obres com les d’Aristòtil.
En el món àrab Sibawayhi (s. VIII) va desenvolupar la gramàtica de l’àrab basada en un enfocament estructurat.
[Estructura lògica profunda universal]
La “Grammaire générale et raisonnée” de Port Royal, 1660, escrita per Antoine Arnauld i Claude Lancelot, sostenia que totes les llengües comparteixen una estructura lògica subjacent, basada en la “raó humana” (inspirada en el racionalisme cartesià) [subjecte, verb, complement]. Hi hauria una capacitat innata per generar oracions vàlides reflectint la manera de pensar. Hi ha una estructura profunda lògica [la sintaxi] i una forma superficial. En aquest sentit anticipa el generativisme de Noam Chomsky [A la KrV Kant assenyala que entenem l món amb categories de l’enteniment a priori com causalitat i substància; és interessant notar que, si vivim en termes narratius, aleshores entenem el món en termes de subjecte i predicat].
[Lingüística comparada, evolució de llengües, semàntica cultural]
Al s19 [com a resultat del colonialisme?] neix la lingüística Comparativa. Franz Bopp i Rasmus Rask estudien la relació entre llengües indoeuropees. Jakob Grimm formula la llei que explica els canvis fonètics en l’indoeuropeu. Wilhelm von Humboldt (1767–1835) va estudiar diferents llengües, el bac, el sànscrit, llengües ameríndies. A “Über die Verschiedenheit des menschlichen Sprachbaues” (1836) va proposar que cada llengua estructura una visió del món diferent (“Weltanschauung”). [Com Port Royal], Humboldt creia que tots els humans comparteixen una capacitat lingüística universal, però que aquesta es manifesta de manera diversa en cada llengua. Les diferències en les categories gramaticals influeixen en la manera de percebre la realitat. Per exemple, una llengua sense temps verbals explícits (com el xinès clàssic) podria predisposar a una concepció diferent del temps (Vivim el temps de manera semblant a com llegim d’esquerra a dreta, o de dalt a baix en cas del xinès (BBC). La llengua és l’esperit d’un poble, encapsula la visió cultural i intel·lectual del poble que la parla (anticipa el relativisme lingüístic de Sapir-Whorf). [Hi havia implícita la noció que algunes llengües i Weltanschauungen eren superiors com el grec i l’alemany. En un context de colonialisme implicaria descartar les llengües natives per adoptar les superiors dels colonitzadors. Això seria qüestionat per primer cop per Franz Boas].
Lingüística moderna
Al s19 el lògic Gottlob Frege va anticipar la semàntica formal introduint la distinció entre sentit (“Sinn”) i referència (“Bedeutung”). [Sinn és la informació, per exemple “l’estel del matí” diferent de “el planeta després de Mercuri” o “l’autor de Ada” diferent de “El curador de papallones de la universitat de Cornell”, mentre que la referència és la mateixa.]
Estructuralisme
Saussure al “Cours de linguistique générale” (1916) diferencia entre langue [general] i parole [particular], significant i significat [semàntica], i com el valor d’un signe depèn de les relacions amb els altres [morfosintaxi, estructuralisme].
L’Escola de Praga (dècades de 1920-1930)
Trubetzkoy distingueix entre fonètica com a estudi dels sons físics, i fonologia com a estudi dels sons com a elements funcionals d’un sistema lingüístic. S’identifiquen els elements fonètics mínims que serveixen per a dur a significats diferents (per exemple p i b són bilabials molt semblants però separen ex. pot i bot.
En sintaxi identifica tema [de qui es parla] i rema [què es diu], ex. A la Maria, em Joan li va dur flors [el subjecte és Joan, però el tema és la Maria]. En morfologia van desenvolupar criteris per classificar llengües segons com organitzen els morfemes (ex.: llengües flexives com el català vs. aglutinants com el turc).
Jakobson proposa que tot acte comunicatiu pot tenir sis funcions, depenent de l’èmfasi en un element [Pragmàtica]:
1. Emotiva (expressió del parlant).
2. Conativa (ordre o imperatiu).
3. Referencial (context extern).
4. Poètica (forma del missatge).
5. Fàtica (mantenir la comunicació, ex.: “Hola?”).
6. Metalingüística (parlar del propi llenguatge, ex.: “Què vols dir?”).
Leonard Bloomfield.
Language 1933. Va estudiar les llengües dels nadius americans, com l’algonquin i això el va fer concentrar en descriure i analitzar el que era observable, en la línia conductista (la llengua és una forma de conducta humana), sense recórrer a interpretacions psicològiques o mentals. Seguint Saussure va descriure sistemàticament els sons (fonologia), formes de les paraules (morfologia), estructures de les frases (sintaxi). L’objectiu de la lingüística és descriure els “patrons regulars” de les dades lingüístiques. El significat s’ha d’entendre, si cal, “de manera operacional”, és a dir, segons com es manifesti en l’ús.
Relativisme lingüístic 1930s
Edward Sapir (1884-1939) va estudiar les llengües natives americanes i va afirmar que el llenguatge influencia la manera com percebem el món. El seu deixeble Whorf (1897–1941) la ho estendre a que la llengua condicionava com pensem i percebem la realitat. Per exemple, d’acord amb Franz Boas, els esquimals tenen molts més mots per designar “neu”. Això va ser qüestionat més tard. [ja que hi interaccionen més que un europeu estàndar]. O bé els Hopi no tenen mots per comptar el temps en unitats discretes com “dues hores” o “tres dies”. ( Vivim el temps de manera semblant a com llegim d’esquerra a dreta, o de dalt a baix en cas del xinès (BBC). El relativisme lingüístic serà criticat pels universalistes com Chomsky que creuen en una facultat de cognició innata per a tots els humans]. Serà reivindicat en part per Lakoff en el sentit que diferents cultures fan servir diferents metàfores i per tant pensen la realitat de manera diferent.
Generativisme i Transformacionalisme. Noam Chomsky
“Syntactic Structures”, 1957. Un parlant ideal pot generar i entendre una quantitat infinita de frases correctes mai escoltades abans, cosa que el conductisme no podia explicar per la simple exposició a repetició d’estímuls resposta. Infereix que els humans tenen una facultat lingüística innata, una competència lingüística (el coneixement intern, intuïtiu, que un parlant té de la seva llengua) que després es posa en marxa en unba actuació lingüística (l’ús real del llenguatge en situacions concretes, que pot estar afectat per errors, lapsus, etc.). El segon és el que observa el conductista [i a l’extrem el que fan els LLM], el primer és el que podem inferir que existeix, una estructura mental innata comuna a totes les llengües: la gramàtica universal (antecedent Port Royal). Cada llengua té un conjunt de regles que que eprmetren generar el conjunt de frases gramaticals possibles d’una llengua. Cada ffrase té una estructura profunda [anàlisi sintàctica] que es transforma en l’estructura superficial o concreta. Per exemple: “ahir, el gat es va menjar un peix” amb structura profunda: el gat v: va menjar cd: el peix ct:ahir, que també s’hauria pogut transformar en forma passiva.
Si Kant a la KrV afirmava que “El que podem conèixer depèn de com estem estructurats per conèixer” [categories de l’Enteniment], Chomsky dirà que “El que podem dir depèn de com estem estructurats per adquirir llenguatge”.
J.R. Firth (1957) i Zellig Harris (anys 50-60): Relació entre context i significat, que després influenciaria la pragmàtica.
William Labov i la Sociolingüística
Va estudiar les variacions en la parla (accent, gramàtica, vocabulari) en grans ciutats com New York i Filadèlfia. Aquestes variacions no són errors ni anomalies, sinó que segueixen patrons regulars i predictibles relacionats amb factors socials (barri, educació, classe, edat, gènere, context formal/informal). Això contradiu la visió tradicional segons la qual hi havia una sola forma “correcta” de parlar. Introduí el concepte de “regles variables”, en què una regla gramatical no s’aplica sempre, sinó amb una determinada probabilitat segons el context social. El 1966 va estudiar la parla dels dependents de Macy’s i Saks mostrant la correlació entre classe social i pronunciació i com la parla es modula segons el context. Va analitzar com el llenguatge canvia dins d’una mateixa generació, a partir de l’ús real de la llengua (no només textos escrits o normes formals). Va defensar el valor lingüístic de dialectes sovint estigmatitzats, com l’anglès afroamericà vernacle (AAVE), no era “anglès mal parlat”, sinó un sistema coherent amb regles pròpies.
Michael Halliday, funcions dels llenguatge
(Introduction to Functional Grammar, first edition, 1985), proposa estudiar com funciona el llenguatge més que no pas la seva estructura formal. Identifica 7 funcions que el llenguatge té per als nens que l’estan adquirint. Per satisfer les seves necessitats físiques i emocionals: Isntrumental (vull aigua), Regulatori (vés´t’en), interacció (t’estimo, mama), personal (e.g. “Me good girl.”). Per espabilar-se amb l’entorn: Heuristic (e.g. “What is the tractor doing?”), Imaginatiu per explicar històries i bromes [En Guillem a Cabrera, “jo et tallaré el cul…”], Representational per descriure fets. També identifica tres funcions metafuncionals del llenguatge [més enllà de la referència]: Ideacional (representa el món, idees, accions, processos, participants / correspon a la referencial de Jakobson ), Interpersonal (expressa relacions socials, actituds, emocions com ordres, preguntes, afirmacions / correspon a l’emotiva i conativa de Jakobson), Textual organitza el discurs per fer-lo coherent (com la poètica de Jakobson).
Halliday i Jakobson estudien com funciona el llenguatge en un context concret més que no pas intentar inferir la lògica subjacent, la facultat innata com fa Chomsky. Atenen el llenguatge com a sistema de significació en un context, com a acte de comunicació i no tant com un càlcul formal intern.
Pragmàtica [el llengua funcionant en un context, amb antecedents de Jakobson]
Charles Morris (1938) en el marc de la semiòtica assenyala que en l’estudi del signe hi ha tres dimensions: la sintàctica per les relacions entre signes), semàntica per la relació entre signes i el que representen i pragmàtica per la relació entre signes i els usuaris (context, intenció, efecte).
J.L. Austin (“How to Do Things with Words”, 1962) proposa una teoria dels actes de parla: Locucionaris, el significat literal d’un enunciat. Il·locucionaris, la força o intenció (com prometre, ordenar, preguntar). Perlocucionaris, l’efecte en l’interlocutor (p. ex., convèncer, intimidar).
John Searle (1969) classifica els actes il·locucionaris [què pretenem quan parlem] en assertius (afirmar, descriure), directius (ordenar, demanar), comissius (prometre, oferir-se), expressius (agrair, disculpar-se), declaratius (batejar, declarar culpable).
H.P. Grice (1975) analitza com els parlants inferen significats no literals mitjançant el principi de cooperació i quatre màximes: Qualitat (dir el veritable), Quantitat (donar la informació necessària), Relació (ser rellevant), Manera (ser clar). Es parla de conversation implicature quan ens saltem alguns d’aquestes màxines, (per exemple amb la ironia o el sarcasme, o quan diem “estic bé” i en realitat demanem ajuda).
Tipologia de llengües. Joseph H. Greenberg
“Some Universals of Grammar with Particular Reference to the Order of Meaningful Elements” (1963) va estudiar unes 30 llengües per trobar tendències estadístiques globals. Això va permetre classificar les llengües d’acord amb uns 45 universals lingüístics.
Si una llengua té ordre SOV, tendeix a tenir postposicions (no preposicions). Exemple: Japonès → “watashi wa gakō e ikimasu” (“jo escola a vaig”) → ordre SOV i postposicions com “e” (“a”). Tendeixen a usar sufixos més que prefixos.
Si una llengua té preposicions, el genitiu (possessiu) ve després del nom. Exemple: Francès → “la maison de Marie”. És probable que posi l’adjectiu després del nom.
Si una llengua té verbs abans dels objectes (VSO o VOS), generalment té preposicions. – Exemple: Irlandès → “D’ith mé an t-arán”
Si una llengua té distinció entre masculí i femení en pronom de tercera persona, també en tindrà en noms.
Si una llengua té vocals nasals, també tindrà consonants nasals.
Totes les llengües tenen pronom de primera i segona persona, cap llengua coneguda prescindeix de “jo” i “tu”.
Lakoff i Johnson. El llenguatge determinant el pensament
Metaphors we live by (1980). Exploren com traslladem propietats de moviment, orientació, personificació d’un domini a un altre. [semàntica].
Natural Language Processing, El projecte de què un programa entengui un text [semàntica: ontologies per entendre textos, morfosintaxi per trobar l’estructura de les frases]
Regles
1950–1960: Els orígens i la traducció automàtica, projecte Georgetown-IBM (1954), que va traduir 60 frases del rus a l’anglès. Depenia molt de regles i diccionaris, i no podia entendre el llenguatge. L’informe ALPAC de 1966 va criticar els pobres resultats i va frenar el finançament per dècades. 1970–1980: Regles, sintaxi i intel·ligència artificial simbòlica basades en gramàtiques formals (Chomsky). Es va intentar escriure ontologies sobre el món real que poguessin ser enteses per un ordinador (MARGIE Schank 1975, SAM Cullingford 1978, PAM Wilensky 1978, TaleSpin (Meehan, 1976), QUALM (Lehnert, 1977), Politics (Carbonell, 1979), and Plot Units (Lehnert 1981).
Models estadístics
1990: Es deixa de treballar amb regles i arriben els models estadístics basats en dades. (Models de Markov ocults (HMMs) per etiquetatge morfològic i reconeixement de la parla), Penn Treebank per entrenar models estadístics. A partir del 2000 s’utilitza machine learning supervisat per classificar textos, anàlisi de sentiments i extracció d’informació. Tècniques com SVMs, Random Forests (arbre de decisió) i CRFs. Apareixen corpus anotats de recursos lingüístics com WordNet i FrameNet. 2010: Xarxes neuronals i word embeddings (Word2Vec, GloVe, i representacions distribuïdes. Ús del deep learning (RNNs, LSTMs, seq2seq) per traducció, respostes i més. Grans millores en traducció. 2018–avui: Transformers (Vaswani et al. 2017) permeten treballar en paral·lel i millorar el context. Apareixen models gegants com BERT (2018, comprensió profunda de textos) i GPT (2018–2023, generació de llenguatge natural). (AI, LLM). S’obren nous camps com zero-shot learning, few-shot learning, resum automàtic, agents conversacionals, etc.
Els NLPs aspiraven a “entendre” un text projectant-lo sobre una ontologia predefinida, cosa que els LLMs no fan però arriben a resultats similars. (AI LLMs entendre text)
Pragmàtica
[L’estudi de la pragmàtica apareix més tard amb Jakobson, Morris, Austin, Searle, Halliday, Grice. Semàntica i sintaxi partien del missatge, la pragmàtica es pregunta pel context, “Què volem fer amb les paraules?”. Més encara, ens podem demanar quines són dels conductes que inclouen un missatge? Quins estímuls desencadenen un discurs com a resposta? És a dir, perquè comuniquem en lloc d’estar callats i donem lloc a un món que parla?]
El context i principis
El significat canvia segons la situació (ex.: ironia, sarcasme, cortesia). “Quin fred que fa aquí!” pot ser una pista per tancar una finestra o una ironia si fa calor.
[De fet cal pressuposar que els comunicants comparteixen, almenys fins a un cert punt, un model de món que constitueix el context de la comunicació. Vindria a ser el que donem per sabut. El missatge que s’emet conté només la informació rellevant, en principi només parlaríem per afegir allò que no ve donat pel context, “avisar que cau una pedra”, “expressar que alguna cosa em fa mal, per si no se n’havien adonat”. El context de la comunicació té a veure amb el que Husserl anomenà Lebenswelt o món de la vida i que fou reprès per Habermas. Donada una situació i una estratègia comunicativa (descriure, fer un acudit), podrem deduir els missatges a produir, i els podrem classificar com a obvis, inesperats, absurds, creatius, etc. c1990] (DS 2025) La Teoria de la pertinència de Sperber i Wilson assenyala que els humans busquen el màxim significat amb el mínim esforç, interpretant pistes contextuals. [ho havia anticipat; alhora per reflexionar quants missatges inútils estem enviant].
Grice parla del principi de cooperació. Els parlants segueixen (haurien de seguir normes implícites per ser eficients, no mentir (qualitat), donar la informació necessària i rellevant (quantitat i rellevància) i ser clar [és el que es jura en els judicis: “jura dir la veritat, tota la veritat i res més que la veritat?”).
Tipus d’oracions
- Afirmació, negació
- Implicació
- Conjectura
- Interrogació
- Imperatiu
- Creença
Actes lingüístics segons Austin:
- Locucionaris: enunciar quelcom. (Constatives: affirming, alleging, announcing, answering, attributing, claiming, classifying, concurring, confirming, conjecturing, denying, disagreeing, disclosing, disputing, identifying, informing, insisting, predicting, ranking, reporting, stating, stipulating).
- Perlocucionaris: enunciat que provoca un cert efecte sobre els oients, ex. “Foc, foc”. La resposta dels oients podria haver estat provocada també per fets no lingüístics (com la visió del foc). Directives: advising, admonishing, asking, begging, dismissing, excusing, forbidding, instructing, ordering, permitting, requesting, requiring, suggesting, urging, warning.
- Ilocucionaris: constitueixen un acte en ells mateixos, es fa quelcom en l’acte d’enunciar ex. “Prometo complir …”. Commissives: agreeing, guaranteeing, inviting, offering, promising, swearing, volunteering. Acknowledgments: apologizing, condoling, congratulating, greeting, thanking, accepting (acknowledging an acknowledgment)
[Conductes de llenguatge]
Quines són les diferents conductes? Quin estímul ha desencadenat un missatge com a resposta (és inútil o no, què passa si no s’emet el missatge, si no diem “bon dia”, per exemple? És suficient la classificació d’Ausin en actes locucionaris (enuncien, ilocucionaris (pretenen un efecte en el receptor), perlocucionaris (són un acte).
- Exclamació, Oral, curt (expressió d’una emoció sorpresa). Est: un fet sobtat, una punxada, una amenaça, una escena bella.
- Salutacions i conversa intranscendent (Resp: reconèixer l’altre com a membre del grup). Est: presència d’un entorn social al barri o la feina.
- Tasca comuna o jeràrquica, preguntes i respostes, explicacions, ordres (consensuar punt de vista i accions sobre el món). Poden anar de converses breus i informals, a informes i presentacions. Afirmacions i descripcions sobre la realitat. Consensuar acció, descriure, preguntar, respondre, avisar, demanar una acció [tots els correu de feina][informes d’auditoria]. Est: necessitat de coordinació o obediència en un entorn de divisió del treball o jeràrquic.
- Diàleg personal, exposar sentiment de tristesa, declaració d’amor, ira. (consensuar, conmoure, convèncer, reconeixement punt de vista sobre les emocions). Convèncer l’interlocutor, ordre, petició o súplica, demostració, engany, mentida, emocionar, commoure estèticament o sentimentalment, interessar i distreure. Est: emocions pròpies que s’han d’expressar i compartir.
- Tertúlies, debats, discurs polític (consensuar o imposar punt de vista sense conseqüències per a una acció), dirigit a interlocutors i espectadors. Est: Existència d’una societat amb punts de vista diferents.
- Assaig, recerca científica (descripció d’un fet, exposició de raonament o punt de vista, exposició d’uns experiments, dades o càlculs) objectiu de compartir i ser reconegut. Est: curiositat, reconeixement per aconseguir fons i fama
- Publicitat (convèncer per que comprin). Est.: Vendre.
- Poesia, cançó (conmoure, agradar, entretenir). Est: necessitat d’expressar d’emocions, desig de reconeixement i vendes.
- Teatre (conmoure, agradar, entretenir). Est: necessitat de presentar una representació del món, amb idees i emocions subjacents, desig de reconeixement i vendes.
- Narrativa (conmoure, agradar, entretenir). Est: necessitat de presentar una ficció, amb idees i emocions subjacents, desig de reconeixement i vendes.
Oració, (súplica o gratitud). Est: Pràctica regular o emoció puntual en un context de creença religiosa. [és un cas molt particular ja que el receptor mai no contesta]. Emmanuel Levinas i Martin Buber han parlat del diàleg amb l’Absolut com una forma radical de trobada jo-Tu, on l’oració és un acte de presència i reconeixement més que no pas una comunicació recíproca clàssica. (altres autors, William Alston i Nicholas Wolterstorff).
(Auden al poema “Victor”: Victor looked up at the sunset / As he stood there all alone; / Cried; ‘Are you in Heaven, Father? ‘/ But the sky said ‘Address not known’.)
La narració interior
Per últim, considerem la narració que ens fem a nosaltres mateixos interiorment, relectint el que passa, o recordant converses, o anticipant situacions futures o diàlegs, o el que hauria volgit dir a una persona. James Joyce, Virginia Woolf, o William Faulkner fan servir una narrativa que reprodueix el pensament intern, a vegades sense filtre lògic ni puntuació clara. En aquest context, sembla que l’autor es parla a si mateix, o els personatges es narren internament.
William James ( Corrent de consciència ) descriure la consciència com un flux continu on el pensament sembla parlar-se a si mateix, no com una veu externa, sinó com una “presència que es nota”. Vygotsky descriu la parla interior com una forma condensada de llenguatge que evoluciona des de la parla externa social; primer parlem amb els altres i després, interioritzem aquest procés, ens desdoblem i comencem a parlar-nos a nosaltres mateixos (com a eina de regulació de la conducta, pensament, planificació). George H. Mead (sociòleg pragmatista), la identitat (“self”) es forma a partir del diàleg social, però després es manté a través d’un diàleg intern; ens desdoblem i ens parlem com si fóssim un altre.
Mikhail Bakhtin introdueix la idea de diàleg intern i polifonia — fins i tot dins d’una sola ment poden conviure veus diferents, no unificades. Paul Ricoeur: a “Temps et récit” proposa que construïm la nostra identitat a través del relat que ens fem de nosaltres mateixos.
La narració serveix per organitzar el pensament (narrar és una manera d’estructurar el món intern [i en particular l’experiència del present, passat, futur i el possible imaginable, amb els temps de verb (L’experiència del temps ]), donar sentit a l’experiència (convertir el flux caòtic de vivències en una història amb coherència), regular la conducta (el llenguatge intern ens ajuda a planificar, decidir, evitar errors), i crear identitat (ens reconeixem a través del relat que fem de nosaltres, “el jo és un relat que s’explica a si mateix” diu Ricoeur). ( El jo, invariants i continuïtat )
Que el jo es constitueix a través de la narració i el llenguatge es veu en el cas dels enfants sauvages que sense llenguatge no constitueixen un jo autobiogràfic, i també amb l’amnèsia infantil durant el lapse de vida en que encara no tenim llenguatge.
[la narrativa interior ens permet mantenir la nostra -fràgil- identitat sense necessitar contínuament un interlocutor, tot i que necessitem el reforç de ser reconegut, d’aquí el risc i l’angoixa de la solitud, la necessitat de ser escoltat, de tenir un públic, “likes” a FB i INSTA. I les teràpies funcionen simplement perquè hi ha algú que ens escolta] .
Semàntica
Introducció
[(WK) Relació entre les paraules i el món. El conjunt de missatges que trobem (Un món que parla) com arriben a transmetre un significat? Els significats, ¿com es relacionen amb les ments dels parlants i com es relacionen amb les coses (el triangle semiòtic de Ogden i Richard) (La distinció de Frege entre sentit, Sinn, informació que aporta el signe, i Bedeutung, l’objecte de la realitat al qual es refereix)? Com es combinen els significats de les paraules per crear els significats de les frases? Si una frase és una afirmació/descripció sobre el món, podem dir si és veritat o mentida? Quin és el paper del context [“no!” només té significat clar dins d’un context].
Inventari de partida
[Un inventari de partida: els lèxics de les 7.000 llengües avui, el diccionari visual, el conjunt de missatges orals i textos (Un món que parla, tenint en compte que una gran part és redundant (Soroll i silenci) ).
Llenguatge, pensament, el problema de la traducció
El que existeix i no anomenen amb prou precisió (a banda, el que existeix i no coneixem, i per tant no té nom, com possibles espècies desconegudes, o abans, les terres que no havíem descobert), per exemple, els colors, els noms de les eines, els vocabularis especialitzats [relativisme lingüístic ].
La dificultat de traduir certes expressions donaria suport al relativisme lingüístic, certes experiències només tindrien expressions en determinats contextos culturals. ( I.A. Richards,Toward a Theory of Translating (1953) [però també n’hi ha d’altres, com Schadenfreude, que existirien a totes les cultures però només tenen una paraula en alemany]. (més avall a Lèxics, recursos sobre paraules intraduïbles).
[Però la impossibilitat de traduir una noció que realment podem concebre, refutaria el relativisme lingüístic fort] en el sentit que només podríem pensar el que podem expressar. D’una banda, en infants i animals tenim evidència de pensament sense llenguatge, en el sentit de tasques cognitives complexes. Persones amb sordesa o que han crescut sense un entorn amb llenguatge poden tenir pensaments complexos. Jerry Fodor va proposar la hipòtesi del llenguatge del pensament, segons la qual pensem en una mena de “llengua mental” (mentalese) que és independent de qualsevol llengua natural. (Verywell Mind, WIRED, The New Yorker). (Veure més avall onomasiologia i els diccionaris inversos).
[Tenim paraules per a tot? En un moment donat, en una societat pot aparèixer un nou objecte o experiència i apareix la necessitat d’anomenar-lo. > Més avall, evolució dels llenguatges. A l’hora d’estudiar la personalitat, Goldberg va formular la hipòtesi lèxica: Si una característica humana és important per a la convivència i les relacions socials, les cultures desenvolupen paraules per descriure-la.
Lèxics
Estudi del significat de les paraules.
Onomasiologia: Es parteix del significat i veure quines paraules l’expressen en una llengua determinada (onomasiologia), el que s’anomena diccionari invers: Flip dictionary, Onelook, Reverse Dictionary, Reversedict.
Semasiologia: partim de les paraules per estudiar el significat. Podem veure relacions de sinonímia o antonímia. Parlem d’hiponímia quan el significat d’un terme està inclòs en el segon, com “formiga” i “insecte” [implica una jerarquia]. Homòfons són paraules que s’escriuen diferent i sonen igual. Meronímia, relació entre la part i el tot. Polisèmia quan una paraula pot tenir diferents significats com “cap” i “pot”.
Formació de mots amb sufixos i prefixos: in-suficient, des-agradable. En alemany es poden crear mots aplegant paraules: “Luftverschmutzung”.
Mots de primer ordre, camps semàntics.
A partir de Frege ja es distingeix entre expressions referencials (noms, descripcions), que tenen un “referent” (Bedeutung) i elements funcionals com connectors lògics o quantificadors, que operen sobre proposicions o termes. Saussure i Chomsky acabaran d’estblir la distinció entre categories lèxiques (noms, verbs, adjectius) i categories funcionals (determinants, conjuncions, auxiliars, pronoms…). //Serien mots de primer ordre els que referencien objectes, accions i propietats (noms, adjectius qualificatius, adverbis, verbs) mentre que els de segon ordre serien referències al context (demostratius, pronoms) i auxiliars (article, preposició, conjunció).
Tot i que el vocabulari i els conceptes associats varien enormement d’un llenguatge a un altre, també és possible determinar universals semàntics: totes les llengües tenen tipus de mots per designar persones, accions, sentiments, coses específiques. [Els mots reflecteixen la realitat. Així en tots els idiomes les paraules que designen els colors divideixen l’espectre continu]. (EB R.511).
En primera aproximació aquests mots funcionarien com etiquetes enganxades a les coses. El mot està format per dues parts, una arrel o semema que recull el significat bàsic i després un morfema que la completa amb la flexió que indica gènere i nombre. Hi ha mots derivats que es formen a partir de l’arrel d’un altre afegint-hi una terminació determinada. Així els adverbis es formen a partir de l’adjectiu + ment. La possibilitat d’adquirir una propietat és nom+able (amable, progamable), l’agent d’una acció és verb+tor (escriptor, constructor), etc. Aquesta aproximació de correspondència un a un entre signe i cosa s’haurà de modificar perquè la intel·ligibilitat ve donada pel context del discurs i de la realitat. La referència, subconjunt de la realitat identificat pel signe, no està unívocament determinat [Més encara si tenim en compte que entre el signe i l’objecte hi ha el concepte]. Això es tracta més avall a la semàntica de frases. Però quedant-nos en aquesta primera aproximació els noms es classificarien en:
noms propis: viu ( humà, animal) / inert
comuns: discret: viu/inert. //Continu: abstracte/no abstracte
L’estructura dels mots es pot agrupar per famílies ideològiques o camps semàntics. Fent servir els dominis del diccionari de Sabater completant amb chatGPT pel que fa a percentatges de vocabulari tenim, per un vocabulari d’unes 20.000 paraules:
- Cosmos, espai, terra (2%, 400): univers, galàxia, planeta, satèl·lit, òrbita, estrella, meteorit, cometa, atmosfera, cosmos
- Accidents geogràfics, meteorologia (3%, 600): muntanya, riu, vall, llac, oceà, pluja, tempesta, vent, boira, erupció
- Natura, animals i plantes (10%, 2.000): arbre, flor, ocell, mamífer, insecte, fulla, llavor, fong, reproducció, ecosistema
- Menjar, aliments, procediments (8%, 1.600): pa, carn, verdures, bullir, fregir, forn, recepta, espècia, oli, sal
- Ésser humà: cos, esperit (15%, 3.000): cap, braç, ull, cor, pensament, emoció, alegria, por, fatiga, memòria
- Nuclis de població, comunicacions (5%, 1.000): ciutat, poble, carretera, tren, autobús, pont, aeroport, taxi, metro, camí
- La casa (4%, 800): cuina, dormitori, sala, bany, porta, finestra, taula, cadira, sofà, llit
- El vestit (3%, 600): camisa, pantalons, sabates, jaqueta, barret, mitjons, faldilla, abric, guants, bufanda
- Societat: família, religió, educació (15%, 3.000): mare, pare, fill, escola, professor, alumne, fe, déu, oració, valors
- Treball: oficis, sectors (10%, 2.000): fuster, pintor, pagès, metge, enginyer, cambrer, advocat, electricista, mecànic, cuiner
- Administració, informació, política (5%, 1.000): document, registre, ajuntament, cens, elecció, parlament, vot, campanya, decret, president
- Economia, comerç, banca (4%, 800): diners, compra, venda, mercat, botiga, factura, banc, préstec, interès, economia
- Arts, espectacles, esports (10%, 2.000): música, pintura, ball, cinema, teatre, futbol, tennis, orquestra, actor, espectacle
- Forces armades, guerra (6%, 1.200): exèrcit, soldat, arma, batalla, estratègia, uniforme, guerra, general, conflicte, fusell
- Quantitatius i numerals.
- Locatius i temporals.
- Mots que ens ajuden a parlar.
[La meva classificació podria ser, segons les àrees del museu:
- Cosmos: Univers, galàxia, estrelles, sistema solar
Terra: litosfera, hidrosfera, atmosfera, biosfera, accidents geogràfics, clima, hàbitats biològics, plantes i animals.
D’això n’hi ha un coneixement intuïtiu o primitiu que es descriurà a les etapes, i un coneixement científic descrit a Matemàtica, Física, Química, Biologia [Hi ha una sèrie de referents que formen part de la nostra vida quotidiana i altres que són models que s’hi relacionen.] - El propi cos, i esperit, també amb els nivells intuïtiu (“tinc gana”) i científic (regulació metabolisme). [El que sentim en primera persona i com ho relacionem amb el cos que observem com a objecte]
- Els altres subjectes amb el jo, l’hàbitat i la cultura. A nivell intuïtiu (“hola papa”) i científic (antropologia i sociologia ).
- Els fets culturals com el llenguatge i els conceptes de les cultures de les societats. Nivell intuïtiu, científic a metateoria, els continguts de les teories de 1 a 3, les creences, religions i filosofia.
Els LLMs poden agrupar paraules per similitud semàntica i obtenir de manera emergent resultats similars als camps semàntics.
Diccionaris (biblioteca: Diccionaris, Dictionary . Les meves paraules)
- Les definicions de les paraules parlaran d’objectes, les seves parts, propietats, i també d’accions. Term.cat
- Evolució de la vida i del llenguatge
La vida evoluciona i amb ella les llengües. Noves paraules van entrant als diccionaris mentre que d’altres queden obsoletes. L’Oxford English Dictionary incorpora entre 500 i 1000 nous termes cada any, com per exemple “mansplaining” (d’un total d’unes 170m). El diccionari de l’Institut d’Estudis Catalans té 92.000 entrades i es va actualitzant en línia, per exemple amb “raclet”. L’etimologia estudia d’on vénen les paraules i com s’han anat transformant. (Etimologies del català, Evolució dels llenguatges , Diccionari Etimològic. Bruguera, Jordi, Coromines). - Freqüència amb què apareix una paraula al llarg del segles, Google
- Recursos de mots intraduïbles: Eunoia.world 700 paraules, 80 idiomes, 60 tags. The Language Nerds, 30 paraules intraduïbles, il·lustrades. The Intrepid Guide – 203 Most Beautiful Untranslatable Words . Brilliant Maps – 18 paraules intraduïbles. Lèxic de termes positius en diferents llengües que són intraduïbles (Lomas online PDF )
- El problema del diccionari [Recordo d’adolescent pensant en adquirir saber a partir d’un diccionari i les seves definicions. Em vaig adonar que hi havia d’haver un mínim de conjunt de paraules que ja no es podien definir en funció d’altres. Per exemple: mobles > objecte > cosa > existir > ésser > existir.
S’han fet estudis per identificar els “primitius semàntics” (Natural Semantic Metalanguage, Anna Wierzbicka. Conjunts mínims de fonamentació (MinSets), Stevan Harnad.). David Bullock https://learnthesewordsfirst.com/tools/tools-for-checking-nsm-min-english.pdf ha observat que el Longman dicionary definxeix 70.000 paraules a partir d’unes 2.000 que cauen en circularitat. Si intentem combinar els enfocaments per trobar les paraules que no es poden definir amb altres i que estarien presents en totes les llengües, venint a ser conceptes bàsics de la ment humana, tenim: - Concreció física i entitats: thing, object, body, person, part, hand, face, place, time, world, air, water, fire, earth
- Accions i processos: do, make, move, go, touch, break, change, become, use, happen, cause, live, die, eat, drink
- Percepció i ment: see, hear, feel, want, know, think, remember, forget, believe, understand, like, love, fear
- Qualitats i estats: good, bad, big, small, hot, cold, full, empty, same, different, true, false
- Relacions i quantitat: some, all, many, one, two, more, less, part, whole, each, every
- Espai i temps: here, there, now, before, after, inside, outside, on, under, near, far
Funcions lògiques i gramaticals: if, not, and, or, because, maybe, must, can, should - Discurs i llenguatge: say, word, name, ask, answer, tell, call, mean, true
- El problema del diccionari [Recordo d’adolescent pensant en adquirir saber a partir d’un diccionari i les seves definicions. Em vaig adonar que hi havia d’haver un mínim de conjunt de paraules que ja no es podien definir en funció d’altres. Per exemple: mobles > objecte > cosa > existir > ésser > existir.
Una llista semblant en català:
- Entitats: cosa, persona, part, cos, lloc, temps
- Quantitat: un, molts, tot, algun
- Qualitat: gran, petit, bo, dolent
- Acció i canvi: fer, passar, anar, moure’s, tenir, canviar
- Percepció: veure, sentir, olorar, gustar, tocar
- Ment i emocions: pensar, saber, voler, no voler, por, desig, sentir (bé/malament)
- Relació social: pare, mare, altre, el mateix
- Existència: hi ha, no, viure, morir
- Parla i llenguatge: dir, paraula, veritat
- Espai i temps: ara, abans, després, aquí, allà, llarg temps, poc temps
- Lògica i connexió: si, perquè, com, potser, semblar
Un altre punt de vista sobre lèxic seria el del desenvolupament, com es passa de 50 paraules als 18 mesos, a les 10.000 als 5 anys.
Semàntica de frases
La semàntica frasal (“phrasal semantics”) estudia com es construeix el significat en frases a partir dels significats de les paraules individuals i l’estructura sintàctica que les combina.
Té una estreta relació amb la sintaxi ja que ha d’identificar els constituents d’una frase: subjecte, predicat, complements, i a partir d’aquí assignar papers com agent, pacient, ubicació, finalitat, etc. [Per exemple, no és el mateix “En Joan pega en Pere” que “En Pere pega en Joan”]. Amb la “Montague grammar”, Richard Montague va fer correspondre a frases de llenguatge natural, proposicions de lògica intensional [pega(Joan, Pere)]. Per a cada estructura sintàctica hi ha una regla semàntica que permet determinar el significat. Aquí se solapa amb la semàntica formal. Són rellevants també Noam Chomsky, Ray Jackendoff, Barbara Partee, Jerry Fodor i Ernest Lepore.
Considera també el context no verbal com l’entonació i els gestos [que poden revelar un sarcasme]. Aquí se solapa amb la pragmàtica.
L’àmbit depassa el de la frase, la influència del context discursiu amb referents com l’anàfora (depèn d’uan frase anterior) o catàfora (es determina després), el que es pressuposa [que és enorme! hi ha un model del món general, el cel, la terra, la ciutat, la gent, i el text només ens afegeix una mica de concreció, com si ens fixéssim en una formiga en particular i observéssim cap on va, quins obstacles esquiva, si troba una molla de pa] i la coherència textual (Veure AI models LLM i coherència narrativa).
[El significat a partir de la composicionalitat: “Un elefant rosa amb ales tocava el clarinet mentre planejava sobre la platja del Bogatell”
La idea que el significat requereix el context també és certa en harmonia; no podem saber el paper d’un acord sense el context. D-7 pot ser la tònica en una peça en D-, o formar part d’un patró II-V-I en una peça en C.]
Semàntica formal
[Veritat o mentida, els malsentesos]
Entendre el significat d’una frase voldria dir poder establir com hauria de ser el món per tal que la frase fos veritat. El que proposa Richard Montague a la seva gramàtica és formular la frase en termes de proposicions lògiques en la línia de Frege i Tarski. Aleshores, per composicionalitat forta, la veritat de la frase es pot determinar a partir de la dels seus elements. [Per exemple, “Joan fuma” serà veritat si existeix Joan i si fuma.] Va tenir influència en els treball de NLP (Natural language processing). En ignorar el context no pot donar raó de msisatges que recorren a la ironia o la metàfora.
Llenguatges
Prolog és una l’opció òptima per a regles simples. Python (amb biblioteques) ofereix més possibilitats d’integració. En entorns acadèmics, Haskell, o Lambda-prolog surporten lògica més avançada.
Hi ha ontologies representades com a “fets, regles i relacions lògiques” que poden ser útils per a tasques de raonament automàtic, sistemes experts o integració amb semàntica formal. Exemples: WordNet pel lèxic anglès, SUMO (Suggested Upper Merged Ontology) que cobreix conceptes universals (temps, espai, objectes físics, etc.), dominis específics com BioProlog (Biologia i Medicina) o Geoinformació (GeoNames). Hi ha eines per carregar ontologies externes, RDF/OWL a Prolog, SPARQL és un llenguatge que permet interrogar bases de dades semàntiques com DBpedia o Wikidata, des de Prolog. OpenCyc és una versió lliure de l’ontologia Cyc (ampli cobertura), amb exportació a Prolog. CLOnE (Common Logic Ontology Environment és un entorn per dissenyar ontologies en lògica de primer ordre, exportables a Prolog.
Kripke
La teoria descriptiva de la referència (Frege/Russell) diria que un nom com “Aristòtil” pot tenir significats com “l’autor de l’Ètica a Nicòmac”, o “el mestre d’Alexandre” i designar una [realitat].
Saul Kripke a “Naming and Necessity” (1970s) introdueix la noció d’altres móns possibles i de designador rígid. Per exemple, hi podria have run món on Aristòtil no hagués ensenyat Alexandre. Però “Aristòtil” seguiria apuntant a la mateixa persona, no a algú altre. [és la mateixa si és un món diferent?]. També l’exemple de l’estel del matí i del vespre (Hesperus=Bosphorus), que suposa dues descripcions difernts però que a posteriori descobrirem que tenen el mateix referent. Per Kripke un només un designador rígid i fa referència al mateix objecte en tots els móns possibles on aquest objecte existeix. Hi ha un “baptisme” inicial que connecta el nom amb l’objecte [com l’estel del matí i el vespre]. Una veritat com 2+2=4 és necessària si és veritat en tots els móns possibles. En canvi “Potser, jo podria haver estat professor d’universitat” implicaria, segons Kripke, que existeix algun món possible on “jo” (la mateixa persona) vaig fer ser professor d’universitat. ( Vides fictícies alternatives , The road not taken).
semàntica formalprolog cyc? ontologies?
Semàntica cognitiva
Vol entendre la relació entre el significat i la nostra experiència. Té relació amb la psicologia i les ciències cognitives. Així, el treball de Lakoff i Johnson mostra que tenim unes experiències bàsiques, de moviment en l’espai, de construir, i que mitjançant metàfores traslladem a altres dominis. (Altres autors, Langacker, Jackendoff).
Recursos literaris, retòrica metàfores
Hermenèutica
[On acaba la semàntica, estudiant el significat de paraules i frases, començaria l’hermenèutica, amb la interpretació de textos.
Morfologia i Sintaxi
Introducció
[el llenguatge és estructural, no hi ha un signe per a cada significació possible, sinó que un reduït grup de fonemes dóna lloc a tots els mots, i un conjunt finit de mots pot generar infinites frases. El lexema dóna el significat bàsic i és flexionat en nombre i gènere (els verbs en temps, persona i número). Els mots es combinen en frases seguint unes normes estructurals. Chomsky >> ja va fer notar que els humans no hauríem pogut adquirir aquesta capacitat simplement per exposició a estímuls, sinó que hi ha unes regles. Alhora, els models de Procés Distribuït en Paral·lel ( Ciències cognitives i Xarxes neuronals ) expliquen com una xarxa poc actuar com si estigués aplicant una regla encara que no la tingués definida explícitament.
Fonologia
L’alfabet fonètic internacional identifica 28 vocals, 85 consonants pulmonars i 11 no pulmonars. El món amb les seves llengües s’expressa (La veu humana: Fonemes i síl·labes ) amb unes 20.000 síl·labes diferents. (El català té 35 fonemes i unes 4.000 síl·labes.) Tot output fonològic és combinació d’un petit nombre d’elements fonètics universals, de l’ordre de la vintena (EB R.511), tal com ja va assenyalar Jakobson. Els fonemes són representats gràficament per grafemes. Cada llengua té la seva pròpia transcripció i regles, és a dir, l’ortografia.
Morfologia
[Fonema: mínima unitat sonora identificable, síl·laba: mínima unitat que es pronuncia amb un sol impuls d’aire]. El mot és la unitat mínima de significació, la qual cosa vol dir que hi ha una correspondència semàntica entre mot-idea, cosa. Aquesta és directa en els anomenats mots de primer ordre: noms, verbs, adjectius, adverbis. Estan agrupats en famílies de significat que tenen una arrel o lexema fix i una desinència o morfema que varia, que està sotmesa a flexió [sembla lògic fer servir un mot semblant per “arbre” singular que per plural, o per “escriptor” i “escriptura”]. Les variacions de noms i adjectius són de nombre i gènere [Això vol dir que el paper dels sers vius en el món, és tant important com per estendre les categories sexuals masculí i femení a tot el discurs]. Els verbs recullen en la flexió la situació del referit respecte del discurs: persones gramaticals jo, tu, ell i temps: conjugació. Un altre mena de flexió és la derivació de paraules formant famílies on hi ha l’acció, l’agent, l’obra, etc: “construir”, “constructor”, “construcció”, tenint cada una d’aquestes categories una desinència pròpia. En alguns idiomes com l’alemany o el llatí els mots de primer ordre d’objecte i qualitat tenen una flexió segons el paper sintàctic en l’oració.
Els mots de segon ordre:
- [situen, amb els articles i adjectius demostratius )
- enllacen elements amb preposicions [que és com una conjugació ampliada, “anar a casa”, “anar a la feina”, “el gos d’en Pere”, “el gos d’en Pau].
- Pronoms que refereixen a altres parts del discurs o elements implícits
- Conjuncions que connecten oracions.
Oracions
[Una oració és bàsicament “dir alguna cosa sobre quelcom”, “En Pau camina”, P=camina, a=Pau, P(a). Mentre que en lògica a variables i predicats només s’hi afegeixen juntors i quantificadors, en sintaxi hi ha més tipus d’estructura:
- subjecte + predicat nominal: verb copulatiu + predicat nominal (“En pau és alt”)
- subjecte + predicat verbal: verb + complement predicatiu / preposicional / directe / cirumstancial / indirecte
[El subjecte o sintagma nominal, és bàsicament un nom que es pot complicar afegint-hi adjectius, complements del nom (prep+nom) i oracions subordinades. (“l’home/alt/que era allà”)]
[El mateix passa amb els elements del predicat.(“corre/ cap allà/cap on li havien dit que era més segur).]
[I després les oracions es poden composar per conjunció, disjunció, relació adversativa (X però Y), causal (X per;què Y) i presentar recursivitat quan substituiïm alguns dels sintagmes per frases subordinades.]
Potser les complicacions dels sintagmes (regles de ramificació) es poden pensar com una flexió externa, externa en el sentit que els morfemes estan separats del mot. No existeixen els verbs “menjar_pomes”, “menjar_carn” així que combinem “menjar”+”objecte menjable”. Així explicaríem el predicat nominal (“ser_alt”, “ser_bonic”), el complement predicatiu (“camino_ràpid”, “camino_alegre”) i el preposicional d’objecte (“dedicar-se_a_la_música”, “dedicar-se_a_jeure”) i tots els altres.]
L’existència de categories sintàctiques fixes tals com nom i verb, també sembla ser un tret comú a tots els llenguatges (EB R.511).
Chomsky ha proposat les regles de: ramificació (estructura en arbre recursiva), subcategorització [implicacions de la semàntica sobre l’estructura], lexicon (omplint les “caselles” de l’arbre amb el mot) i després aplicant transformacions com per exemple, la forma passiva:
- Regles de Ramificació
La descomposició de l’oració en els seus elements té una estructura d’arbre on cada element es pot dividir segons l’aplicació d’una regla (ex. ‘Sintagma Nominal’ → article + nom). Així tindríem, per exemple:
Un cop l’oració s’ha ramificat fins arribar a elements, aquests serien substituïts pels mots concrets, rebrien una interpretació semàntica (lexicon). Hi ha però unes regles prèvies per evitar cassos com “La cadira menjà soroll”, “Golf juga Maria”. - Regles de subcategorització i selecció
Aquestes regles recullen restriccions d’ordre semàntic sobre la natura dels noms i l’estructura dels verbs. [L’estructura proposada per Chomsky es podria seguir fins a especificar menjable, pensable i tota mena de categories]: - Comptable: animat (humà/ no humà) / inanimat
- Mesurable: abstracte (“justícia”) / no abstracte (“llibre”)
En els verbs s’indicarà si són transitius/intransitius [ (V, +FN) transitiu, (V, #) intransitiu en la notació de Chomsky)], amb complement predicatiu (camino tranquil·lament), complement circumstancial de lloc o temps, si tenen subjecte abstracte o no, o bé si el complement directe és animat o no. Aquestes dues darreres s’anomenen regles de selecció.
- Lexicon
El lexicon assigna a l’element terminal de la cadena analitzada per les regles de ramificació un mot, és a dir, uns sons o grafia concrets sotmesos a les regles de subcategorització. Així l’oració “La Teresa menja peres” s’obté fent:
1. S → SN + SV
SN → Det + N
SV → V + SN
SN → N
Det → La
2. N → propi, animat, humà
V → transitiu, subjecte animat, objecte menjable
N → comú, comptable, no animat, menjable
3. N → (Teresa, [pah])
V → (menja, [t sa om])
N → (peres, [ccnm])
Aquesta és l’estructura profunda de l’oració.
[Aquestes regles haurien de recollir també la concordança de gènere i nombre entre nom, verb i adjectius. Aquestes restriccions de coherència es poden extendre més enllà de la frase. Plett assenyala la coherència entre frases al llarg del text pel que fa a mots substitutius, és a dir els pronoms (mots de segon ordre):
“En Jordi va sortir de casa”. Després [ ell ] va agafar l’autobús]. Es parla de tema, anàfora o substituens (Jordi) i de rhema, catàfora o substituendum (ell).
- Transformacions
A partir d’aquesta estructura en podem obtenir d’altres per aplicació de transformacions. Per exemple les oracions amb verb transitiu i complement directe (S V CD) es poden transformar en passives fent T(S V CD)=(CD Vpas per S).
Aquestes estructures, bàsiques o transformades, reben finalment una assignació fonètica [que forma part del lexicon?]. Aquí es concreta la conjugació dels verbs i la flexió dels mots. Aquesta és l’estructura superficial.
Notem que una estructura profunda pot tenir-ne diverses de superficials (divergència) com és el cas de “Teresa menja pomes”, “Les pomes són menjades per ella”, i a l’inrevés (convergència) com “Carles mira l’aigua corrent” [qui corre, en Carles o l’aigua? això era clar a l’estructura profunda i ara s’ha de determinar pel context].
[Dubtes]
[Chomsky estudia les regles que s’apliquen per generar totes les frases intel·ligibles d’una gramàtica, regles que serien descobertes per l’infant i usades per entendre i expressar-se. Però òbviament aquest procés no és conscient ni segueix aquests passos. Com dèiem al començament, donada una situació i unes necessitats comunicatives, l’estructura de la representació forneix el nucli bàsic que és el subjecte i el predicat. Aleshores cal buscar al diccionari (C2520 semàntica) els termes adients i completar-los amb la flexió externa, és a dir, l’addició de complements i qualificatius mitjantçant regles de ramificació i subcategorització i arribar a la flexió morfofonèmica final.
La idea bàsica de Chomsky, molt fidel a la lògica, és que hi ha un esquelet sintàctic que rep una interpretació semàntica (relació amb el concepte) per donar l’estructura profunda, i una interpretació fonèmica que dóna l’estructura superficial (relació amb el signe).
[Aquest plantejament té la gran mancança que comença amb un esquelet buit que després s’omple de contingut semàntic, quan justament és el contingut semàntic el que determina l’estructura de l’esquelet. ]
[Igual que les formes i categories de Kant, si entenem l’experiència a través del llenguatge. No n’hi ha prou amb una llista d’etiquetes, “capsa”, “Jordi”, “tassa”. Construïm significat de manera composicional per economia, “capsa blanca”, “capsa verda” i perquè els ens de l’univers canvien, no n’hi ha prou amb dir “Jordi”, pot ser “En Jordi seu”, “En Jordi corre” ). A PDP 19 “Mechanisms of sentence processing: assigning roles to constituents of sentences” es presenta un model que explica cóm assignem estructura a una frase donada. D’una banda tenim unes frases tipus (“home menja aliment”, “animal es mou” p.290), unes categories d’objectes (home, animal, objecte, eina) als quals es poden assignar diferents valors d’un alfabet (Pere, pau, ratolí, martell) amb unes certes microcaracterístiques (microfeatures). Un cop tenim la frase amb elements de l’alfabet, l’entrenament de la xarxa permet veure que “cadira trenca home” té una estructura c.directe + verb + subjecte (i no S + V + CD). Això vol dir que sap assignar l’estructura correcta fent servir el context semàntic.]
Els signes de puntuació
Història. Van néixer com a eines per a la lectura en veu alta (per indicar pauses, entonació) i després van evolucionar cap a marcar estructures gramaticals i significat. A l’antiguitat clàssica els textos grecs i llatins escrivien en “scriptio continua” (sense espais ni signes). En Aristòfil de Bizanci, s. III aC es comença a trobar el punt. A l’Edat Mitjana els copistes medievals van desenvolupar signes com la coma (del grec “komma”, “tall”) i el punt i coma (en alemany la coma té un ús rigorós en subordinades). El punt interrogatiu va aparèixer al llatí medieval (s. VIII) com a “punctus interrogativus”. Amb la impremta (s. XV), els signes es van estandarditzar. Els dos punts i els parèntesis van popularitzar-se en textos acadèmics. Els signes d’exclamació (!) i interrogació (?) van quedar fixats en llengües com el castellà (on encara s’obren i es tanquen.(¿¡). Els parèntesis i claudats apareixen per fer aclariments. En el món anglosaxó es va introduir la “coma Oxford”, recomanada per la Oxford University Press, per clarificar llistes: “Van anar arribant en Joan, en Pere, i en Pau”, “Van anar arribant en Joan, en Pere i en Pau”.
Pragmàtics (transmeten actitud, intenció, però no canviant el significat literal). Exclamació (!): “Vine aquí!” (ordre urgent) vs. “Vine aquí.” (neutra). Interrogació (?): “Has dinat?” (pregunta) vs. “Has dinat.” (afirmació).Punts suspensius (…) : “Vaig veure alguna cosa…” (suggereix misteri).
Semàntics (alteren el significat de l’oració): Coma: “Vull menjar, Maria” (parlo a Maria) vs. “Vull menjar Maria” (canibalisme). “No, vull fer-ho” (negació) vs. “No vull fer-ho” (sense coma, més neutre).
Ortotipografia. Manual de l’autor, l’autoeditor ... PUJOL, JOSEP M., SOLÂ, JOAN. Història dels signes de puntuació (AEON). Identificar un autor per com fa servir els signes de puntuació (Mental Floss)(Socarxiv)
Interjeccions (Knowable magazine) i el seu paper en el flux de la comunicació
Discussió
[El procés de comunicació amb el llenguatge consisteix a codificar un missatge, emetre’l, recepció i decodificació. Però què hi ha abans que comenci la morfologia i la sintaxi? Què determina que emetem un missatge i no un altre? o enviar un missatge en lloc de callar? Què vull dir? Això no ho he vist explicat (199x) . A pragmàtica he intentat un esborrany dels diferents tipus de missatge dins de pautes de conducta. En el cas dels LLM el que desencadena el missatge és el prompt (2025).
1. Hi ha una situació identificada perceptivament. El subjecte quedarà indiferent o respondrà amb una pauta de conducta. Què fa que aquesta pauta de conducta sigui l’emissió d’un missatge?
2. Necessitat comunicativa. A l’entorn hi ha d’haver un altre subjecte. La pragmàtica pot consistir en avisar (coordinació del treball), interrogar, expressar una emoció, explicar-se (reconeixement de l’altre, aparèixer com a graciós, intel·ligent, important), saludar, etc. (la necessitat comunicativa determinarà l’elecció del missatge. Cada situació pot donar lloc a molts missatges diferents segons el context comunicatiu (Podria descriure l’ordre de les tecles del teclat, explicar que estic estudiant una cosa molt espessa, cridar les nenes que callin, dir que estic cansat). Hi haurà cassos en que el missatge serà molt habitual i la resposta (elecció del missatge) serà gairebé automàtica, “hola que tal, cóm esteu?”. Hi pot haver nivells molt més complexos com fer un discurs, escriure un novel.la, recitar una poesia.
3. Assignació d’elements. Un cop determinat la mena de missatge, o la part de la representació del món (interna o externa, “fa sol”, “estic cansat”), que volem comunicar, es trien els elements i l’estructura sintàctica corresponent. Aquest és el pas on es barregen les tres primeres regles de Chomsky (ramificació i estructura, subcategorització i selecció, i lexicon). El fet que sembla que hagin de tenir lloc les tres alhora reforça que es facin a nivell subsimbòlic. La part implicada del cervell és el lòbul frontal on hi ha una àrea responsable de la formació i emissió de frases. Aquesta part, el neocórtex, aparegué tard evolutivament.
4. Dicció o escriptura. La frase rep l’assignació fonètica i gràfica corresponent. És interessant remarcar que la intenció comunicativa també juga un paper aquí, doncs determinarà la corba melòdica de la frase.
5. Emissió del missatge. Hi ha una expectativa pel que fa a la seva recepció (esperem que ens corresponguin una salutació, que escoltin atentament una explicació)
6. Decodificació del missatge. (Veure els models presentats a PDP 15 “Interactive processes in speech perception, the TRACE model” pel que fa a la descomposició de la frase en fonemes i la integració en paraules. La part del cervell implicada és el lòbul temporal on hi ha una part de percepció acústica (sordesa cortical) i una altra de reconeixement de fonemes (sordesa psíquica) que deu correspondre als nodes de la xarxa del model TRACE. Si desapareix aquesta part, tenim l’input de fonemes però perdem les sinapsis que suporten els pesos corresponents als patrons que permeten identificar els mots. Recordem que les àrees de fonemes i de música són diferents. 16 “The programmable blackboard model of reading” pel que fa al procés que va de la percepció visual fins arribar als mots. La part del cervell implicada és el lòbul occipital amb àrees de percepció visual (ceguesa cortical) i àrees de reconeixement de patrons (ceguesa psíquica). Seguirà la interpretació sintàctico semàntica (19)
7. Comprensió. El receptor té la representació del món més el missatge rebut. Aquesta és ja una dada simbòlica. Té un paper similar al de la imaginació, evoca quelcom no percebut directament. Cal suposar que els mots i la frase activen els patrons perceptius semàntics corresponents. La informació extra que rep pot ser sobre quelcom totalment aliè a la situació actual. Aquesta és una de les característiques més potents del llenguatge.
8. Representació simbòlica. Per a subjectes ja habituats a l’emissió de missatges deu ser inevitable anar generant frases internament [autonarració], encara que no hi hagi interlocutor. Quan la representació del món s’ha fet tan complexa que ja descansa més en continguts simbòlics que no pas en representacions perceptives, tota dada deu ser més o menys traduïda a frases. Quina part de la nostra memòria, de la nostra representació del món, de la nostra història és perceptiva i quina part és simbòlica, és a dir, conjunts de sentències? No arriba un moment en que quan ens empipem, per exemple, a més de l’alteració somàtica emocional, ho acompanyem d’un “me cago’n cony!”?
Aquí comença l’herència cultural.
[notes 199x]
NOTES per un museu
- Un món que parla, escolta, escriu i llegeix: les converses, els recitals, els llibres, la ràdio i televisió, les xarxes
- Pragmàtica i Discussió: Conductes de llenguatge: Per què parlem en lloc de callar? Què volem fer amb el llenguatge? Escenes de teatre per actes pragmàtics [converses, respostes verbals a les emocions, creació literària]
- origen i evolució: hipòtesi d’origen del llenguatge Evolució, Babel i arbre fins arribar a les 7159 llengües actuals.
- Desenvolupament, l’adquisició del llenguatge en els humans
- Semiòtica: El triangle semiòtic (pensament (significat), signe(significant), referent), model SMCR: Source (Emissor) – Message (Missatge) – Channel (Canal) – Receiver (Receptor).
- Teories: Quines preguntes podem fer sobre el llenguatge? Com etiquetem el món? quin és el lèxic mínim per sobreviure? Com generem infinits significats, amb un grup reduït de signes? Com han evolucionat les llengües? Què volem/podem fer amb el llenguatge? Com influeix el llenguatge el que pensem? Podem automatitzar la comprensió del llenguatge?
- fonemes i grafemes: la veu humana (àudio de síl·labes, la veu des del nadó fins al vell). Sistemes d’escriptura , lletres en diferents alfabets (enllaç), scrabble
- Semàntica 1: diccionaris, etimologies, els vocabularis de la humanitat remuntant-nos al primer gruny. Tenim paraules per a tot? : mots intraduïbles en diferents idiomes, noves paraules als diccionaris, evolució de la vida i els mots. Paraules de primer ordre: els principals camps semàntics. Circularitat als diccionaris, els 2000 mots bàsics. Paraules de segon ordre: articles, adjectius demostratius, pronoms, preposicions, conjuncions.
- Semàntica 2. frases paraules en imants per formar frases, composicionalitat: “Un elefant rosa amb ales tocava el clarinet mentre planejava sobre la platja del Bogatell”(elefant rosa amb ales). Traducció lògica de sintagmes.
- Semàntica 3. Semàntica cognitiva, pensar en metàfores (Lakoff i Johnson) Recursos literaris, retòrica metàfores. Hermenèutica i crítica literària, interpretació de textos.
- Morfosintaxi Les ramificacions, de la frase més simple a les més complexes, primer amb subordinades, i després amb les de coordinació (gramàtica catalana, Sintaxi), Anàlisi de paràgrafs llargs Hegel, un autor català, Javier Marías. Gramàtica generativa de Chomsky, regles i transformacions.
