Evolució dels llenguatges

Lingüística

Orígens del llenguatge   Arbre de famílies    Indoeuropeu    Romàniques   Etimologia   Llengües avui     Babel


Origen del llenguatge

[notes 199x]
L’origen del llenguatge és situat en els neandertals tardans (2PPW0.P1, -30000) encara que en l’homo habilis (B6945.1922242) de fa dos milions d’anys ja s’aprecia la capacitat biològica d’emetre sons.
Pel que fa a l’origen del llenguatge només podem fer especulacions (2PPW0.P1). Les espècies que es van anar succeïnt (Homínids: Austrolopitecus 4M-1M, Homo habilis 2M-1.6M, Arcantropins (BM910) com l’homo erectus 1.6M-150000, Paleoantropins (BM920) com els neandertals -400.000 al -40000 i neoantropins a partir del -250.000), es van tarspassar les adquisicions lingüístiques, o bé cada una va desenvolupar un llenguatge independent?.
L’espècie de l’home modern original de l’Africa, va extendre un llenguatge únic? Si acceptem això, voldrà dir que després de la colonització durant el darrer període glaciar, llenguatge i sovint també cultura, es van anar segregant i diferenciant per aïllament geogràfic. Resulta doncs que l’evolució cultural segueix mecanismes semblants a la biològica (B3230).
[DS 2025]
Hi ha diferents hipòtesis per explicar l’aparició del llenguatge en l’home. D’una banda hi ha la necessitat de coordinar accions del grup, com la caça o rituals (Tomasello, Dunbar, Merlin Donald). S’ha detectat una mutació d’un gen (FOXP2) relacionat amb el control dels músculs facials i la capacitat lingüística fa uns 200.000 anys, coincidint amb l’aparició de “Homo sapiens”. Hi ha un descens de la laringe que permet produir sons més variats. S’especula que el llenguatge hauria evolucionat a partir dels gestos, abans que de sons (com en els primats, que tenen més capacitat de comunicació gestual que vocal (Michael Corballis).[és a dir que inicialment designem el que està present]. Encara que hi hagués homínids a tot el món, com els neandertals es creu que el llenguatge simbòlic seria propi de l'”homo sapiens” i es va estendre des de l’Àfrica. (Prehistòria: La revolució cognitiva  ).
Pot semblar que abans del llenguatge hi ha d’haver alguna mena de pensament. Aquest punt de vista ha estat suportat per racionalistes com Descartes i més tard psicòlegs com Piaget. Sembla que els humans, els infants i alguns animals com els grans simis, dofins, o corbs) mostren formes limitades de pensament sense llenguatge complex. Però alhora és evident que el pensament és estructurat pel llenguatge (Vigotsky, Chomsby, Sapir-Whorf), possiblement van evolucionar alhora (Bickerton, Tomasello).
Chomsky defensa que el llenguatge va aparèixer de sobte, per una mutació genètica, fa uns 70m anys, mentre que d’altres com Steven Pinker, creu que va anar evolucionant gradualment. Ara sabem que la variant del gen FOXP2 apareguda fa uns 200m anys, relacionat amb la capacitat lingüística, presenta mutacions clau en els humans moderns. L’art rupestre (70m anys) indica l’aparició de la funció simbòlica. Els homínids com l’Australopitecs i Homo habilis no tenien una posició baixa de la larinx ni un os hioide ben desenvolupat, factoirs necessaris per emetre fonemes d’un mínim de complexitat. L’Homo neanderthalensis presnetava possibilitats més limitades.
Design features of Language
Charles F. Hockett va proposar una llista de 16 trets definitoris del llenguatge humà (“Design Features of Language”).
Trets compartits amb animals:
1. Vocal-auditory channel → Ús de sons (com els ocells o els simis).
2. Broadcast transmission / directional reception → El so es difon en totes direccions, però es percep en una direcció (com el crit d’un gibó).
3. Rapid fading → Els sons desapareixen ràpid (a diferència de les feromones dels insectes).
4. Interchangeability → Un individu pot produir i rebre els mateixos missatges (ex: gossos que tant grunyixen com escolten grunyits).
5. Total feedback → L’emissor sent el seu propi missatge (com un lloro que s’escolta).
6. Specialization → Els sons són exclusivament per a comunicar-se (no com la tos, que té una funció biològica).
Trets exclusius (o gairebé) dels humans:
7. Arbitrariness → No hi ha relació natural entre el símbol (paraula) i el seu significat (ex: la paraula “arbre” no s’assembla a un arbre). Alguns animals tenen certa arbitrarietat (ex: abelles), però molt limitada.
8. Discreteness → Les unitats lingüístiques (com fonemes) es combinen per crear significats nous (ex: /p/ + /a/ = “pa”).
9. Displacement → Parla de coses que no són presents (passat, futur, hipotètics). Els animals sols comuniquen sobre el aquí i ara (excepte les abelles, que indiquen fonts de menjar llunyanes).
10. Productivity → Capacitat de crear infinitats de missatges nous (gramàtica recursiva). Un ximpanzé no pot inventar frases com “Ahir vaig somiar que tu em deies que…”. [recursivitat Chomsky]
11. Duality of patterning → Nivells dobles: sons sense significat (fonemes) es combinen per formar paraules amb significat. Els animals solen tenir unitats amb significat únic (ex: un crit d’alarma).
12. Traditional transmission → El llenguatge s’aprèn culturalment (no és instintiu com el cant dels ocells).
13. Prevarication → Parla de coses falses o fictícies (mentides, literatura).
[199x
Diverses teories especulen sobre l’origen del llenguatge i els primers mots apuntant a la imitació dels sons, interjeccions expressives i altres conjectures. El tema fou tractat per Plató al Cràtil. Un cop establert un vocabulari inicial, aniran apareixent noves paraules a mesura que hi ha nous objectes a designar. L’escissió en diferents comunitats farà que les paraules vagin evolucionant de manera diferent i donin lloc a diferents idiomes.
Mecanismes d’evolució de les llengües  [notes 199x]
 [Evolucionen per comoditat fonètica i gràfica la fonologia i morfologia dels mots. L’etimologia estudia els canvis i herències semàntiques dels mots. De fet els canvis de llengua són un mirall dels canvis de cultura. Les llengües mediterrànies reflexen l’expansió de l’imperi romà i herència de la cultura llatina. Expansió i aïllament en comunitats lingüístiques presenten fortes analogies amb l’evolució de les espècies i la distribució de poblacions. Nous mots apareixen per etiquetar nous objectes i noves formes de vida. Un altre factor vindrà donat per l’ús de la comunitat lingüística, és a dir, si predomina la tradició oral, si hi ha un sistema educatiu i unes tecnologies (impremta) que permeten un accés a la cultura escrita, o bé si es tracta d’una cultura amb predomini de la imatge i suport informàtic de les dades on el discurs escrit ja no és tan imprescindible.
Una lingüística perfecte podria traçar l’aparició de cada mot, ja sia en cultures remotes (protoindoeuropeu), ja sia en la seva introducció en cultures recents (yuppie) i les seves variacions i filiacions semàntiques (electró -> electron o àmbar en grec) i fonològiques (filius -> fill, hijo).
Cavalli-Sforza ha traçat un mapa on sitúa famílies de races i llengües, on cada una de les sis àrees seria el resultat de l’evolució aïllada d’una migració original (R411, 4 ser) (2N000):
L’africà (C2561) resulta de l’aïllament pel desert del Sahara.
L’australià (C2562) pel cobriment del pont de terra amb el continent.
L’amerindi (C2563) pel mateix motiu.
El Nostratic evolucionà dividint-se en l’anatoli (C2564), Ari – grec – armeni (C2565), el cèltic itàlic d’on vindrien les llengües romàniques (C2567), el cèltic galo britànic (C2568), el balto eslau (C2568) i el germànic (C2569). Cobriria la major part d’Eurasia G4, amb el Nord d’Africa (G51, G52), i l’extrem nord d’Amèrica (G81 i G82).
L’Austric seria la zona del sudest asiàtic (G411 G412 G418), els idiomes vietnamites i indonesis, juntament amb nova zelanda. Aquí no es veu un aïllament geogràfic clar. Les dues comunitats deurien coexistir sense barreja.

El mateix podríem dir del Dene-Caucasià, que s’hauria parlat als dos extrems del’estret de Bering, i que ara queda en zones de cabadà (esquimal), el país basc, i xina (mandarí?).


Arbre de famílies

[ faig una síntesi de l’arbre de Cavalli Sforza, l’agrupació de famílies de llenguatge i esquemes de classificació en arbre]

[ Les grans separacions Àfrica, Est (Xina i Austràlia), Oest (Euràsia i Amerindi) haurien tingut lloc abans del final de l’era glacial 20000 anys enrere?]


L’indoeuropeu

All Indo-European languages are descended from a single prehistoric language, reconstructed as Proto-Indo-European, spoken sometime in the Neolithic era. Its precise geographical location, the Indo-European urheimat, is unknown and has been the object of many competing hypotheses; the most widely accepted is the Kurgan hypothesis, which posits the urheimat to be the Pontic–Caspian steppe, associated with the Yamnaya culture around 3000 BC. By the time the first written records appeared, Indo-European had already evolved into numerous languages spoken across much of Europe and south-west Asia.

[A partir d’aquí  amb les migracions tenim com a hipòtesi:] [ attestation: prova ]

  • Centre
    • Pre-Anatolian (4200 BC), Hitita, extingit cap el 1500
    • Pre-Armenian (2800 BC)
    • Pre-Greek (2500 BC)
  • Oest
    • Pre-Germanic (3300 BC)
    • Pre-Italic and Pre-Celtic (3000 BC)
    • Pre-Balto-Slavic (2800 BC)
  • Est
    • Proto-Indo-Iranian (2200 BC); split between Iranian and Old Indic 1800 BC
    • Pre-Tocharian (3700 BC) zona del NW de Xina, documents escrits, extingit

1500 a 1000 BC

1000-500BC

500 BC – 1 BC/AD:

1 BC – AD 500 Late Antiquity:

500–1000: Early Middle Ages.

1000–1500: Late Middle Ages: Attestation of Albanian and Baltic. El primer document escrit en català és de 1105, el Memorial de greuges de Guitard Isarn, senyor de Caboet, escrit per Ramón de Cabó.

1500–2000: Early Modern period to present: Colonialism results in the spread of Indo-European languages to every continent, most notably Romance (North, Central and South America, North and Sub-Saharan Africa, West Asia), West Germanic (English in North America, Sub-Saharan Africa, East Asia and Australia; to a lesser extent Dutch and German), and Russian to Central Asia and North Asia.


Les  llengües romàniques:

L’evolució del llatí vulgar cap a les llengües romàniques es data grosso modo de la manera següent:

Entre el 200 aC i 400 dC aproximadament: diferents formes de llatí vulgar. (pèrdua de la declinació que és substituïda per preposicions).
Entre 500 i 600: aquestes formes comencen a distingir-se entre si.
A partir de 800: es reconeix l’existència de les llengües romàniques.

Està poc documentada perquè fins al s11 no hi comença a haver documents escrits.


[l’arbre no reflecteix el que el català occità ve directament del llatí i no és una branca ni del iberoromanç ni del francès]


Etimologia

Estudi de la història dels mots [que és també una mica la història de l’evolució de les llengües. Tenim paraules:

  • patrimonials, paraules que han evolucionat fonèticament i semàntica des dels orígens de l’idioma (en català, serien els mots que van evolucionar des del llatí fins a l’actualitat) [ex. Ballar, del llatí ballare.]
  • manlleus: són paraules agafades d’altres llengües, que poden adaptar-se o no a la normativa i poden esdevenir patrimonials amb el pas del temps. Si una paraula és un manlleu d’una llengua morta o avantpassada de l’idioma en qüestió, s’anomena cultisme i, si barreja arrels de dues llengües diferents (per exemple, del llatí i el grec), cultisme híbrid. [ex. “futbol”, “raclet”]
  • neologismes: creacions de noves paraules. [“criptogínia”, incorporada el 2024]

(Algunes etimologies en català)

[igual que en l’exposició dels avantpassats, podem imaginar la història de cada mot, el diccionari etimològic que ens remunta a quan apareix per primer cop en un text, el salt a la llengua precedent, el llatí, per exemple, després ens remuntem potser al primer grup d’humans que arribaven a Europa procedents de l’Àfrica amb un vocabulari de x paraules, fins potser al moment inicial en què un humà assenyala amb un gruny una presa de caça.]


Llenguatges avui

El 2025 l’Etnologue  llista 7159 llengües.

(DS) Les famílies, per ordre de parlants i nombre de llengües són:

Indoeuropea 3.200M parlants (~450 llengües): Anglès, Hindi, espanyol i resta romàniques, rus, alemany
Sino-tibetana 1.400M (~455 llengües): Xinès mandarí, birmà, tibetà
Níger-Congo 700M (~1.400 llengües): swahili, yoruba, igbo, shona
Afroasiàtica 500M (~375 llengües): àrab, amharic, hebreu
Austronèsia 325M (~1.200 llengües): tagalog (Filipines), javanès, malai i maori.
Dravídica 250M (~80 llengües): Tàmil, telugu i kannada (sud de l’Índia).
Altaica 180M (*controvertida*, ~60 llengües): Turc, Kazakh, mongol
Japònica 120M (15 llengües): Japonès, Ryukyu
Austroasiàtica 120M (~160 llengües): Vietnamita, Khmer
Tai-kadai 90M (~90 llengües): Tai (Tailàndia) i laosià.
Coreànica 80M (2 llengües): Coreà, jeju
Uralica 25M (~35 llengües): Hongarès, finès, estonès
Trans-neoguineana 3M (~480 llengües): Papua Nova Guinea

[ el que es parla avui a les grans zones culturals del món ] Language diversity. The language family of the world that has the most speakers is the Indo-European languages, spoken by 46% of the world’s population.T his family includes major world languages like English (, Spanish, French, German, Russian, and Hindustani (Hindi/Urdu).

Àfrica: Al nord per proximitat amb orient, Afroasiàtic, subsaharians el níger Congo i Khoisan. Francès i Afrikaans per colonialisme.( Africa is home to a large number of language families, the largest of which is the Niger-Congo language family, which includes such languages as Swahili, Shona, and Yoruba. Speakers of the Niger-Congo languages account for 6.9% of the world’s population. [el Khoisan ha quedat mol reduït]. A similar number of people speak the Afroasiatic languages, which include the populous Semitic languages such as Arabic, Hebrew language, and the languages of the Sahara region, such as the Berber languages and Hausa.

Europa i Rússia: [indoeuropeu, llatins, germànics, eslaus]

Orient: [àrab] àsia central the Turkic languages of Central Asia (such as Turkish),

àsia Est: Xinès d’origen Dene Caucasian. The Sino-Tibetan languages are spoken by 20% of the world’s population and include many of the languages of East Asia, including Hakka, Mandarin Chinese, Cantonese, and hundreds of smaller languages.
Indoxina: the Austroasiatic (among them Khmer), and Tai–Kadai languages of Southeast Asia (including Thai).

Arxipèlags d’indonèsia: The Austronesian languages are spoken by 5.5% of the world’s population and stretch from Madagascar to maritime Southeast Asia all the way to Oceania. It includes such languages as Malagasy, Māori, Samoan, and many of the indigenous languages of Indonesia and Taiwan. The Austronesian languages are considered to have originated in Taiwan around 3000 BC and spread through the Oceanic region through island-hopping, based on an advanced nautical technology.

Índia: Al nord l’índic d’origen indoeuropeu, al sud, dravídiques Dravidian languages of South Asia (among them Kannada, Tamil, and Telugu),

Amèrica: Amerindi desplaçat per l’anglès al nord, castellà i portuguès al sud

Austràlia: aborígen desplaçat per l’anglès

Els llenguatges més parlats són:

Mandarin: 848
Spanish: 400
English: 328
Portuguese: 250
Arabic: 221
Hindi: 182
Bengali: 181
Russian: 144
Japanese: 122
Javanese: 84.3

Entrades a Wikipedia a març de 2025

English 6,970,000
Deutsch 2.999.000
Français 2.673.000
Русский rus 2.035.000
Español 2.019.000
Italiano 1.909.000
中文 xinès 1,469,000
日本語 Japonès 1,456,000
Portuguès 1.145.000
Català 770.000

Vocabulari de les diferents llengües

Anglès: Vocabulari habitual d’un nadiu cult: ~40.000-60.000 paraules. Oxford English Dictionary (OED): ~600.000 entrades (incloent paraules obsoletes i tècniques).
Castellà: Diccionari de la RAE (2023): ~93.000 paraules.
Xinès mandarí: Hanyu Da Cidian* (gran diccionari): ~370.000 entrades, però moltes són combinacions de caràcters. – Caràcters en ús habitual: ~3.500-5.000 (però cada un pot representar diverses paraules).
Francès: Le Trésor de la Langue Française: ~100.000 paraules (fins a 350.000 incloent termes especialitzats).
Alemany: Duden (diccionari principal): 200.000 paraules (pot arribar a 5-10 milions comptant compostos com Rechtsschutzversicherungsgesellschaften”).
Rus: Gran Diccionari Acadèmic: ~150.000 paraules.
Àrab: Estimacions de ~12 milions de paraules (per la flexió morfològica), però en ús real es redueix a ~100.000-200.000.


Babel

Al gènesi 11:1-9, Déu castiga amb la confusió de llengües l’orgull dels humans que pretenien construir una torre, el Zigurat, que arribés al cel. Aquesta mena de càstig apareix també en la tradició mesopotàmica a l’Enuma Elish, Enlil destrueix la unitat lingüística de la humanitat. El poble Totonac a Mèxic té un mite sobre una gran torre destruïda pels déus, que va provocar la diversitat lingüística.
A la Pentecosta té lloc el descens de l’Esperit Sant, amb llengües de foc que fa que tots s’entenguin encara que parlin llengües diferents (Fets 2:1-4, 6-8, 11b).

Cildo Meireles, Babel 2001


ETNOLOGUE  |  museu de les llengües:


| PDF text