Orígens del llenguatge Arbre de famílies Indoeuropeu Romàniques Etimologia Llengües avui Babel
Origen del llenguatge
Hi ha diferents hipòtesis per explicar l’aparició del llenguatge en l’home. D’una banda hi ha la necessitat de coordinar accions del grup, com la caça o rituals (Tomasello, Dunbar, Merlin Donald). S’ha detectat una mutació d’un gen (FOXP2) relacionat amb el control dels músculs facials i la capacitat lingüística fa uns 200.000 anys, coincidint amb l’aparició de “Homo sapiens”. Hi ha un descens de la laringe que permet produir sons més variats. S’especula que el llenguatge hauria evolucionat a partir dels gestos, abans que de sons (com en els primats, que tenen més capacitat de comunicació gestual que vocal (Michael Corballis).[és a dir que inicialment designem el que està present]. Encara que hi hagués homínids a tot el món, com els neandertals es creu que el llenguatge simbòlic seria propi de l'”homo sapiens” i es va estendre des de l’Àfrica. (Prehistòria: La revolució cognitiva ).
Chomsky defensa que el llenguatge va aparèixer de sobte, per una mutació genètica, fa uns 70m anys, mentre que d’altres com Steven Pinker, creu que va anar evolucionant gradualment. Ara sabem que la variant del gen FOXP2 apareguda fa uns 200m anys, relacionat amb la capacitat lingüística, presenta mutacions clau en els humans moderns. L’art rupestre (70m anys) indica l’aparició de la funció simbòlica. Els homínids com l’Australopitecs i Homo habilis no tenien una posició baixa de la larinx ni un os hioide ben desenvolupat, factoirs necessaris per emetre fonemes d’un mínim de complexitat. L’Homo neanderthalensis presnetava possibilitats més limitades.
Charles F. Hockett va proposar una llista de 16 trets definitoris del llenguatge humà (“Design Features of Language”).
Trets compartits amb animals:
1. Vocal-auditory channel → Ús de sons (com els ocells o els simis).
2. Broadcast transmission / directional reception → El so es difon en totes direccions, però es percep en una direcció (com el crit d’un gibó).
3. Rapid fading → Els sons desapareixen ràpid (a diferència de les feromones dels insectes).
4. Interchangeability → Un individu pot produir i rebre els mateixos missatges (ex: gossos que tant grunyixen com escolten grunyits).
5. Total feedback → L’emissor sent el seu propi missatge (com un lloro que s’escolta).
6. Specialization → Els sons són exclusivament per a comunicar-se (no com la tos, que té una funció biològica).
Trets exclusius (o gairebé) dels humans:
7. Arbitrariness → No hi ha relació natural entre el símbol (paraula) i el seu significat (ex: la paraula “arbre” no s’assembla a un arbre). Alguns animals tenen certa arbitrarietat (ex: abelles), però molt limitada.
8. Discreteness → Les unitats lingüístiques (com fonemes) es combinen per crear significats nous (ex: /p/ + /a/ = “pa”).
9. Displacement → Parla de coses que no són presents (passat, futur, hipotètics). Els animals sols comuniquen sobre el aquí i ara (excepte les abelles, que indiquen fonts de menjar llunyanes).
10. Productivity → Capacitat de crear infinitats de missatges nous (gramàtica recursiva). Un ximpanzé no pot inventar frases com “Ahir vaig somiar que tu em deies que…”. [recursivitat Chomsky]
11. Duality of patterning → Nivells dobles: sons sense significat (fonemes) es combinen per formar paraules amb significat. Els animals solen tenir unitats amb significat únic (ex: un crit d’alarma).
12. Traditional transmission → El llenguatge s’aprèn culturalment (no és instintiu com el cant dels ocells).
13. Prevarication → Parla de coses falses o fictícies (mentides, literatura).
Diverses teories especulen sobre l’origen del llenguatge i els primers mots apuntant a la imitació dels sons, interjeccions expressives i altres conjectures. El tema fou tractat per Plató al Cràtil. Un cop establert un vocabulari inicial, aniran apareixent noves paraules a mesura que hi ha nous objectes a designar. L’escissió en diferents comunitats farà que les paraules vagin evolucionant de manera diferent i donin lloc a diferents idiomes.
Una lingüística perfecte podria traçar l’aparició de cada mot, ja sia en cultures remotes (protoindoeuropeu), ja sia en la seva introducció en cultures recents (yuppie) i les seves variacions i filiacions semàntiques (electró -> electron o àmbar en grec) i fonològiques (filius -> fill, hijo).
El mateix podríem dir del Dene-Caucasià, que s’hauria parlat als dos extrems del’estret de Bering, i que ara queda en zones de cabadà (esquimal), el país basc, i xina (mandarí?).
Arbre de famílies
- Africans [ separació pel Sahara que s’hauria format entre 100 i 15 anys enrera)] [ hi poso els llenguatges subsaharians]: Niger–Congo (disputat) i Khoisan
- [ Fora d’Àfrica]
- [Grups de l’est ][ DENE CAUCASIAN] E
- [continent]
- [Xina] E.X Sino-Tibetan , Hmong–Mien
- (Indoxina E.I, Kra–Dai , Austroasiatic )
-
Austral E.A [ separació pel cobriment del pont de terra] Austronesian Papuan, Australian , Andamanese
- [continent]
- [Grups del NW] [ NOSTRATIC ] W
- [ continent i amèrica]
- Eurasiàtic
- Indo-European
- [ nord] Uralic, (Bàltiques, lapònia), Paleosiberian , Altaic (turc, mongol i potserkorea, Japó)
- Dravidian (sud índia)
- Afro-Asiatic (orient mitjà i nord d’àfrica), Nilo-Saharan? en vindran les llengües semítiques ( etiòpic, àrab sud, fenici, hebreu, l’arameu, àrab, babiloni, assiri) i el copte a Egipte, berber.
- Amerindi [ per trencament del pont] : Eskimo–Aleut , Algic , Uto-Aztecan, Na-Dené (and Dené–Yeniseian?), American
- Eurasiàtic
- Caucasians [ diversos llenguatges del Càucas i el basc ¿ van quedar aïllats de la resta ?] Caucasian
- [ continent i amèrica]
- [Grups de l’est ][ DENE CAUCASIAN] E
[ Les grans separacions Àfrica, Est (Xina i Austràlia), Oest (Euràsia i Amerindi) haurien tingut lloc abans del final de l’era glacial 20000 anys enrere?]
L’indoeuropeu
All Indo-European languages are descended from a single prehistoric language, reconstructed as Proto-Indo-European, spoken sometime in the Neolithic era. Its precise geographical location, the Indo-European urheimat, is unknown and has been the object of many competing hypotheses; the most widely accepted is the Kurgan hypothesis, which posits the urheimat to be the Pontic–Caspian steppe, associated with the Yamnaya culture around 3000 BC. By the time the first written records appeared, Indo-European had already evolved into numerous languages spoken across much of Europe and south-west Asia.
[A partir d’aquí amb les migracions tenim com a hipòtesi:] [ attestation: prova ]
- Centre
- Pre-Anatolian (4200 BC), Hitita, extingit cap el 1500
- Pre-Armenian (2800 BC)
- Pre-Greek (2500 BC)
- Oest
- Pre-Germanic (3300 BC)
- Pre-Italic and Pre-Celtic (3000 BC)
- Pre-Balto-Slavic (2800 BC)
- Est
- Proto-Indo-Iranian (2200 BC); split between Iranian and Old Indic 1800 BC
- Pre-Tocharian (3700 BC) zona del NW de Xina, documents escrits, extingit
1500 a 1000 BC
- Oest: The Nordic Bronze Age develops pre-Proto-Germanic, and the (pre)-Proto-Celtic Urnfield and Hallstatt cultures emerge in Central Europe, introducing the Iron Age. Migration of the Proto-Italic speakers into the Italian peninsula (Bagnolo stele)
- Centre: The Mycenaean civilization gives way to the Greek Dark Ages.
- Est: Redaction of the Rigveda and rise of the Vedic civilization in the Punjab.
1000-500BC
- Oest: The Celtic languages spread over Central and Western Europe (actualment, Irlandès, escocès, bretó). Baltic languages are spoken in a huge area from present-day Poland to the Ural Mountains.[Proto Germanic. Separation of Proto-Italic into Osco-Umbrian and Latin-Faliscan.
- Centre: Homer and the beginning of Classical Antiquity.Alfabet grec. A variety of Paleo-Balkan languages are spoken in Southern Europe. Zoroaster composes the Gathas,
- Est: Achaemenid Empire, replacing the Elamites and Babylonia. [ després Modern Persian is a continuation of Middle Persian, an official language of the Sasanian Empire (224–651 CE), itself a continuation of Old Persian, which was used in the Achaemenid Empire (550–330 BCE). It originated in the region of Fars (Persia) in southwestern Iran, actualment Farsi. A la Índia, the Vedic Civilization gives way to the Mahajanapadas. Siddhartha Gautama preaches Buddhism.
500 BC – 1 BC/AD:
- Centre Oest : Classical Antiquity: spread of Greek and Latin throughout the Mediterranean and, during the Hellenistic period (Indo-Greeks), to Central Asia and the Hindukush. Proto-Germanic.
- Est: Kushan Empire, Mauryan Empire.
1 BC – AD 500 Late Antiquity:
- Centre Oest: attestation of Armenian. Proto-Slavic. The Roman Empire and then the Migration period marginalize the Celtic languages to the British Isles. The last of the Anatolian languages are extinct.
- Est: Gupta period;. Sogdian, an Eastern Iranian language, becomes the lingua franca of the Silk Road in Central Asia leading to China, due to the proliferation of Sogdian merchants there.
500–1000: Early Middle Ages.
- Oest: The Viking Age forms an Old Norse koine spanning Scandinavia, the British Isles and Iceland. Slavic languages spread over wide areas in central, eastern and southeastern Europe, largely replacing Romance in the Balkans (with the exception of Romanian) and whatever was left of the paleo-Balkan languages with the exception of Albanian. [ d’aquí vindrà el rus]. [ Català escrit el 960]
- Centre: The Islamic conquest and the Turkic expansion results in the Arabization and Turkification of significant areas where Indo-European languages were spoken. Tocharian is extinct in the course of the Turkic expansion.
- Est: Northeastern Iranian (Scytho-Sarmatian) is reduced to small refugia.
1000–1500: Late Middle Ages: Attestation of Albanian and Baltic. El primer document escrit en català és de 1105, el Memorial de greuges de Guitard Isarn, senyor de Caboet, escrit per Ramón de Cabó.
1500–2000: Early Modern period to present: Colonialism results in the spread of Indo-European languages to every continent, most notably Romance (North, Central and South America, North and Sub-Saharan Africa, West Asia), West Germanic (English in North America, Sub-Saharan Africa, East Asia and Australia; to a lesser extent Dutch and German), and Russian to Central Asia and North Asia.
Les llengües romàniques:
L’evolució del llatí vulgar cap a les llengües romàniques es data grosso modo de la manera següent:
Entre el 200 aC i 400 dC aproximadament: diferents formes de llatí vulgar. (pèrdua de la declinació que és substituïda per preposicions).
Entre 500 i 600: aquestes formes comencen a distingir-se entre si.
A partir de 800: es reconeix l’existència de les llengües romàniques.
Està poc documentada perquè fins al s11 no hi comença a haver documents escrits.
- Ibero-Romance: Portuguese/Galician, Asturleonese/Mirandese, Spanish, Aragonese, Ladino;
- Occitano-Romance: Catalan/Valencian, Occitan (lenga d’oc), Gascon (sometimes considered part of Occitan);
- Gallo-Romance: French/Oïl languages, Franco-Provençal (Arpitan);
- Rhaeto-Romance: Romansh, Ladin, Friulian;
- Gallo-Italic: Piedmontese, Ligurian, Lombard, Emilian, Romagnol;
- Venetian (classification disputed);
- Italo-Dalmatian: Italian (Tuscan, Corsican, Sassarese, Central Italian), Sicilian/Extreme Southern Italian, Neapolitan/Southern Italian, Dalmatian (extinct in 1898), Istriot;
- Eastern Romance: Romanian, Aromanian, Megleno-Romanian, Istro-Romanian;
- Sardinian.

[l’arbre no reflecteix el que el català occità ve directament del llatí i no és una branca ni del iberoromanç ni del francès]
Etimologia
Estudi de la història dels mots [que és també una mica la història de l’evolució de les llengües. Tenim paraules:
- patrimonials, paraules que han evolucionat fonèticament i semàntica des dels orígens de l’idioma (en català, serien els mots que van evolucionar des del llatí fins a l’actualitat) [ex. Ballar, del llatí ballare.]
- manlleus: són paraules agafades d’altres llengües, que poden adaptar-se o no a la normativa i poden esdevenir patrimonials amb el pas del temps. Si una paraula és un manlleu d’una llengua morta o avantpassada de l’idioma en qüestió, s’anomena cultisme i, si barreja arrels de dues llengües diferents (per exemple, del llatí i el grec), cultisme híbrid. [ex. “futbol”, “raclet”]
- neologismes: creacions de noves paraules. [“criptogínia”, incorporada el 2024]
(Algunes etimologies en català)
[igual que en l’exposició dels avantpassats, podem imaginar la història de cada mot, el diccionari etimològic que ens remunta a quan apareix per primer cop en un text, el salt a la llengua precedent, el llatí, per exemple, després ens remuntem potser al primer grup d’humans que arribaven a Europa procedents de l’Àfrica amb un vocabulari de x paraules, fins potser al moment inicial en què un humà assenyala amb un gruny una presa de caça.]
Llenguatges avui
El 2025 l’Etnologue llista 7159 llengües.
(DS) Les famílies, per ordre de parlants i nombre de llengües són:
Indoeuropea 3.200M parlants (~450 llengües): Anglès, Hindi, espanyol i resta romàniques, rus, alemany
Sino-tibetana 1.400M (~455 llengües): Xinès mandarí, birmà, tibetà
Níger-Congo 700M (~1.400 llengües): swahili, yoruba, igbo, shona
Afroasiàtica 500M (~375 llengües): àrab, amharic, hebreu
Austronèsia 325M (~1.200 llengües): tagalog (Filipines), javanès, malai i maori.
Dravídica 250M (~80 llengües): Tàmil, telugu i kannada (sud de l’Índia).
Altaica 180M (*controvertida*, ~60 llengües): Turc, Kazakh, mongol
Japònica 120M (15 llengües): Japonès, Ryukyu
Austroasiàtica 120M (~160 llengües): Vietnamita, Khmer
Tai-kadai 90M (~90 llengües): Tai (Tailàndia) i laosià.
Coreànica 80M (2 llengües): Coreà, jeju
Uralica 25M (~35 llengües): Hongarès, finès, estonès
Trans-neoguineana 3M (~480 llengües): Papua Nova Guinea
[ el que es parla avui a les grans zones culturals del món ] Language diversity. The language family of the world that has the most speakers is the Indo-European languages, spoken by 46% of the world’s population.T his family includes major world languages like English (, Spanish, French, German, Russian, and Hindustani (Hindi/Urdu).
Àfrica: Al nord per proximitat amb orient, Afroasiàtic, subsaharians el níger Congo i Khoisan. Francès i Afrikaans per colonialisme.( Africa is home to a large number of language families, the largest of which is the Niger-Congo language family, which includes such languages as Swahili, Shona, and Yoruba. Speakers of the Niger-Congo languages account for 6.9% of the world’s population. [el Khoisan ha quedat mol reduït]. A similar number of people speak the Afroasiatic languages, which include the populous Semitic languages such as Arabic, Hebrew language, and the languages of the Sahara region, such as the Berber languages and Hausa.
Europa i Rússia: [indoeuropeu, llatins, germànics, eslaus]
Orient: [àrab] àsia central the Turkic languages of Central Asia (such as Turkish),
àsia Est: Xinès d’origen Dene Caucasian. The Sino-Tibetan languages are spoken by 20% of the world’s population and include many of the languages of East Asia, including Hakka, Mandarin Chinese, Cantonese, and hundreds of smaller languages.
Indoxina: the Austroasiatic (among them Khmer), and Tai–Kadai languages of Southeast Asia (including Thai).
Arxipèlags d’indonèsia: The Austronesian languages are spoken by 5.5% of the world’s population and stretch from Madagascar to maritime Southeast Asia all the way to Oceania. It includes such languages as Malagasy, Māori, Samoan, and many of the indigenous languages of Indonesia and Taiwan. The Austronesian languages are considered to have originated in Taiwan around 3000 BC and spread through the Oceanic region through island-hopping, based on an advanced nautical technology.
Índia: Al nord l’índic d’origen indoeuropeu, al sud, dravídiques Dravidian languages of South Asia (among them Kannada, Tamil, and Telugu),
Amèrica: Amerindi desplaçat per l’anglès al nord, castellà i portuguès al sud
Austràlia: aborígen desplaçat per l’anglès
Els llenguatges més parlats són:
Mandarin: 848
Spanish: 400
English: 328
Portuguese: 250
Arabic: 221
Hindi: 182
Bengali: 181
Russian: 144
Japanese: 122
Javanese: 84.3
Entrades a Wikipedia a març de 2025
English 6,970,000
Deutsch 2.999.000
Français 2.673.000
Русский rus 2.035.000
Español 2.019.000
Italiano 1.909.000
中文 xinès 1,469,000
日本語 Japonès 1,456,000
Portuguès 1.145.000
Català 770.000
Vocabulari de les diferents llengües
Anglès: Vocabulari habitual d’un nadiu cult: ~40.000-60.000 paraules. Oxford English Dictionary (OED): ~600.000 entrades (incloent paraules obsoletes i tècniques).
Castellà: Diccionari de la RAE (2023): ~93.000 paraules.
Xinès mandarí: Hanyu Da Cidian* (gran diccionari): ~370.000 entrades, però moltes són combinacions de caràcters. – Caràcters en ús habitual: ~3.500-5.000 (però cada un pot representar diverses paraules).
Francès: Le Trésor de la Langue Française: ~100.000 paraules (fins a 350.000 incloent termes especialitzats).
Alemany: Duden (diccionari principal): 200.000 paraules (pot arribar a 5-10 milions comptant compostos com Rechtsschutzversicherungsgesellschaften”).
Rus: Gran Diccionari Acadèmic: ~150.000 paraules.
Àrab: Estimacions de ~12 milions de paraules (per la flexió morfològica), però en ús real es redueix a ~100.000-200.000.
Babel

Al gènesi 11:1-9, Déu castiga amb la confusió de llengües l’orgull dels humans que pretenien construir una torre, el Zigurat, que arribés al cel. Aquesta mena de càstig apareix també en la tradició mesopotàmica a l’Enuma Elish, Enlil destrueix la unitat lingüística de la humanitat. El poble Totonac a Mèxic té un mite sobre una gran torre destruïda pels déus, que va provocar la diversitat lingüística.
A la Pentecosta té lloc el descens de l’Esperit Sant, amb llengües de foc que fa que tots s’entenguin encara que parlin llengües diferents (Fets 2:1-4, 6-8, 11b).

ETNOLOGUE | museu de les llengües:
