La veu humana

Emissió del so    Alfabet fonètic internacional  Fonemes i síl·labes    La veu , patologies [museu]


Emissió del so, vocals i consonants

Les cordes vocals (Anatomia: Òrgans cavitat toràcica i abdominal. Fisiologia: cordes vocals

En passar l’aire per les cordes vocals s’emet un so a una determinada freqüència entre uns extrems de 65 Hz – 1000 Hz:

  • Adult home: 85–180 Hz, típicament als 100–120 Hz
  • Adult dona: 165–255 Hz, 200–220 Hz
  • Nens: 250–400 Hz, 300–350 Hz

L’aparell fonador format per la faringe, la cavitat bucal i la cavitat nasal modifiquen els harmònics de manera que els percebem com a vocals diferents. Bàsicament es tracta de la posició de la llengua.

Vocals anteriors (/i, e, ɛ, a/): La llengua s’avança cap a la part davantera de la boca (propera als dents o al paladar dur). La “i” a llibre, la “e” de sèrie.
Vocals centrals (/ə, a/): la llengua roman en posició neutral, ni massa endavant ni massa enrere./ə/ “casa” boca.
Vocals posteriors (/u, o, ɔ/): la llengua es retreu cap a la part posterior de la boca (propera al vel o a la úvula). /u/ (“música”, %ɔ/ “pot”.

El català té 8 vocals, el castellà 5, i el francès arriba a 12-16. l’IPA n’ha identificat fins a 28.

S’identifiquen tres “formants” principals:

  • F1​ està determinat per l’obertura de la mandíbula, i acostumarà a estar entre les 250Hz i els 800Hz.
  • F2 El segon formant, estarà determinat per la posició de la llengua i oscil·larà entre les freqüències 700Hz i 2300Hz. És alt en les vocals anteriors i baix en les posteriors
  • El 3r formant, està determinat per la punta de la llengua. Els formants superiors a aquests, estan determinats per la posició de la laringe i altres aspectes que no es poden canviar, com la llargada del conducte vocal i el volum de la cavitat nasal.

Praat: programa per analitzar la veu. (L’app spectroid permet visualitzar-lo al mòbil).

Les consonants apareixen quan modifiquem el flux d’aire de diferents maneres.

Segons el lloc:

  • Bilabial, els dos llavis (labis) s’apropen o tanquen: p, b, m
  • Labiodental, les dents superiors toquen el llavi inferior: f, v
  • Dental, les dents superiors toquen el llavi inferior: t̪, d̪, θ (anglès *thin*)
  • Alveolar, la punta de la llengua toca les alveolars (la part rugosa darrere dels dents superiors: s, n, l, r
  • Postalveolar, la llengua es recolza just darrere de les alveolars: ʃ (“xaixa”), ʒ (“ajut”)
  • Retroflexa, la punta de la llengua es corba cap enrere (cap al paladar dur): ʈ, ɖ (hindi)
  • Palatal, el cos de la llengua toca el paladar dur: ʎ (“lluna”), ɲ (“ny”)
  • Velar, la part posterior de la llengua toca el vel (paladar tou), k, g, ŋ (“sang”)
  • Uvular, la llengua toca la úvula (campaneta): ʁ (“francès “rue”)
  • Faringal, l’arrel de la llengua s’apropa a la faringe: ħ, ʕ (àrab)
  • Epiglotal, l’epiglotis vibra o tanca el pas de l’aire
  • Glotal, les cordes vocals s’apropen o tanquen: ʔ, h

Segons la manera d’articular tenim:

  • Oclusiva, bloqueig + alliberament sobtat: p, t, k
  • Nasal, aire pel nas: m, n, ɲ
  • Vibrant, vibració de la llengua: r, rr
  • Batuda, contacte ràpid: ɾ (en “cara”)
  • Fricativa, fricció sense bloqueig: f, s, ʃ (“xaixa”)
  • Africada, oclusiva + fricativa: ts, tʃ (“txec”)
  • Aproximant, aproximació sense fricció: j, w
  • Lateral, aire pels costats de la llengua: l, ʎ (“lluna”)

Segons si vibren o no les cordes vocals seran sonores o sordes. No sempre es donen les dues versions.

  • Sonores: b, d, g, v, z, m, n, l, r
  • Sordes: p, t, k, f, s, ʃ, tʃ

IPA Alfabet fonètic internacional

El 1886 Paul Passy, seguint una idea del lingüista danès otto Jesperen comença els treballs per definir la representació de tots els fonemes de les diferents llengües publicant un primer alfabet amb 72 lletres el 1888. Després de freqüents revisions fins el 1940 va quedar relativament estable fins el 1989.

S’identifiquen 28 vocals (8 en català)

85 Consonants pulmonars

11 consonants no pulmonars

La taula completa:

Taula amb sons    (exemple youtube). Slatona, Fonemes del català

A més, es fan servir símbols per descriure

  • Detalls de sons (nasalització, aspiració…) → Diacrítics
  • Estructura de paraules (accents, síl·labes…) →  Suprasegmentals (pot indicar parcialment la prosòdia, l’entonació en una frase)
  • Alçada musical en síl·labes (xinès, tailandès…) →  Tons

La prosòdia dóna les normes de pronúncia i en general la corba melòdica. Una oració interrogant té una cadència ascendent mentre que una afirmativa la té descendent.

Fonemes i síl·labes

PHOIBLE recull els sons (segments) que apareixen a cada llengua. En el cas del català central són 10 vocals i 25 consonants. El nombre total de fonemes per llengua sol oscil·lar entre 20 i 60.  En total, si sumem tots els fonemes diferents usats en totes les llengües del món, n’hi ha al voltant de 800 a 850 fonemes diferents, segons PHOIBLE.

El fonema és la “mínima unitat sonora” [identificable, però a la pràctica rarament pronunciem consonants aïllades. Les unitats de la parla serien els síl·labes, que poden tenir els patrons. Una síl·laba és l’agrupació que es pronuncia amb un sol impuls de veu] (en català, 35 fonemes):

  • V: i, a
  • CV: pa, tu
  • CVC: sol, mar
  • CCV: pla, tro
  • CCVC: blan, gran
  • VCC: arc, alt

Tenint en compte això tindríem:

  • Anglès (RP), 10.000 – 15.000+, CVC, CCVC, V, CV, VCC, CVCC (Molta varietat; moltes combinacions de consonants)
  • Xinès mandarí, ~400 síŀlabes *fonològiques* (sense tons)\~1.200 amb tons, CV, CVC (poques finals) (Molt poques síl·labes fonològiques; el to distingeix significat)
  • Francès, ~2.000 – 3.000, CV, CVC, CCV, V (Sovint amb finals consonàntiques; moltes amb vocals nasals)
  • Italià, ~500 – 700, CV, CVC, V (Sil·làbiques simples i regulars)
  • Català (central), ~3.000 – 5.000, CV, CVC, CCV, CCVC, V (Gran varietat, com el francès; inclou combinacions difícils (ex. /tr/, /bl/, /pl/…)

El nombre total únic de síl·labes possiblement usades a les llengües del món (realment pronunciades, no només teòriques) estaria entre 10.000 i 25.000 síl·labes distintes, tenint en compte els solapaments. El total teòric segons les regles fonosintàctiques de totes les llengües combinant tots els fonemes i estructures sil·làbiques possibles, superaria fàcilment les 100.000. Però moltes serien impracticables o mai atestades.

[Penso que aquesta deu ser la unitat fonètica, obtenint els fonemes elementals per descomposició, ja que no hi ha consonants aïllades. De tota manera, en aprendre a parlar la percepció auditiva ha de saber discriminar entre /fa/ i /sa/]. Les síl·labes encara no són unitats de significació i s’agruparan en mots. Cada llengua té les seves regles pel que fa a la formació de síl·labes (normalment cada vocal implica una síl·laba llevat dels diftongs on se’n pronuncien dues en una) i l’accentuació.

(Així com GPT o BERT es basen textos (tokens textuals que identifiquen síl·labes, paraules, morfemes) es podria entrenar un model basat en discursos, àudio que detectés les unitats sil·làbiques pronunciables, les agrupés segons semblança fonètica i després en derivés representacions semàntiques i morfosintàctiques. Serviria per a llengües sense corpus textual. [o uns extraterrestres que arribessin parlant a la terra].


La veu

La veu és característica de cada persona i del seu estat anímic “atès que és l’emanació de la seva afectivitat i de la seva sensibilitat, així com el reflex de la seva individualitat tant fisiològica com psicològica.” (WK). El to de la veu, independentment del contingut del missatge és el que expressa l’estat emocional, juntament amb l’expressió facial.
En ser característica de cada individu, s’ha utilitzat com a mètode d’autenticació tot i que hi ha aplicacions que permeten falsejar-la.

Voicemod (Windows/Android/iOS),  (home → dona, robot, monstres, etc.). MorphVOX (Windows/macOS):  (Efectes de veu en temps real amb ajustos avançats).
Clownfish Voice Changer (Windows).
ElevenLabs . Clona veus amb mostres de pocs segons.

Patologies i educació

La mudesa, la incapacitat per parlar, pot tenir diverses causes:

  • La sordesa, ja sia congènita o adquirida abans d’aprendre a parlar. En no poder percebre els sons no aprenem a pronunciar-los. 50-70%
  • Danys neurològics o afàsia, no funciona la part del cervell responsable dels llenguatge (Àrea de Brocca). 15-25%
  • Trastorns del desenvolupament, autisme, trastorns d’ansietat, experiències traumàtiques. 10-20%
  • Malformacions, problemes a les cordes vocals, llengua o paladar. 5-10%

Els logopedes (speech therapy) tracten infants (40-50%), adults professionals de la veu o que han patit un ictus i ancians amb pèrdua del llenguatge per demència.

  • Llenguatge: retard, (TEL) dificultats per estructurar frases sense causa evident, afàsia per problemes cerebrals, trastorn d’espectre autista, discapacitat intelectual.
  • Parla, fluïdesa i articulació: tartamudesa (disfèmia), dislàlia (dificultat per articular sons (com la r o la s), disàrtria (parla inintel·ligible per danys neurològics (Parkinson, paràlisi cerebral), anàrtria (Impossibilitat total de parlar per danys motors greus).
  • Veu (disfonies): nòduls o pòlips vocals (per abús vocal en professors o cantants), paresia/paràlisi de cordes vocals (veu feble o sense so), disfonia espasmòdica (veu amb talls).
  • Deglució (Disfàgia): dificultat per empassar o quan l’aliment va a parar a la tràquea en loc de l’esòfag.
  • Associats a la Sordesa: aprenentatge de llenguatge de signes o aprendre a processar sons després d’un implant.
  • Neurodegeneratius per Alzheimer/Pàrkinson o ELA (Esclerosi Lateral Amiotròfica)
  • Encara que no estigui relacionat amb la veu, també es tracta la dislèxia (dificultat en lectura i escriptura no relacionada amb la intel·ligència [no processa amb facilitat els signes, veu síl·labes i no paraules senceres, canvia l’ordre]). Relacionat amb la Disgrafia, problemes en l’escriptura (lletra il·legible, errors ortogràfics greus).

Entrenament
La veu un factor molt important en la comunicació, ja sia en cantants, polítics, actors o altres comunicadors com empresaris o locutors. Així que des de l’antiguitat hi ha hagut pràctiques per millorar la projecció i l’entonació [o l’accent d’una llengua no familiar). Es diu que Demòstenes (384–322 aC) practicava amb pedres a la boca per millorar la dicció i sobre el soroll de les onades per enfortir la veu.
La tècnica Estill orientada a cantants ensenya a controlar els músculs vocals. Elizabeth Schwarzkopf en tenia un control excepcional, poden aïllar cada múscul. Al teatre, la tècnica com Linklater ajuda a alliberar la veu natural amb exercicis de relaxació i ressonància.
El cas d’Eliza Doolitle convertida en una dama pel logopeda Henry Higgins de l’obra Pigmalió de Bernard Shaw (1914). Pymalion film de 1938 amb Leslie Howard. My Fair Lady (musical 1956), My fair Lady, film de 1964 amb Audrey Hepburn.
Moses Suposes (Singin’ in the rain, 1952)
The King’s Speech (2010) i el cas real de George VI i el logopeda Lionel Logue.

Vocabulari

(Del llatí vox). Murmurar, xiuxiuejar, parlar, dir, cantar, xisclar, cridar, bramar

(WK) “La influència de la veu dins de la cultura humana queda reflectida en la gran quantitat de paraules que se’n deriven: vocal, vocabulari, vot, vocalisme, vocalitzar, vociferar, boçar, invocar, vocació, advocat, avocar, convocar, convocatòria, evocar, provocar, revocar, irrevocable, unívoc, etc.” i frases com “portar la veu cantant, la veu portant, portaveu, una nova veu en el diccionari, de viva veu, la veu de la consciència, la veu de la trompeta, el verb està en veu passiva, aixecar la veu, rotàveu, tots a una veu, córrer la veu, ni veu ni vot, etc.”


[Museu]

>la veu al llarg de la vida, del balbuceig, nens, canvi de veu , enrogallat

mostres, ira: Samuel L jackson Ezekiel

>la veu en la música, playlists

Marin Marais Voix humaine, Poulenc

 

| PDF text