domingo, 2 de enero de 2011

LA ACÚSTICA DEL CANTO



PRINCIPIOS DE ACÚSTICA
El sonido es una forma de energía física que involucra la propagación de ondas elásticas (sean audibles o no), generalmente a través de un fluido (u otro medio elástico) que esté generando el movimiento vibratorio de un cuerpo. La propagación del sonido involucra transporte de energía sin transporte de materia, en forma de ondas mecánicas que se propagan a través de la materia sólida, líquida o gaseosa. Como las vibraciones se producen en la misma dirección en la que se propaga el sonido, se trata de una onda longitudinal
La física del sonido es estudiada por la Acústica, que trata tanto de la propagación de las ondas sonoras en los diferentes tipos de medios como de la interacción de estas ondas sonoras con los cuerpos físicos.



Magnitudes físicas del sonido
Si representamos una onda sonora en función del tiempo obtendremos una gráfica, que se denomina movimiento armónico simple, o movimiento sinusoidal o sinusoide.

 

La onda sinusoidal se desplaza desde un punto de partida inicial a un punto máximo positivo, para luego regresar al nivel del punto de partida, continuando a un punto de máximo desplazamiento negativo y finalmente regresar al punto de partida. El tiempo que tarda la onda en completar un ciclo es fijo a lo largo de toda su duración, y se denomina periodo. Se puede contar un ciclo partiendo desde cualquier punto hasta que la onda retorna al punto que muestra la misma tendencia de movimiento.
El movimiento sinusoidal queda perfectamente determinado por tres parámetros:
- Frecuencia. Es el número de ciclos o número de movimientos de ida y vuelta que una masa oscilatoria puede realizar en un segundo. Su unidad es el Hertz (Hz). Por ejemplo: si una onda completa 125 ciclos en un segundo se dice que su frecuencia es de 125 Hz.  

El equivalente psicoacústico de la frecuencia es el tono: Indica si el sonido es grave, agudo o medio, y viene determinada por la frecuencia fundamental de las ondas sonoras, medida en ciclos por segundo o hercios (Hz).
  • vibración lenta = baja frecuencia = sonido grave.
  • vibración rápida = alta frecuencia = sonido agudo.

Para que los humanos podamos percibir un sonido, éste debe estar comprendido entre el rango de audición de 16 y 20.000 Hz. Por debajo de este rango tenemos los infrasonidos y por encima los ultrasonidos. A esto se le denomina rango de frecuencia audible. Cuanta más edad se tiene, este rango va reduciéndose tanto en graves como en agudos.
- Amplitud. Es la cantidad de energía acústica que contiene un sonido, es decir, lo fuerte o suave que puede ser un sonido. Es el máximo desplazamiento que desde la posición de reposo realiza el oscilador. El equivalente psicoacústico de la amplitud es el volumen o intensidad sonora y nos permite distinguir si el sonido es fuerte o débil.
Los sonidos que percibimos deben superar el umbral auditivo (0 dB) y no llegar al umbral de dolor (140 dB). Esta cualidad la medimos con el sonómetro y los resultados se expresan en decibelios (dB) en honor al científico e inventor Alexander Graham Bell.

Movimiento Armónico Complejo
Sin embargo, un sonido complejo cualquiera no está caracterizado por los parámetros anteriores, ya que en general un sonido cualquiera es una combinación de ondas sonoras. Las ondas sinusoidales son la configuración básica de las vibraciones, sin embargo en la naturaleza la mayoría de los estímulos acústicos son movimientos vibratorios complejos que consisten en la suma de ondas sinusoidales con distinta frecuencia. Cuando las frecuencias de cada sinusoide se relacionan entre sí mediante números enteros exactos (p. ej., 500 y 1000 Hz [1:2], 500 y 1500 Hz [1:3], etc.) se dice que el movimiento es complejo pero armónico.

La voz humana
El sonido generado en la laringe que origina la voz por sí solo no sirve para la comunicación oral, por lo que debe sufrir una serie de transformaciones en las cavidades supralaríngeas para que llegue a ser un sonido inteligible el que salga por los labios. Si consideramos la laringe como fuente sonora, las estructuras referidas por encima de ella se denominan tracto vocal.
El tracto vocal está constituido por la laringe supraglótica, la faringe, la boca y las fosas nasales. El tracto vocal, durante el habla, está modificando continuamente su anatomía en la forma de distintos gestos articulatorios de tal manera que se intensifican o atenúan diferentes sonidos. Las zonas donde se intensifican determinados sonidos se llaman resonancias, por lo que cada forma que adquiere el tracto vocal tiene una determinada curva de resonancia.

Serie de armónicos
Cuando se ejecuta una nota en un instrumento musical se genera una onda de presión de aire. Esta onda sonora está acompañada por una serie de armónicos, que le dan al instrumento su timbre particular. Cada armónico de esta serie tiene una amplitud (volumen o fuerza del sonido) diferente.
A partir del quinto armónico, todos los siguientes armónicos impares suenan ligeramente desafinados con respecto al temperamento justo (que es el sistema de afinación de uso estándar en la fabricación de instrumentos desde el siglo XVII).


Escala armónica

Esta es la serie de los primeros armónicos (que justamente son los principales):
Nº de Armónico Frecuencia NotaIntervalo 
1º armónico 66 Hz do1tono fundamental (el primer do a la izquierda del piano)
2º armónico 132 Hz do2octava 
3º armónico 198 Hz sol2quinta 
4º armónico 264Hz do3octava 
5º armónico 330 Hz mi3tercera mayor 
6º armónico 396 Hz sol3quinta, una octava sobre el 3º 
7º armónico 462 Hz sib3séptima menor (muy desafinada) 
8º armónico 528 Hz do4octava 
9º armónico 594 Hz re4segunda mayor, una quinta sobre el 6º 
10º armónico 660 Hz mi4tercera mayor, octava del 5º
11º armónico 726 Hz fa#4cuarta aumentada 
12º armónico 792 Hz sol4quinta justa, una octava sobre el 6º 
13º armónico 858 Hz la4sexta mayor (muy desafinada) 
14º armónico 924 Hz sib4séptima menor (muy desafinada, igual que el 7º) 
15º armónico990 Hz si4séptima mayor, una quinta sobre el 10º 
16º armónico 1056 Hz do5octava 
Tabla de armónicos

Teoría fuente – filtro
    Cualquier sistema que se deja atravesar por un sonido hace que este sufra una transformación que depende de las propiedades del sistema y que se conoce con el nombre de función de filtro o transferencia: el sonido que sale es diferente al sonido que entra. Los sistemas que atraviesa el sonido tienen la propiedad de producir resonancias. Una resonancia es una frecuencia o una banda de frecuencias, a las cuales un filtro responde con menos atenuación que con las frecuencias de alrededor; de esta forma el sonido resultante es influido por el filtro de una forma que es siempre igual para la misma configuración del filtro atenuador.
    Nos damos cuenta que existe una atenuación de los armónicos (la intensidad de los armónicos va decayendo conforme aumenta la frecuencia) en una cantidad que en este caso es de 6 dB por octava (entre las frecuencias de 200, 400, 800, 1600, 3200 y 6400 Hz hay una diferencia de 6 dB). Esta señal de la fuente glótica al atravesar un filtro que supone el tracto vocal supraglótico sufre una interacción que depende de las características resonadoras del filtro y que son determinadas por los cambios de conformación.

    En 1953, Fant enunció la teoría fuente– filtro para la producción de las vocales. En esta teoría se describe para la producción vocal lo que hemos reflejado anteriormente: la glotis es una fuente de señal con riqueza de armónicos que atraviesa el complejo filtro resonador del tracto vocal supraglótico. Algunos armónicos de la señal glótica estarán en el lugar o cerca de los picos de resonancia de la función de transferencia del tracto vocal (para ese momento, pues la forma es cambiante) y pasarán con poca atenuación; pero habrá, sin embargo, otros armónicos que se atenuarán mucho más porque se encuentren en los lugares "valle" de la función de transferencia. Debido a que el tracto vocal cambia de forma, también cambian sus frecuencias de resonancia, con lo que se pueden percibir las diferentes vocales con la misma señal de la fuente glótica.



La característica fundamental de los resonadores es que permiten pasar determinados sonidos dependiendo de la frecuencia del sonido. Los sonidos que tienen una determinada frecuencia pasan a través del resonador muy fácilmente, de modo que son irradiados con una alta amplitud desde el resonador. Esas frecuencias especialmente transmitidas y que concuerdan óptimamente con el resonador se denominan frecuencias formánticas o formantes: concentración de energía en las zonas de poca atenuación.

La energía, como sabemos, irá descendiendo según aumenta la frecuencia; la medida de la pérdida de energía se dará en dB por octava (figura 19): una caída lenta de energía puede ser de 6 dB/octava, y una pérdida rápida, como en las voces aéreas, puede llegar a ser de 18 dB/octava. La cantidad de energía de la señal glótica y su descenso viene determinado por la velocidad del cierre de las cuerdas en el ciclo glótico: cuanto mayor es la velocidad del cierre mayor el número de armónicos y más lenta será la pérdida de energía. La velocidad del cierre glótico aumenta al elevar la intensidad de la voz o cuando se coloca la voz de una manera determinada (impostación). Por el contrario, cuando existe una respiración aérea la velocidad del cierre glótico está disminuida, o incluso puede no cerrarse, con lo que los armónicos serán pocos y la curva espectral de las frecuencias estará muy disminuida.

Formantes y articulación
    Como hemos visto los formantes corresponden a los picos de resonancia del tracto vocal. En el ser humano son frecuentes tres formantes, correspondiendo el cuarto y quinto formante a voces muy entrenadas, como la de los cantantes líricos. Las propiedades tímbricas de una nota dependen de las frecuencias parciales que son reforzadas y las que son debilitadas. Por tanto, la calidad de las vocales y el color de la voz están determinados por las frecuencias de los formantes del tracto vocal.

Control de la frecuencia de los formantes.
    El tracto resonador supraglótico se comporta como si fuese un tubo, pero un tubo que puede cambiar rápidamente de forma. En la posición más neutra posible de todo el tracto supraglótico vemos que se comporta como un tubo que tuviese zonas de menos amortiguación o filtrado, de morfología e intensidad muy semejantes, en las correspondientes a las frecuencias 500, 1500 y 2500; los picos de resonancia del tracto vocal son los formantes. Si modificamos la forma del tracto vocal para poder pronunciar todas las vocales, los picos formantes cambian de posición y de amplitud.

    La función de transferencia del tracto vocal (teoría fuente-filtro) depende de la articulación, ya que ésta es la que determina la frecuencia de los formantes. Y en última instancia lo que causa la articulación en el tracto vocal es una modificación de su longitud y su forma:
  • La longitud se define como la distancia desde la glotis a la abertura labial.
  • La forma del tracto vocal varia a lo largo de su eje longitudinal.
 De modo, que podría representarse la forma del tracto vocal con una curva donde el eje horizontal representa la distancia a la glotis y el eje vertical representa el área de sección transversal. La longitud del tracto vocal está determinada por la morfología individual: en los niños es más corto que en los adultos, y en estos es más corto en las mujeres que en los hombres. Se puede modificar la longitud del tracto vocal
  • ascendiendo y descendiendo la laringe mediante la acción de la musculatura laríngea extrínseca, y
  • protuyendo los labios.
 Cuando hablamos o cantamos estamos continuamente modificando la longitud del tracto vocal. Cuanto más largo sea la longitud del tracto vocal, más baja será la frecuencia de los formantes.
La dependencia de los formantes del área transversal del tracto vocal es más complicada. Las principales herramientas que podemos usar para cambiar la forma o área transversal del tracto son: los labios, la abertura mandibular, la lengua y el velo. Todas estas estructuras constituyen los articuladores del habla.
Los labios pueden disponerse en forma redondeada y expandirse, como cuando sonreímos. La mandíbula inferior puede moverse hacia atrás y delante. La lengua puede adoptar diferentes formas: aumentar de tamaño hacia arriba y delante y contactar con el paladar duro, o hacia atrás y contactar con el velo del paladar, o hacia abajo y atrás para constreñir la cavidad faríngea. El velo del paladar puede ascender y descender: cuando asciende cierra la conexión entre el tracto vocal y la nariz; y cuando desciende, existe una comunicación entre la nariz y la cavidad bucal. Un movimiento en cualquiera de los articuladores afecta la frecuencia de los formantes.

En general, casi todos los formantes descienden en frecuencia cuando se produce un estrechamiento de la abertura labial y por un aumento de longitud del tracto vocal. De modo particular, la frecuencia del primer formante es particularmente sensible a los cambios en la abertura de la mandíbula; un aumento en la abertura mandibular tiende a aumentar la frecuencia del primer formante. El segundo formante es más sensible a la forma de la lengua: cuando la lengua estrecha la parte anterior del tracto vocal, la frecuencia del segundo formante aumenta; cuando la lengua estrecha el tracto a nivel del paladar blando, la frecuencia del segundo formante desciende. El segundo formante alcanza su valor más bajo si la lengua estrecha la región del velo del paladar mientras los labios son protruidos, como cuando se pronuncia la vocal /u/. El tercer formante es particularmente sensible a la posición de la punta de la lengua y, por tanto, al tamaño de la cavidad inmediatamente detrás de los incisivos: cuando esta cavidad es grande, la frecuencia del tercer formante desciende. El cuarto y quinto formante son mucho menos móviles y son mucho más dependientes de la longitud del tracto vocal que de la posición de determinados articuladores. En especial, el cuarto formante es muy dependiente de la forma del tubo laríngeo.

Las frecuencias medias de cada formante medidas en muestras de hombres adultos son: para el primer formante 500 Hz; el segundo formante 1.500 Hz; el tercer formante 2.500 Hz; y el cuarto formante 3.500 Hz.

Formantes de las vocales
El lenguaje hablado es sólo posible porque gente diferente es capaz de producir aproximadamente los mismos sonidos. Con variaciones sutiles, una/a/de una persona es esencialmente igual que en otra. Los formantes permiten que esto suceda. Sin ellos, el mundo parecería la torre de Babel y la gente no sería capaz de entenderse unos con otros.

El sonido de cada vocal está asociado con un protocolo específico de articulación, produciendo un área específica de funcionamiento que se traduce en una combinación específica de frecuencias formánticas. La frecuencia de los formantes determina la calidad de las vocales, especialmente el primer y segundo formante. Esto necesariamente implica que individuos distintos afinen sus formantes un poco diferentemente para la misma vocal. Por ejemplo, sería completamente imposible para los niños pequeños descender sus formantes hasta las frecuencias de los adultos, simplemente porque el tamaño de su tracto vocal no es lo suficientemente largo.

La posición exacta de los dos primeros formantes para una vocal dada depende fundamentalmente de la morfología individual del tracto vocal del hablante, y también de los hábitos de pronunciación. El color final de la voz depende más del tercer y cuarto formante, que de los dos primeros.

Una vocal, no es realmente nada más que un timbre específico o una envoltura espectral - una firma acústica, por así decirlo. Si es producida por la voz humana, un sintetizador, o aún por un pájaro talentoso, básicamente siempre será lo mismo. Se requieren dos formantes para la identificación de vocal, (F1 y F2). El factor más importante en la producción de vocales y formantes de las vocales es la posición (ubicación) de la lengua, seguida de la forma de los labios y la apertura de la mandíbula. Todos estos factores tienen la capacidad de cambiar la forma del tubo que resuena. Cada vez que esto ocurre, se establecen modelos únicos de reflexión del sonido en el tracto vocal.

Los cambios de la forma del tracto vocal causan los movimientos fiables de frecuencias de formante. La mayor parte de estos cambios pueden ser codificados por un juego de seis reglas de formante básicas:
  1. Una constricción delante del tracto vocal baja F1 y levanta F2.
  2. Una constricción detrás del tracto vocal levanta F1 y baja F2.
  3. Todas las frecuencias de formante descienden uniformemente cuando el tracto vocal se alarga.
  4. Todas las frecuencias de formante se elevan uniformemente cuando el tracto vocal se acorta.
  5. Todas las frecuencias de formante descienden uniformemente redondeando los labios y aumentan extendiéndolos.
  6. El descenso la mandíbula que produce un apertura de boca aumentada eleva F1.

Las Vocales Cardinales
Los ejemplos siguientes presentan las posturas articulatorias del tracto vocal y los espectros resultantes acústicos de las cinco vocales cardinales, / i-e-ao-u/. Las frecuencias de formante típicas son citadas para hombres y mujeres (Peterson y la Bronca, 1952). Estas figuras son promedios para el discurso. Las vocales cantadas casi siempre serán algo diferentes.

Centro formántico de las vocales
Vocal Formante F1 Formante F2 
u 320 Hz 800 Hz 
o 500 Hz 1000 Hz 
å 700 Hz 1150 Hz 
a 1000 Hz 1400 Hz 
ö 500 Hz 1500 Hz 
ü 320 Hz 1650 Hz 
ä 700 Hz 1800 Hz 
e 500 Hz 2300 Hz 
i 320 Hz 3200 Hz 

Formantes vocálicos
Vocal Región principal formántica 
/u/ 200 a 400 Hz 
/o/ 400 a 600 Hz 
/a/ 800 a 1200 Hz 
/e/ 400 a 600 y 2200 a 2600 Hz 
/i/ 200 a 400 y 3000 a 3500 Hz 
Modificación de las vocales
Sabiéndolo o no, todos los cantantes modifican sus vocales en un grado u otro. Las posiciones de los formantes constantemente son cambiadas cantando para optimizar el timbre y la salida sonido. Imagínese, por ejemplo, un tenor que canta el diapasón mi3 (330HZ) sobre la palabra "heed". El formante para la vocal en esta palabra es encontrado 270HZ (do sostenido). Esto, desde luego, es inferior que la frecuencia fundamental que él intenta cantar. Su solución es de dejar caer su mandíbula muy ligeramente, que - según las reglas de los formantes- eleva el primer formante. Así, afina F1 y FO a casi el mismo tono. El resultado es un incremento de la amplitud, la calidad mejorada del sonido y la producción más fácil del mismo. Este tipo de sintonía de formante ocurre con frecuencia y a menudo subconscientemente.

Los mejores compositores han sido conscientes - deliberadamente o no - de este fenómeno. Puccini, por ejemplo, ponen do en el climax del aria de Rodolfo " Che gélida manina" en la primera sílaba inacentuada de la palabra speeeranza; el primer formante de la vocal /e/coincide casi exactamente con este do4.     Verdi hizo lo mismo cosa con el aria del Duque "La donna é mobile" de Rigoletto (pensieeeer!). Ninguno de estos compositores expresamente sabía de formantes. Ambos, sin embargo, sabían que sonaba mejor en estos tipos de voz.

Imagínese ahora que un soprano canta la palabra "heed", pero con una frecuencia fundamental de 750Hz (sobre Fa4-sostenido). En este tono, la fundamental es más de una octava más alta que el primer formante típico. FO y F1 están muy lejos, de hecho, para que la vocal pueda ser producida con exactitud. Todas las vocales, excepto /a/, tienen los primeros formantes en gamas de frecuencia que caen por debajo del sol4. Por consiguiente, todas las vocales comienzan a parecer similares en las notas más agudas de la voz de mujer. Esto ocurre incluso cuando la cantante intenta cantar sin modificación de la vocal. Por suerte, las consonantes - y el contexto a menudo- ayudan a que el texto permanezca inteligible aún en altas frecuencias fundamentales. Otra vez, los mejores compositores son conscientes de este problema. Gilda, por ejemplo, canta la palabra sará sobre si natural ("Caro nome" de Rigoletto). ¡Muchos compositores evitan el problema permitiendo a las sopranos cantar las notas climáticas sobre la sílaba poética " ah!

La modificación de las vocales es también importante durante transiciones vocales por passaggio, como en el cambio de la voz de pecho a voz de cabeza. Los cambios de registro a menudo pueden ser suavizados simplemente modificando hacia vocales cuyos primeros formantes se encuentran en tonos dentro del área de transición. Las vocales a menudo pueden ser cambiadas una o dos posiciones más cerradas o abiertas sin considerablemente afectar la inteligibilidad.

El Formante del Cantante
Los cantantes entrenados por lo general producen un timbre que es descrito como ring (brillo). En esta calidad de voz los armónicos agudos se proyectan con gran amplitud. El resultado es un sonido brillante, de calidad casi parecida a una campana. La mayor parte de cantantes y profesores están muy familiarizados con este fenómeno.

Estos sonidos producidos por cantantes clásicos son resultado de una resonancia única llamada el formante del cantante, que es creado por acercar el 3º, 4º y 5º formantes muy juntos dentro de una gama de frecuencia estrecha. Este nuevo formante combinado - una especie "de superformante- da una amplificación suplementaria a los armónicos en la gama de frecuencias de aproximadamente 2,400Hz-3,200Hz.

Los científicos de la voz no están todavía completamente seguros de como se crea este formante del cantante. La mayoría piensan, sin embargo, que es el resultado de resonancias en la laringofaringe, es decir, la región desde la glotis a la parte superior de la epiglotis. Esta región parecida a un tubo anatómico puede funcionar como un resonador independiente; su longitud tiene correlación a una frecuencia resonante en la gama del formante del cantante.
La proporción del tamaño de la orofaringe a la salida de la laringe también se cree que es importante. Los científicos como Ingo Titze y Johann Sundberg declaran que esta condición puede ocurren cuando la laringe está en una posición relajada, baja; Para que el formante del cantante produzca este sonido brillante, los armónicos deben estar presentes en la fuente de sonido glotal en la gama de frecuencias de 2,400Hz-3,200Hz.

Para asegurar la presencia de armónicos agudos, la glotis debe abrirse y cerrarse de manera eficiente y completamente. Un sonido aéreo, producido por el cierre incompleto glotal, casi seguramente estará desprovisto de los armónicos requeridos. A la inversa, en un sonido apretado, producido por el cierre duro de la glotis, los armónicos de alta frecuencia podrían ser demasiados, causando un sonido áspero, estridente. Los armónicos reciben la amplitud óptima cuando el cierre glotal es rápido, escueto y fácil, causando una parada limpia del flujo aéreo entre los pliegues vocales (Sundberg, 1987).

No todos los cantantes usan el formante del cantante. Raras veces (poco probable) es oído en estilo comercial o popular que confía en micrófonos para la mejora del sonido. Prácticamente todos los cantantes clásicamente entrenados, bajos, barítonos, tenores y mezzo-sopranos usan el formante del cantante. Es menos importante para sopranos, sobre todo los que se especializan en el repertorio que contiene muchos agudos. La amplitud naturalmente aumenta cuando se eleva el tono, así como el potencial de resonancia. Como resultado, las sopranos por lo general pueden ser oídas sobre la orquesta sin la ayuda del formante del cantante, cuando cantan en tesituras altas. Si un soprano involucra demasiado este formante en su gama superior, la voz probablemente suene áspera, chillona y desagradable.