La visualización de la voz

¿Cómo se mide una vibración?

Las cuerdas vocales no tienen forma de cuerda, pero sí que vibran como una. La vibración de una cuerda fija en los dos extremos, como la cuerda de una guitarra, se puede esquematizar de la forma siguiente:

_images/voz_vibString2sine.png

Figura 8 La vibración de una cuerda y su correspondencia a una onda sinusoidal

Gráfico del autor.

A medida de que la cuerda se desplaza a la derecha, comprime el aire aumentando su presión. Cuando llegue a su extensión máxima, vuelve a la izquierda y su “ausencia” crea un vacío que enrarece el aire, disminuyendo su presión. Después vuelve a desplazarse a la derecha y el ciclo se repite hasta que la cuerda pierda energía. Los altibajos de la presión del aire se trazan en la curva que hay por debajo de la cuerda que he dibujado como una onda sinusoidal.

Un fenómeno periódico como la vibración de una cuerda o la subida y bajada de la presión del aire se mide por el número de veces que ocurre por unidad de tiempo, conocido como su frecuencia. En el Sistema Internacional de Unidades, la medida es el hercio (Hz), que indica veces por segundo. El próximo gráfico compara dos frecuencias:

_images/voz_vibSineWaves.png

Figura 9 Dos ondas con frecuencias distintas. Gráfico del autor, en MATLAB

La vibración de la totalidad de una cuerda es tan importante que tiene un nombre, la frecuencia fundamental, y un apodo, \(F_0\).

El gráfico La vibración de una cuerda y su correspondencia a una onda sinusoidal ilustra la vibración de una cuerda en su totalidad, pero resulta que una cuerda puede vibrar por partes, como en el dibujo siguiente:

_images/voz_vibratingSegments.png

Figura 10 Una cuerda que vibra por mitades.

Gráfico del autor.

Cada mitad vibra el doble de rápido que la cuerda entera. Además las dos mitades de cada mitad pueden vibrar también, produciendo una frecuencia que es cuatro veces más rápida que la fundamental. Y así sucesivamente, doblando la frecuencia cada vez.

Oímos todas estas frecuencias simultáneamente, un proceso que se llama superposición, más o menos como se ve en este diagrama:

_images/voz_vibSuperposition.png

Figura 11 Dos vibraciones y frecuencias superpuestas

Gráfico del autor.

Las cuerdas vocales también crean una multitud de frecuencias superpuestas que son múltiplos de la frecuencia fundamental, pero de momento sólo nos interesa la fundamental.

Como visualizar la voz en Praat

Ahora necesitas una aplicación especializada para visualizar las frecuencias de la voz. Se llama Praat. Es gratis y tiene versiones de todas las computadoras. Navega a la web de Praat y descarga la versión que es apropiada para tu computadora. Ábrela.

Se abren dos ventanas. La de que hay encima se llama Praat Picture. Ciérrala, porque no nos hace falta ahora. La que queda se llama Praat Objects. Pincha New y luego Record mono sound. Se abre una ventana como ésta:

_images/voz_Praat_SoundRecorder.png

Figura 12 Ventana de SoundRecorder de Praat

Gráfico del autor.

Como grabar un sonido

Truco

tips for sound recording

Acerca la boca al micrófono de la computadora, pincha Record, di [i, a] y pincha Stop. En la caja de Name, pon IA y pincha Save to list & Close. Se vuelve a la ventana de Praat Objects y in la lista de Objects está la grabación como 1. Sound IA, así:

_images/voz_PraatObjects.png

Figura 13 Ventana de Praat Objects

Gráfico del autor.

Ahora pincha View & Edit. Se abre una ventana como está:

_images/voz_ia.png

Figura 14 Forma de onda y espectrograma de las vocales [i, a]

Gráfico del autor.

Advertencia

Si la ventana de abajo con los hercios (Hz) no aparece y en su lugar hay una línea azul, pincha Pitch y quita el cheque de Show pitch. Luego pincha Spectrum y Show spectrogram.

Como se organiza la ventana

La ventana tiene la organización de un gráfico, con dos - o en este caso, tres - ejes. El eje horizontal tiene dos divisiones en segundos, «Visible part» y «Total duration». En Figura 14 las dos tienen 0.979 segundos.

Por la izquierda hay el eje vertical. De hecho, hay dos. Por abaja está el espectrograma del sonido, o sea, el análisis del sonido en frecuencias. Tiene los limites de 0 Hz y 4000 Hz. Por arriba está la forma de onda (in. “waveform”) en números arbitrarios que representan la presión del aire.

Voy a resumir todo esto rápidamente dibujando en la ventana:

_images/voz_ia_etiquetada.png

Figura 15 Ventana de [i, a] etiquetada

Gráfico del autor.

Como escuchar el sonido

Puedes escuchar el sonido pinchando las barras de «Visible part» o «Total duration». Pero si pones el ratón o el cursor en cualquier parte del sonido y haces clic, se divide el sonido en dos en ese punto, creando una tercera nivel de medición temporal. Como antes, puedes pinchar cualquiera de las dos mitades para escuchar esa parte del sonido.

Truco

El mismo efecto se consigue con los mandatos de View, Play… y los otros parecidos.

Como recortar el sonido

Como acercar o alejar la imagen

Da la impresión de que la forma de onda es cíclica pero es difícil de ver. Para verlo mejor, puedes acercar o alejar la imagen con los botones que hay por debajo por la izquierda, in y out.

Truco

El efecto de estos botones se consigue con los mandatos de View, Zoom in and Zoom out.

Pongo el cursor al principio del sonido (0.045 s) y le doy a in dos veces y paso el slider que hay abajo a la izquierda. El resultado es éste:

_images/voz_ia_acercado.png

Figura 16 Acercamiento de [i]

Gráfico del autor.

Ahora arriba en forma de onda se ve claramente el ciclo de altibajos de la vibración de las cuerdas vocales. Además si subes al menú de Pulses y seleccionas Show pulses, Praat señala con una raya azul el máximo de cada ciclo:

_images/voz_Pulses.png

Figura 17 Acercamiento de [i] con pulsaciones en azul

Gráfico del autor.

Como hacer la segmentación de un sonido

Ahora cierra la ventana de la forma de onda, lo cual te devuelve a la ventana de Figura 13. Con «Sound ia» seleccionado, pincha Anotate -. Se abre esta ventanita:

_images/voz_Praat_ToTextGrid.png

Figura 18 Ventana de Sound to TextGrid

Gráfico del autor.

Como guardar el sonido y el TextGrid

Como abrir los ficheros

Pincha el botón Open y después Open long sound file … y navega a «t2-MuestrasDialectos.wav» para abrirlo. Aparece en la lista de Objects de Praat Objects como 1. LongSound t2-MuestrasDialectos. Vuelve a pinchar Open y después Read from file … y navega a «t2-MuestrasDialectos.TextGrid» para abrirlo. Aparece en la lista de Objects de Praat Objects como 12. TextGrid t2-MuestrasDialectos. Selecciona los dos a la vez y pincha el botón View & Edit. Se abre una ventana como ésta:

Como entender una vocal

Los formantes

La frecuencia fundamental

La frecuencia fundamental de una voz se puede ver en Praat pinchando la pestaña Pitch y seleccionando Show pitch. Se abre un segundo gráfico en la ventana de TextGrid MuestrasDialectos como ésta:

_images/PraatMuestrasF0.png

Figura 19 La frecuencia fundamental de las cinco muestras. Captura de pantalla de Praat.

Por la derecha, se ve la escala de gráfico en hercios, que aquí va de 50 Hz a 200 Hz. En el ejemplo, he seleccionado Madrid. En la escala de hercios, Praat calcula la frecuencia fundamental media de la selección, lo cual es 108.1 Hz. En la tabla siguiente, he alistado la frecuencia fundamental media de los cinco hablantes:

Tabla 36 Promedio de \(F_0\) de las cinco muestras

Muestra

Hz

Madrid

108

México DF

139

Bogotá

141

Cartagena

151

Santiago

123

Cuanto más bajo el promedio, más bajo suena el tono de la voz del hablante. ¿Estás de acuerdo que el hablante de Madrid tiene el tono de la voz más bajo y el de Cartagena lo tiene más alto?

Práctica con la identificación de tonos

La frecuencia fundamental es la base acústica de la entonación. Para ayudarte a aprender la entonación del español alteño, quiero que hagas los ejercicios de entrenamiento del oído que hay aquí: Ear training. Emplean cuatro tonos, un alto y otro bajo, tanto como uno ascendente y otro descendente. Los he puesto en una secuencia en una ventana de Praat:

_images/TonosEntrenamiento.png

Figura 20 Los cuatro tonos empleados en el «Ear Training» de Sp_ToBI.

Fuente: Captura de pantalla de Praat

Los ejercicios de entrenamiento del oído te enseñan a reconocer estos cuatro tonos solos y en varios contextos. Como verás más adelante, la entonación del español los combina de varios modos.

La sonancia

Ramas de la fonética

Tabla 37 Las ramas de la fonética

Fase del habla

articulación

transmisión

audición

Fonética

articulatoria

acústica

auditiva

Powerpoint y podcast

Están con el tema anterior.

El próximo tema

La sílaba