El análisis acústico vocal - Parámetros Jitter, Shimmer y HNR
Enviado por esteban1702 • 31 de Mayo de 2016 • Ensayo • 1.689 Palabras (7 Páginas) • 2.009 Visitas
Imbachi Portilla Carolina.
aimbachi@uan.edu.co
Universidad Antonio Nariño
[1]
El análisis acústico vocal - Parámetros Jitter, Shimmer y HNR
Resumen—La emisión de la voz se debe a la acción coordinada de varios músculos, órganos y otras estructuras del abdomen, tórax, cuello y cara. En realidad, casi todo el cuerpo influye en la voz directa o indirectamente. El análisis acústico posibilita la medición indirecta de los patrones vibratorios de las cuerdas vocales, así como de la morfología de la vía vocal y de los cambios que sufre con el tiempo, además, nos ayuda a comprender mejor, el modo en que cada sujeto realiza su propia producción de habla. La necesidad de una evaluación instrumental y objetiva de la calidad de voz se refleja en el creciente número de métodos de análisis acústicos desarrollados para el diagnóstico clínico y la investigación. Al crear un algoritmo computacional que permita determinar parámetros como son Jitter (Jitta, jitter, rap y ppq5) y Shimmer (SHDB, Shim, apq3 y apq5),con los cuales se puede llegar al diagnóstico de algunas patologías que suelen afectar la voz de las personas.
Palabras clave—análisis de la voz, amplitud, frecuencia, jitta, jitter, shimmer.
Abstract— The issue of the voice is due to the coordinated action of several muscles, organs and other structures in the abdomen, chest, neck and face. In fact, most of the body influences directly or indirectly voice. The acoustic analysis enables the indirect measurement of the vibrational patterns of the vocal cords, as well as the morphology of the vocal track and changes that occur over time also helps us to understand better how each subject performs his own speech production. The need for instrumental and objective voice quality evaluation is reflected in the increasing number of acoustic analysis methods developed for clinical diagnosis and research. By creating a computational algorithm to determine parameters such as Jitter are (Jitta, jitter, rap and ppq5) and Shimmer (SHDB, Shim, apq3 and apq5), with which you can reach the diagnosis of certain diseases that often affect voice people.
- Introduccion
El presente trabajo tiene como telón de fondo el estudio de la señal de voz en Procesamiento de Señales, y tiene como principal objetivo hacer el diagnóstico de patologías laríngeas automática. A partir de la señal de voz es posible extraer un conjunto de parámetros de la voz. Por lo tanto, es posible detectar patologías de las cuerdas vocales en los individuos mediante la comparación de los datos de los pacientes con patología determinada con los datos de las personas consideradas con voz rica.
Los trastornos de la voz pueden ser perceptibles por el análisis de varios parámetros de la señal acústica. En el campo de la medicina diversas técnicas se han utilizado para evaluar la calidad de la voz del paciente.
Los parámetros obtenidos por el análisis acústico tienen la ventaja de dar una descripción de la voz objetiva.
Con la existencia de bases de datos normativos que caracterizan la calidad de voz o el uso de herramientas inteligentes que combinan varios parámetros, es posible distinguir entre la voz normal y patológico o incluso identificar o sugerir la patología.
Actualmente, los parámetros acústicos usados comúnmente en aplicaciones de análisis acústico, así como la mayor parte referenciada en la literatura, son la frecuencia fundamental, jitter, shimmer y HNR. La frecuencia fundamental (F0), medida en Hertz, se define como el número de veces que una onda de sonido producido por las cuerdas vocales se repite durante un período de tiempo dado. También es el número de ciclos de apertura / cierre de la glotis.
Jitter se define como el parámetro de variación de la frecuencia de ciclo a ciclo, y el shimmer (brillo) se refiere a la variación de la amplitud de la onda de sonido.
[pic 1]Figura 1: Representación de las agitaciones y resplandores débiles medidas de perturbación en señal de voz.
El HNR es una evaluación de la relación entre los componentes periódicos y componentes no periódicos que comprende un segmento de voz sonora, como Murphy y Akande. El primer componente se deriva de la vibración de las cuerdas vocales y la segunda sigue del ruido glotal, expresada en dB. La evaluación entre los dos componentes refleja la eficiencia de expresión, es decir, mayor es el flujo de aire expulsado de los pulmones en energía de la vibración de las cuerdas vocales. En estos casos el HNR será mayor. Un sonido de voz es, pues, caracterizado por un alto HNR. Un HNR bajo denota una voz asténica y disfonía. Es decir, con un valor de menos de 7 dB en HNR se considera patológico.
- materiales y metodos
Para llevar a cabo esta practica fueron utilizados los siguientes materiales :
- Grabadora de sonido.
- Convertidor de sonido(formato wav)
- Computador con el software(matlab)
- Persona para la reproducción de la voz, sexo femenino con 23 años de edad.
Para crear el algoritmo que permitiera encontrar los parámetros deseados que son el jitter y shimmer se utilizó como apoyo las formulas aplicables para de esa manera encontrar los valores de cada uno:
- JITTER:
Jitter (local, absoluto): Representa la diferencia absoluta media entre dos períodos consecutivos y es conocido como Jitta.
[pic 2]
Jitter (local): Representa la diferencia absoluta media entre dos períodos consecutivos, dividido por el periodo medio. Se conoce como chorro y tiene 1,04% como el límite de umbral para la detección de patologías. Donde Ti es la duración en segundos de cada período y N es el número de períodos.
[pic 3]
Jitter (rap): Representa la media de la perturbación, es decir, la diferencia absoluta media de un periodo y la media del período con sus dos vecinos, dividido por el periodo medio. El valor de umbral para detectar patologías es de 0,68%.
[pic 4]
Jitter (ppq5): Representa la relación de perturbación dentro de los cinco períodos, es decir, la diferencia absoluta media entre un período y el medio, que contienen sus cuatro períodos vecinos más cercanos, es decir, dos anteriores y dos períodos posteriores, divididas por período de media.
...