VI Congreso de la Sociedad Cubana de Bioingeniería Habana 2005 ISBN 959-212-158-3, Copyright 2005, Sociedad Cubana de Bioingeniería, artículo T025 DETECCION AUTOMATICA DE CONSONANTES FRICATIVAS E. González, C. Ferrer, M. Hernández-Díaz Centro de Estudios de Electrónica y Tecnologías de la Información (CEETI) Universidad Central “Marta Abreu” de Las Villas, Carretera a Camajuaní, Km 5½, SC, VC, Cuba. e-mail: moreira@uclv.edu.cu RESUMEN Los pacientes con labio paladar hendido presentan desordenes del habla que los caracterizan. Entre estos se pueden mencionar la nasalidad, el golpe glótico y las dificultades con oclusivas labiales y con fricativas. En el presente trabajo se propone un método para la detección automática de consonantes fricativas basado en las características acústicas-fonéticas de las mismas. Algunas características acústicas descritas en la literatura como nivel de periodicidad y forma y duración espectral, son analizadas y otras nuevas son propuestas. El sistema se basa en la extracción de parámetros tales como sonoridad y energía. Se utilizaron 100 grabaciones de diferentes personas con diferencias en sexo, edad y niveles relación señal a ruido. El método logra una alta sensibilidad, factor clave en el rendimiento del futuro clasificador el cual constituirá una herramienta para el análisis y rehabilitación de pacientes con afecciones velofaríngeas. Palabras clave: labio paladar hendido, fricativas, características acusticas. 1. INTRODUCCIÓN Las consonantes representan sonidos del habla que generalmente poseen una Característica de Amplitud – Frecuencia (CAF) influenciadas por presentar el tracto vocal un mayor grado de constricción que las vocales. Algunas requieren de movimientos dinámicos precisos de los órganos articuladores para su producción y otras consonantes, sin embargo, pueden no requerir movimiento articulatorio para que su sonido, como las vocales, sea sostenido. Este es el caso de las fricativas /s, z, f, j, ch/. Desde mediados del siglo pasado varios estudios han investigado las características de las consonantes fricativas, tal es el caso de [4], [5]. Usando experimentos con voces simuladas, análisis de sílabas y experimentos de reconocimientos, estos estudios nos ofrecen datos sobre las características acústicas de las fricativas. Sin embargo están basados en un pequeño conjunto de señales. Estudios posteriores [4], [6], [6] han aumentado nuestros conocimientos sobre las fricativas. Sin embargo, excepto por unos pocos estudios, las características acústicas que existen en la literatura son dependientes del hablante. Algunos estudios más recientes [1], [7], [8] han intentado solucionar este problema. El hecho de desarrollar una herramienta capaz de evaluar si estas consonantes fueron o no bien articuladas, puede contribuir al desarrollo de métodos objetivos y científicos en la evaluación y seguimiento de pacientes con problemas de hipernasalidad y otros que con frecuencia afectan el desarrollo del lenguaje en la niñez. La existencia de una hendidura facial en el niño requiere un plan terapéutico a largo plazo. Tanto el tratamiento como la rehabilitación comienzan ya tras el nacimiento, y muchos de los pacientes continúan con algún tipo de terapia hasta la adolescencia o la juventud. Las secuelas de la fisura palatina incluyen problemas en la alimentación y en la nutrición, infecciones otológicas recurrentes que pueden desencadenar una pérdida de la audición, producción anormal del lenguaje y una alteración del crecimiento facial. Pero la discapacidad principal en los pacientes con fisura palatina es la disfunción del habla, fundamentalmente en forma de hipernasalidad o escape del sonido a la cavidad nasal durante la producción de múltiples consonantes y vocales, que llega a alterar la inteligibilidad del lenguaje. Dado que la dificultad para articular fricativas y africados como /s/ /ch/ es un indicativo de insuficiencia velofaríngea, en este trabajo tenemos como objetivo el desarrollo e implementación de un algoritmo para la detección automática de consonantes fricativas en señales reales el cual constituirá la base para la creación de un sistema para el reconocimiento de consonantes fricativas. El mismo podrá ser empleado, como elemento de realimentación y documentación de la evolución, en al rehabilitación de pacientes con trastornos de labio paladar hendido. 2. METODOLOGÍA El sistema desarrollado fue validado usando 100 grabaciones de diferentes individuos sanos en las que aparecían gran número de consonantes fricativas (“fácil”, “choza”, “casa”). En la muestra de personas tomadas existía variedad de sexo y edad lo cual brinda mayor robustez al método. Para la implementación de los algoritmos de procesamiento digital de señal se utilizó la versión 7.0 de MatLab y los mismos son descritos a continuación. Nivel de Energía. En la literatura se plantea que la duración de un segmento fricativo es de aproximadamente 100 ms dependiendo de la consonante y del hablante. En nuestro