UIGV 99 COMTEL 2012 V Congreso Internacional de Computación y Telecomunicaciones Analizador morfológico de la lengua quechua basado en software libre helsinkifinite-statetransducer (hfst) Hugo David CalderonVilca, Flor Cagniy Cárdenas Mariñó, Edwin FredyMamani Calderon hdcalderon@gmail.com, clavelyfcm@gmail.com, mcedwin@gmail.com Universidad Nacional Micaela Bastidas de Apurímac, Perú Av. Arenas Nº 121 Abancay-Perú Universidad Nacional del Altiplano Puno, Perú Av. Sesquecentenario Nº 1150 Puno-Perú Resumen: En esta investigación, se presenta la creación de un analizador morfológico para la lengua quechua basado en software libre Helsinki Finite-StateTransducer (HFST). La tecnología HFST un transductor de estado finito ha sido usado como analizador morfológico en los idiomas del lado europeo: Inglés, Finlandés, Francés, Alemán, Italiano, Sueco, Turco, entre otros. Por otro lado, quechua es una lengua aglutinante, diferente a las lenguas europeas, por lo que en esta investigación se experimenta la adaptación de la tecnología HFST como herramienta de análisis morfológico, la misma que será un módulo y parte del sistema de traducción automática entre español y quechua en la plataforma Apertium. Para el experimento, se elige el Quechua del Este de Apurímac (qve), creando un diccionario LEXC compatible con HFST, definiendo lexicones para cada categoría gramatical, lexicones para cada sufijo, insertando más de 2000 palabras, entre raíces, adjetivos, verbos, adverbios y otras categorías gramaticales. Se compila el diccionario monolingüe del quechua tanto para el analizador morfológico como para su generación de palabras. Finalmente, como resultado se tiene el analizador morfológico (qve), se realiza las pruebas con entradas de palabras aglutinadas, teniendo como salida la palabra raíz y una serie de <etiquetas> que representan categorías gramaticales de los sufijos que lo acompañan. Palabras clave: Análisis morfológico, quechua, HFST, traductor automático, software libre. Abstract: This research presents the creation of a morphological analyzer for the Quechua language based on free software Helsinki Finite-State Transducer (HFST). HFST Technology finite state transducer has been used as a morphological analyzer tool in the languages of Europe side: English, Finnish, French, German, Italian, Swedish, Turkish and others. On the other hand Quechua is an agglutinative language that is different from European languages, that is why, in this research it is experimented the adaptation on of the HFST technology, it will be a module and part automatic translation system between Spanish and Quechua on the platform Apertium. For the experiment it has been choosen the Apurimac Quechua East (qve), creating a dictionary LEXC with support HFST, defined lexicons for each grammatical category, lexicons for each suffix, inserting more than 2000 words between roots, adjectives, verbs, adverbs and other categories grammatical. Monolingual dictionary is compiled for morphological analyzer as for generating words, finally as resulted has had the morphological analyzer (qve), testing is performed with agglutinated word entries having as output the root word and a series of grammatical categories <marks> representing the suffixes that accompany it. Keywords: Morphological analysis.quechua, HFST, machine translator, free software. 1 Introducción Ante la existencia de múltiples culturas e idiomas se han desarrollado traductores automáticos como aplicación del procesamiento de lenguaje natural que aportan significativamente en el mundo de la informática permitiendo al ser humano comprender e interrelacionarse con sus semejantes mediante la traducción de textos o habla de un lenguaje natural a otro. Sin embargo, dichos avances, como los traductores automáticos, poco trascienden todavía en las minoritarias como el quechua. Por lo que en el camino de desarrollo e implementación de un traductor automático entre español y quechua es imprescindible el subsistema analizador morfológico en este caso el de quechua. Por eso en esta investigación, se experimenta la implementación de una analizador morfológico para la lengua quechua basado en el software libre Helsinki Finite-StateTransducer, una máquina de estado finito y un conjunto de herramientas para aplicaciones de analizadores morfológicos inicialmente usada para idiomas del lado europeo, tales como: Inglés, Finlandés, Francés, Alemán, Italiano, Sueco, Turco, entre otros. El aporte fundamental de este trabajo de investigación es averiguar si el sistema HFST es funcional como herramienta de análisis morfológico de la lengua quechua camino a construir traductores automáticos con la lengua quechua. Por ende, esto complementará a las investigaciones de la lingüística quechua, tanto para estudiantes, como para profesionales e investigadores, quienes tendrían la posibilidad de obtener el resultado del análisis morfológico de esta lengua. Asimismo, la investigación busca la reivindicación de esta lengua que cumple un papel trascendental como vehículo de expresión y pensamiento. Durante el experimento, se implementa el diccionario morfológico de la lengua quechua en un fichero LEXC Memoria COMTEL 2012 lista.pdf 16/10/2013 09:32:47 a.m. - 99 - ( )