Un Enfoque Integrado para la Desambiguaci´on
*
Jordi Atserias i Batalla
TALP Research Center
Jordi Girona Salgado, 1-3.
08034 Barcelona
{batalla}@lsi.upc.edu
Resumen: En este art´ ıculo presentamos una extensi´ on de una arquitectura in-
tegrada dise˜ nada originalmente para Semantic Parsing a WSD. El marco propuesto
permitir´ a que ambas tareas puedan colaborar y llevarse a cabo simult´ aneamente. Se
ha probado la validez y robustez de esta arquitectura contra una tarea de WSD bien
definida (el SENSEVAL-II English Lexical Sample) aplicando modelos sint´ actico-
sem´ anticos adquiridos autom´ aticamente.
Palabras clave: Arquitecturas integradas para el PLN, WSD, Semantic Parsing
Abstract: This paper presents an extension for WSD of an integrated arquitecture
disigned for Semantic Parsing. In the proposed framework, both tasks could be
adressed simultaneously, colaborating between them. The feasibility and robustness
of the proposed arquitecture have been proved against a well-defined task on WSD
(the SENSEVAL-II English Lexical Sample) using automatically acquired models.
Keywords: Integrated Arquitectures for NLP, WSD, Semantic Parsing
1. Introducci´ on
La mayor´ ıa de las diferentes tareas inclu-
idas en el PLN, como la desambiguaci´ on de
sentidos (WSD), la extracci´ on de informaci´ on
(IE), la b´ usqueda de respuestas (QA) o la tra-
ducci´ on autom´ atica aplican diferentes niveles
de comprensi´ on del lenguaje (NLU).
La comunidad del PLN se ha centra-
do en los ´ ultimos a˜ nos en la evaluaci´ on de
diferentes tareas, tales como WSD (SENSE-
VAL
1
), parsing (PARSEVAL), IE (MUCs) y
IR (TRECs). Para mejorar no s´ olo los resul-
tados en estas tareas sino en la comprensi´ on
del lenguaje en general, es necesario abordar
los interrogantes que han aparecido en es-
tas competiciones, tales como: la integraci´ on
de diferente tipos de conocimiento, la inte-
graci´ on de los diferentes procesos dentro del
PLN, el uso de ontolog´ ıas, el razonamiento o
el multiling¨ uismo.
El objetivo de este trabajo es explorar el
uso de nuevas arquitecturas para la compren-
si´ on del lenguaje, que sean lo m´ as robustas y
flexibles posibles y que intenten abordar con
nuevos enfoques estas problem´ aticas. El tra-
bajo que se presenta se enmarca dentro de
*
El autor quiere agradecer la ayuda de Eli Comelles
as´ ı como los comentarios de los revisores.
1
http://www.senseval.org/
uno de los pasos fundamentales en NLU, la
Interpretaci´ on Sem´ antica. Nuestro objetivo a
medio plazo es la integraci´ on de dos de las
etapas de la interpretaci´ on sem´ antica: La De-
sambiguaci´ on de Sentidos (WSD) y el An´ ali-
sis Sem´ antico (Semantic Parsing).
El WSD consiste en determinar el senti-
do de una palabra dado el contexto en que
aparece. Normalmente los sentidos posibles
de una palabra se definen en un reposito-
rio de sentidos, siendo WordNet (Fellbaum,
1998) el de facto est´ andar. Por otro lado, el
Semantic Parsing conlleva la identificaci´ on
de los roles sem´ anticos de las entidades, (p.e.
Agente) (Brill y Mooney, 1997). Este proce-
so es conocido como Semantic Role Labeling
y a sido objetivo de las shared tasks de los
recientes SENSEVAL y CONLL
2
.
En este art´ ıculo aplicaremos una arquitec-
tura integrada a la tarea de WSD que ya ha
sido aplicada con anterioridad al Semantic
Parsing (Atserias, Padr´ o, y Rigau, 2001).
2. Semantic Parsing y WSD
Aunque el WSD y el Semantic Parsing
est´ an fuertemente ligados, tradicionalmente,
la mayor´ ıa de sistemas los tratan por separa-
do. Parad´ ojicamente, el WSD puede mejorar
2
http://www.cnts.ua.ac.be/conll/
Procesamiento del Lenguaje Natural, núm. 35 (2005), pp. 179-186 recibido 27-04-2005; aceptado 01-06-2005
ISSN: 1135-5948 © 2005 Sociedad Española para el Procesamiento del Lenguaje Natural