Szabályvezérelt nyelvi elemzők természetrajzáról On the nature of rule-driven lingual parsers Kilián Imre Pécsi Tudományegyetem, Természettudományi Kar, Információtechnológia és Biorobotika Tanszék H-7624 Pécs, Ifjúság útja 6. tel: +36-72-503600 fax: +36-72-501527 www.ttk.pte.hu kilian@gamma.ttk.pte.hu Abstract To create a rule-driven natural language parser is a real challenge. First one must specify the borders of the language itself to parse academically described written languages is easier than spoke n languages. It is again the language that determines the strategy of the parser a top-down parse r is efficient only for perfectly or nearly deterministic languages. For deeply nondeterministic languages a bottom-up parsing strategy is more efficient. The result of the parsing phase is the syntax/parse tree of the sentence, or the forest of possible parsing trees. This must be transformed to the syntax tree of the target language. The latter tree reflects the characteristics of the target language, and it is the starting point of the target language generation module. This is nothing else than a smart traversal of the resulting tree. For a sole translating task the software does not need to understand the semantic content of the task completely, but a static, and a constrained dynamic semantical evaluation capability is still necessary. Összefoglaló Szabályvezérelt természetes nyelvi elemzők létrehozása komoly kihívás. Először a nyelv határait kell meghúznunk: az akadémiai határokon belüli nyelv elemzése könnyebb, a beszélt nyelv elemzése nehezebb. Szintén a nyelv határozza meg az alkalmazható elemzőprogram stratégiáját. Felülről lefelé elemzők determinisztikus, vagy ahhoz közeli nyelvekhez alkalmazhatók. Mélyen nemdeterminisztikus nyelvekre alulról felfelé haladó elemzési stratégia a hatékonyabb. Az elemzési fázis végeredménye a mondat elemzési fája, vagy ezek egy halmaza. Ezt kell a célnyelv nyelvi fájá vá átalakítanunk, ami a célnyelvi szöveggeneráló modul kiinduló pontja. A kigenerálás lényegileg a célnyelvi fa egyfajta körüljárása. Ha szöveg fordítás a c él, akkor a szoftvernek nem kell a mondatok tartalmát tökéletesen megértenie. Ennek ellenére egy statikus, valamint egy korlátozottan dinamikus kiértékelési képességre ilyenkor is szükség van. Kulcsszavak Prolog, DCG, fa-átalakítás, természetes nyelvek elemzése 1. BEVEZETÉS Az alábbi cikk a szerző természetes nyelvi (TNY) elemző és fordító- programok tervezésének és megvalósításának terén különböző projektumokban vagy öntevékenyen szerzett tapasztalatainak egyfajta összefoglalása. Ez nem a terület valamiféle szis ztematikus fe ldolgozását jelenti , hanem csupán egyes személyes tapasztalatoknak a tárgyalását, amelyek elsősorban a Prolog programozási nyelv alkalmazásaihoz kötődnek.