Szeged, 2014. január 16–17. 325 Azut´onevekeredetle´ ır´ as´ anak formaliz´ al´ asa az Ut´ on´ evport´ alon Sass B´alint, Ra´ atz Judit MTA Nyelvtudom´ anyi Int´ ezet sass.balint@nytud.mta.hu, raatz.judit@nytud.mta.hu Az MTA Nyelvtudom´anyi Int´ ezet feladata, hogy az anyak¨onyvi bejegyz´ esre alkalmasnakmin˝os´ ıtett n˝ oi ´ es f´ erfi ut´ onevek jegyz´ ek´ et kezelje, illetve b˝ ov´ ıtse. Folyamatos ig´ eny mutatkozik a mind ´ ujabb ut´ onevek felv´ etele ir´ ant, a lista ´ evente 60-70 n˝ oi ´ es 40-50 f´ erfi ut´ on´ evvel eg´ esz¨ ul ki. Az Int´ ezet ´ utj´araind´ ıtja az Ut´on´ evport´alt, melynek c´ elja, hogy a klasszi- kusLad´o-B´ ır´ o f´ ele ut´ on´ evk¨ onyv [1] ut´odjak´ ent szabadon hozz´ af´ erhet˝ ov´ e tegye az ut´onevekkel kapcsolatos k¨ oz´ erdekl˝od´ esre sz´ amot tart´ o inform´ aci´ okat a folya- matosan karbantartott ut´on´ evlist´ anak megfelel˝ oen. A port´ alh´atter´ et ad´ o nap- rak´ esz, hiteles ut´ on´ ev-adatb´ azis tartalmazza az egyes nevek ¨ osszes fontos adat´ at, bele´ ertve az aktu´ alis gyakoris´ agi ´ ert´ ekeket is. A port´al a m´ar kor´ abban is el´ erhet˝ o havi friss´ ıt´ es˝ u jegyz´ eken k´ ıv¨ ul kieg´ esz´ ıt˝ o szolg´ altat´ asokat ny´ ujt. Az adatb´azisra ´ ep¨ ul˝ o r´ eszletes keres´ esi lehet˝ os´ eg els˝osorban a n´ evad´ashoz k´ ıv´ an seg´ ıts´ eget adni, mag´ aban foglal sz´amos olyan szempontot, melyek a n´ ev- ad´askorsz´obaker¨ ulhetnek. Ilyenek: a nevek hossz´ us´ aga, sz´ otagsz´ ama, hang- rendje, n´ evnapja mellett a r´ eszletesen kidolgozott eredet- ´ es jelent´ esinform´ aci´ o, adotthangz´as´ u, ritmus´ uvagymag´anhangz´okombin´aci´ oval b´ ır´ o nevek keres´ es´ e- nek lehet˝ os´ ege, illetve a konkr´ et aktu´alis adatokra t´ amaszkod´ o gyakoris´agi ke- res´ es. A c´ el az, hogy a ut´ onevekhez tartoz´o adatok ´ ertelm¨ uk, szemantikus tartal- muk szerint legyenek kereshet˝ ok. A nevekhez j´op´ ar egyszer˝ u, explicit, atomi adat tartozik (pl. sz´ otagsz´ am, n´ evnap), ami k¨ onnyen kezelhet˝ o. Az eredetle´ ır´ as, vagyis az ut´onevek etimol´ ogi´ aja azonban nem ilyen. Itt a szabad sz¨ovegk´ ent megfogal- mazott le´ ır´ asfeldolgoz´as´ ara,azinform´aci´ o kivonatol´ as´ ara ´ es explicit megad´ as´ ara van sz¨ uks´ eg ahhoz, hogy a c´ elt megval´ os´ ıtsuk, ´ es a le´ ır´ asban megl´ ev˝ oak´arrejtett aspektusokra is k¨ ul¨on-k¨ ul¨ on r´ akereshess¨ unk. Azt a megold´ast v´alasztottuk, hogy a t¨obb mint 3500 eredetle´ ır´ as mind- egyik´ et egy szigor´ uan meghat´arozott form´alis alakra hozzuk, amely minden fon- tos tartalmi inform´aci´ ot mag´ aban foglal, ´ es melynek automatikus kezel´ ese m´ ar k´ ezenfekv˝ o. Az ¨ otlet egy kor´abbi cikkb˝ ol [2] sz´armazik, mely az etimol´ ogi´ ak for- maliz´ al´ as´araad´ altal´ anos javaslatot. A formaliz´ al´ asi elj´ ar´ as k´ et szakaszra bomlik. El˝ osz¨ or egys´ eges´ ıtett¨ uk a le´ ır´ a- sokat, azaz a k¨ ul¨ onf´ elemegfogalmaz´as´ u, de azonos jelent´ es˝ u fordulatokat egy szab´ alyalap´ u megold´ assal egys´ eges alakra hoztuk (pl.: a bec´ ez˝ oform´aja, bec´ ez˝o r¨ovid¨ ul´ ese, bec´ ez˝oalakja egyar´ ant bec´ ez˝oje -k´ ent jelenik meg). A m´ asodik szakasz a t´ enylegesformaliz´al´ as, ami val´ oj´ aban az eredetle´ ır´ asban szerepl˝ o nyelvi elemek, illetve az egyik elemet a m´ asikba alak´ ıt´ o m˝ uveletek fel- fed´ es´ et jelenti. Egy p´ elda az 1. ´abr´ anl´athat´ o.