A Párhuzamos Bibliakorpusz és Bibliaolvasó fejlesztése 1 Simon Eszter, Kalivoda Ágnes MTA Nyelvtudományi Intézet {simon.eszter,kalivoda.agnes}@nytud.mta.hu Kivonat: A nyelvi kulturális örökség elérhetővé tételében kulcsfontosságú szerep jut a nyelvtechnológiának, melynek módszereivel a kutatók egységes, következetes, nyelvi információval ellátott adatbázisokhoz juthatnak. A nyelvtörténészek és nyelvtechnológusok egyik legfontosabb együttműködési terepe a történeti korpuszok építése, melyek kiváló alapanyagot szolgáltatnak az elméleti kutatásoknak. A jelen cikkben bemutatott korpusz, a Párhuzamos Bibliakorpusz, az Ómagyar Korpusz anyagára támaszkodik, és tartalmazza mindazokat az ó- és középmagyar kori magyar nyelvű bibliafordításokat, amelyek abban szerepelnek. A Párhuzamos Bibliakorpuszra épülő keresőalkalmazás, a Párhuzamos Bibliaolvasó pedig kiegészíti az Ómagyar Korpuszhoz készült Régi Magyar Konkordancia nevű korpuszlekérdező felületet, ugyanis míg abban konkrét nyelvi elemekre, tulajdonságaikra és környezetükre lehet keresni, itt bibliai helyekre tudunk rákeresni és a kapott találatokon összehasonlító vizsgálatokat végezni. A Párhuzamos Bibliaolvasó elérhető a http://parallelbible.nytud.hu URL-en keresztül, míg a Párhuzamos Bibliakorpusz anyaga letölthető a https://github.com/dlt-rilmta/parallelbible GitHub repozitóriumból. A weboldal és a repozitórium tartalma angolul is olvasható. Kulcsszavak: történeti korpuszok, bibliafordítások, nyelvtörténet, összehasonlító nyelvészet, nyelvtechnológia Rövid cím: Párhuzamos Bibliakorpusz Title: Development of the Parallel Bible Corpus and Reader Abstract: Language technology is of great importance in making the linguistic cultural heritage available for researchers by creating consistent linguistically annotated databases. The most important area for the cooperation of computational and theoretical linguists is building high-quality linguistic 1 A Párhuzamos Bibliakorpusz és Bibliaolvasó a Magyar Generatív Történeti Szintaxis című projekt keretein belül készült. A projekt első része 2009 és 2013 között, a második része 2014 és 2019 között zajlott az OTKA (most: NKFI) támogatásával (NK 78074, K 112057). Mindkét projektet É. Kiss Katalin vezette. Köszönetet mondunk a projektek minden résztvevőjének, akik a szövegek feldolgozásában, valamint az adatbázisok fejlesztésében részt vettek. Külön köszönet illeti Gerőcs Mátyást és Mittelholcz Ivánt az itt bemutatott rendszer kifejlesztésében végzett munkájáért.