42 Екстракція знань та інформаційний пошук при формуванні електронної енциклопедії Павло Жежнич, Марія Гірняк Кафедра інформаційних систем та мереж, Національний університет «Львівська політехніка», УКРАЇНА, м. Львів, вул. С. Бандери, 12; e-mail: mhirnyak@ukr.net Abstract − this paper dwells on the issue about the knowledge extraction in contrast to the information retrieval; it is given a range of advantages and disadvantages of them.The process of both of them concerns the open texts. Ключові слова екстракція знань, інформаційний пошук, енциклопедична стаття, інформаційне наповнення, відкритий текст. I. Вступ На сьогодні більшість людей послуговується інформацією із електронних енциклопедій, оскільки у них матеріал подається із вивірених джерел та у стислій і лаконічній формі. Таким чином, основний момент при формуванні електронної енциклопедії – інформаційне наповнення. II. Способи інформаційного наповнення електронної енциклопедії Існує два способи надання необхідної інформації у процесі інформаційного наповнення електронної енциклопедії: пошук інформації (на вході − пошук тексту в пошукових системах (Google, Yandex); на виході − множина відкритих текстів з предметної області, що містить окремі слова запиту); екстракція знань (на вході − аналіз відкритих текстів; на виході − екстракція інформаційних уривків у вигляді фіксованого формату з однозначними даними). Так, різниця між інформаційним пошуком та екстракцією інформації є дуже вагомою, оскільки після пошуку інформації розробник електронної енциклопедії повинен самостійно вилучати відповідну необхідну інформацію. Екстракція інформації передбачає, в деякій мірі, напівавтоматизований процес інформаційного наповнення. Однак, є деякі переваги і недоліки екстракції інформації у порівнянні із пошуком інформації. Що стосується переваг, слід відзначити такі: ретельне та доречне скорочення текстової інформації з добіркою лише необхідної інформації і, в свою чергу, зменшення затрат часу на перечитування цілих текстів; зручна обробка із врахуванням