42 Екстракція знань та інформаційний пошук при формуванні електронної енциклопедії Павло Жежнич, Марія Гірняк Кафедра інформаційних систем та мереж, Національний університет «Львівська політехніка», УКРАЇНА, м. Львів, вул. С. Бандери, 12; e-mail: mhirnyak@ukr.net Abstract − this paper dwells on the issue about the knowledge extraction in contrast to the information retrieval; it is given a range of advantages and disadvantages of them.The process of both of them concerns the open texts. Ключові слова – екстракція знань, інформаційний пошук, енциклопедична стаття, інформаційне наповнення, відкритий текст. I. Вступ На сьогодні більшість людей послуговується інформацією із електронних енциклопедій, оскільки у них матеріал подається із вивірених джерел та у стислій і лаконічній формі. Таким чином, основний момент при формуванні електронної енциклопедії – інформаційне наповнення. II. Способи інформаційного наповнення електронної енциклопедії Існує два способи надання необхідної інформації у процесі інформаційного наповнення електронної енциклопедії: пошук інформації (на вході − пошук тексту в пошукових системах (Google, Yandex); на виході − множина відкритих текстів з предметної області, що містить окремі слова запиту); екстракція знань (на вході − аналіз відкритих текстів; на виході − екстракція інформаційних уривків у вигляді фіксованого формату з однозначними даними). Так, різниця між інформаційним пошуком та екстракцією інформації є дуже вагомою, оскільки після пошуку інформації розробник електронної енциклопедії повинен самостійно вилучати відповідну необхідну інформацію. Екстракція інформації передбачає, в деякій мірі, напівавтоматизований процес інформаційного наповнення. Однак, є деякі переваги і недоліки екстракції інформації у порівнянні із пошуком інформації. Що стосується переваг, слід відзначити такі: ретельне та доречне скорочення текстової інформації з добіркою лише необхідної інформації і, в свою чергу, зменшення затрат часу на перечитування цілих текстів; зручна обробка із врахуванням