Рубрика Сборника (окончательно выбирается редактором) УДК 004.738.5:519.7 ББК 32.973-22.18 АДАПТИВНЫЙ КРАУЛЕР ДЛЯ ПОИСКА ВНЕШНИХ ГИПЕРССЫЛОК Печников А. А. 1 , (Учреждение Российской академии наук Институт прикладных математических исследований КарНЦ РАН, Петрозаводск) Чернобровкин Д. И. 2 (Факультет прикладной математики-процессов управле- ния Санкт-Петербургского государственного универси- тета, Санкт-Петербург) Описывается поисковый робот (краулер), предназначенный для сбора информации об исходящих гиперссылках с задаваемого множества сайтов, относящихся к одной тематике. Адап- тивное поведение краулера сформулировано в терминах задачи о многоруком бандите. Проведенные эксперименты показыва- ют, что выбор адаптивного алгоритма рационального поведе- ния краулера зависит от тематики множества сайтов. Ключевые слова: гиперссылка, поисковый робот, адаптивное поведение, задача о многоруком бандите, индексы Гиттинса. 1. Введение Концептуальная модель фрагмента Веба [2] строится на ос- нове задаваемого множества веб-сайтов, относящихся к одной тематике и являющихся регламентируемыми, т.е. создающимися и развивающимися по заранее сформулированным правилам, утвержденным в виде нормативных документов организаций- 1 Андрей Анатольевич Печников, доктор технических наук, доцент (pechnikov@krc.karelia.ru). 2 Денис Игоревич Чернобровкин, аспирант (denis_univer@mail.com). 1