Вестник Евразийской науки The Eurasian Scientific Journal 2019, №2, Том 11 2019, No 2, Vol 11 ISSN 2588-0101 https://esj.today Страница 1 из 11 102ITVN219 Издательство «Мир науки» \ Publishing company «World of science» http://izd-mn.com Вестник Евразийской науки / The Eurasian Scientific Journal https://esj.today 2019, 2, Том 11 / 2019, No 2, Vol 11 https://esj.today/issue-2-2019.html URL статьи: https://esj.today/PDF/102ITVN219.pdf Ссылка для цитирования этой статьи: Хлопотов М.В., Старцева Н.В., Макаренко А.А. Исследование кластеров кинолюбителей и их тематических сообществ в социальных сетях // Вестник Евразийской науки, 2019 2, https://esj.today/PDF/102ITVN219.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. For citation: Khlopotov M.V., Startseva N.V., Makarenko A.A. (2019). Analysis of movie lovers’ preferences and their thematic communities in social networks. The Eurasian Scientific Journal, [online] 2(11). Available at: https://esj.today/PDF/102ITVN219.pdf (in Russian) УДК 004 Хлопотов Максим Валерьевич ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики», Санкт-Петербург, Россия Доцент Кандидат технических наук E-mail: khlopotov@corp.ifmo.ru Старцева Наталья Владимировна ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики», Санкт-Петербург, Россия Магистрант E-mail: st.natalie.eilatan@gmail.com SCOPUS: http://www.scopus.com/authid/detail.url?authorId=57195920234 Макаренко Анастасия Александровна ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики», Санкт-Петербург, Россия Магистрант E-mail: AnastasiaMakarenko95@yandex.ru Исследование кластеров кинолюбителей и их тематических сообществ в социальных сетях Аннотация. В статье описано исследование предпочтений наиболее активных пользователей «Кинопоиска» и процесс выявления их взаимосвязей с тематическими сообществами таких пользователей в сети «ВКонтакте». Для проведения исследования были собраны данные об оценках кинолюбителей на сайте «Кинопоиск». Были использованы лишь оценки для недавно вышедших картин для поддержания актуальности данных. Более десяти тысяч полученных профилей пользователей были поделены на группы с помощью различных алгоритмов кластеризации. Для определения оптимального числа кластеров был использован пакет NbClust, применяющий 30 разных методов для определения количества подгрупп данных. Большинство алгоритмов выбора оптимального числа кластеров выбрали число 3 как наилучший вариант. Для измерения эффективности кластеризации была использована метрика силуэта. Данная метрика показала, что наиболее эффективным алгоритмом является алгоритм k-средних. Таким образом, итоговая модель кластеризации делила набор данных на 3 группы и была построена при помощи k-средних.