Илья АФАНАСЬЕВ Корпус старославянского языка: недостающее звено в диахронической славистике 10.15452/SlavicaIuvenum.XXI.02 13 Илья АФАНАСЬЕВ КОРПУС СТАРОСЛАВЯНСКОГО ЯЗЫКА: НЕДОСТАЮЩЕЕ ЗВЕНО В ДИАХРОНИЧЕСКОЙ СЛАВИСТИКЕ The Old Church Slavonic Corpus: a Missing Link in Historical Slavic Studies Keywords: corpus linguistics, Slavic studies, Old Church Slavonic corpus, tokenization, historical linguistics, Old Church Slavonic Contact: СПбГУ; st079549@student.spbu.ru 1 Предпосылки создания 1.1 Постановка проблемы Исследование концептуальной оппозиции «свой – чужой» в старославянском языке активно продолжается на протяжении долгих лет (Вендина 2002: 38). Тем не менее, в ходе непосредственного изучения возникает проблема, связанная с источниками. А именно: основными являются словарь под ред. Й. Курца, начавший издаваться в середине XX в. (Kurz 1954), и словарь под ред. Р. М. Цейтлин, Э. Вечерки и Э. Благовой, вышедший в один год с последним томом словаря под ред. Й. Курца (Цейтлин и др. 1994). Изучение концептуальной оппозиции, объекта, очень тесно связанного с живой речью и пониманием мира, «Weltanschaung» (Kant 2008: 99), по описанию лексики языка – занятие затруднительное. Верно, что в обоих словарях авторы стараются дать достаточное количество контекстов, однако иногда тех не хватает для полноценного установления принадлежности слова к концептуальной оппозиции «свой – чужой». Обычно в такой ситуации во многих других языках возможно обратиться к корпусу для расширения нужного контекста или просмотра дополнительных. Однако исследователь старославянского языка ограничен и здесь. Ряд существующих корпусов не включают в себя полного объема текстов (PROIEL) (Общежитие). Большая часть текстов представлены как raw text (загруженные на сервер обычные .txt-файлы), что оставляет единственным инструментом поиска уже встроенный в браузер или текстовый редактор: зависит от программы, которой исследователь открывает файл (TITUS). В конце концов, в самом полном корпусе тексты закодированы в ASCII, а не Unicode: используется латинский