CИНТАКСИЧЕСКИЕ КОРРЕЛЯТЫ ПРОСОДИЧЕСКИ МАРКИРОВАННЫХ ЭЛЕМЕНТОВ ПРЕДЛОЖЕНИЯ И ИХ РОЛЬ В ЗАДАЧАХ СИНТЕЗА РЕЧИ ПО ТЕКСТУ 1 SYNTACTIC CORRELATES OF PROSODICALLY MARKED ELEMENTS OF THE SENTENCE AND THEIR ROLE IN THE TASKS OF TEXT-TO- SPEECH SYNTHESIS Л.Л.Иомдин 1 , Б.М. Лобанов 2 1 Институт проблем передачи информации РАН им А.А.Харкевича, Москва (iomdin@iitp.ru) 2 Объединенный институт проблем информатики НАН Беларуси, Минск (lobanov@newman.bas-net.by) Аннотация Работа посвящена экспериментальному исследованию возможности использования синтаксического анализа письменного текста на начальном этапе алгоритма синтеза речи по тексту. Произведена попытка установить корреляции между элементами построенной автоматически синтаксической структуры предложения в виде дерева зависимостей, и просодически выделенными элементами этого предложения. Первые результаты эксперимента показывают, что данный подход имеет хорошие перспективы. Abstract The paper describes a feasibility study of using syntactic parsing of written text at an initial stage of text-to-speech synthesis algorithm. An attempt has been made to establish correlations between the elements of an automatically created dependency tree structure of a sentence, on the one hand, and prosodically strong elements of this sentence, on the other hand. First experimental results show that the approach may be effective. Введение Синтез речи по тексту предполагает наличие автоматической процедуры формирования текущих контуров мелодии, силы звука, фонемной длительности и длительности пауз на основе анализа определенных свойств входного текста и его просодической разметки. Просодическая разметка текста заключается в его членении на синтагмы, разметке синтагм на акцентные единицы и маркировке интонационного типа синтагм в соответствии с определёнными правилами. В [1] и более подробно в [2] были описаны правила просодической разметки текста на основе его частичного синтаксического анализа (анализа словосочетаний) и указывалось, что в достаточно полной степени эта проблема может быть решена лишь с использованием глубокого синтаксического анализа. Приемлемой 1 Авторы благодарны Российскому фонду фундаментальных исследований (грант № 08-06-00373) и Белорусскому фонду фундаментальных исследований (грант № Ф08Р-016) за частичную финансовую поддержку настоящего исследования. Мы хотели бы также выразить свою признательность С.В. Кодзасову и Л.М. Захарову за предоставленную нам возможность использовать в процессе работы базу данных «Интонация русских информационных текстов».