Patrons Rythmiques et Genres Littéraires en Synthèse de Parole Elisabeth Delais-Roussarie 1 , Damien Lolive 2 , Hiyon Yoo 1 et David Guennec 2 (1) LLF - UMR 7110 & Université Paris-Diderot, France (2) IRISA - UMR 6074, Université Rennes 1, France elisabeth.roussarie@wanadoo.fr, damien.lolive@irisa.fr, yoo@linguist.univ-paris-diderot.fr, david.guennec@irisa.fr RÉSUMÉ Ces vingt dernières années, la qualité de la parole synthétique s’est améliorée grâce notamment à l’émergence de nouvelles techniques comme la synthèse par corpus. Mais les patrons rythmiques obtenus ne sont pas toujours perçus comme très naturels. Dans ce papier, nous comparons les patrons rythmiques observés en parole naturelle et synthétique pour trois genres littéraires. Le but de ce travail est d’étudier comment le rythme pourrait être amélioré en synthèse de parole. La comparaison des patrons rythmiques est réalisée grâce à une analyse de la durée relativement à la structure prosodique, les données audio provenant de six comptines, quatre poèmes et deux extraits de conte. Les résultats obtenus laissent penser que les différences rythmiques entre parole naturelle et synthétique sont principalement dues au marquage de la structure prosodique, particulièrement au niveau des groupes intonatifs. De fait, le taux d’allongement des syllabes accentuées en fin de groupes intonatifs est beaucoup plus important en synthèse que dans la parole naturelle. ABSTRACT How to improve rhythmic patterns according to literary genre in synthesized speech * . In the last twenty years, the quality of synthesized speech has greatly improved with the emergence of new TTS techniques, including corpus-based synthesis systems. Yet the rhythmic patterns obtained do not always sound very natural. In this paper, we compare the rhythmic patterns observed in natural and synthesized speech for three literary forms. The aim of the study is to evaluate how rhythm could be improved in synthesized speech. The comparison of the rhythmic patterns is done by analyzing duration in relation to prosodic structure on a set of texts (six rhymes, four poems and two extracts from fairy tales). This approach allows showing that rhythmic differences between synthesized and natural speech are mostly due to the marking of prosodic structure, especially at the level of the intonational phrase. The lengthening rate for accented syllables located at the end of IPs is much more important in synthesized speech than in natural speech. MOTS - CLÉS : Patrons rythmiques, phonogenre, synthèse de la parole, structure prosodique. KEYWORDS: Rhythmic patterns, phono-genre, speech synthesis, prosodic structure.. 1 Introduction Ces dernières décennies, la qualité globale de la parole synthétisée s’est améliorée de façon notable avec l’émergence de nouvelles techniques de synthèse comme la synthèse par corpus (Sagisaka, 1988; Hunt & Black, 1996). Néanmoins, générer une prosodie naturelle qui tienne compte des genres et *. Cet article est tiré d’une publication par les mêmes auteurs à la conférence Speech Prosody 2016. Actes de la conférence conjointe JEP-TALN-RECITAL 2016, volume 1 : JEP 446