Karma UyarmlDorusal Öngörüm KodlamasTabanl FsltlKonumadan Normal Konuma Elde Etme Sistemi Normally Phonated Speech Recovery from Whispers by MELP H. rem Türkmen, M. Elif Karslgil Bilgisayar Mühendislii Bölümü Yldz Teknik Üniversitesi {irem,elif}@ce.yildiz.edu.tr Özetçe Bu çalmada, fsltlkonumadan, konumacnn kimlii korunacak ekilde normal konumann elde edilmesine yönelik, ses protezi gibi kullanlabilecek, Karma Uyarm Dorusal Öngörü Kodlamas(KUDÖK), temelli bir sistem tasarlanmtr. Fsltlkonumadan normal konuma elde edilebilmesi için formant frekanslarve perde balants kullanlarak perde oluturulmu, formant yapsuyarlamas yaplm ve seslilik eklenmitir. Önerilen sisteminin tasarmve testi için 20 farkl konumacdan ses örnekleri alnmtr. Analiz aamasnda, fsltlseslerin, normal sesten akustik farkllklarincelenmi ve konuma parametrelerinde gerekli deiiklikler yaplarak, KUDÖK ile iyiletirilmises sentezlenmitir. Abstracts In our study, Mixed Excitation Linear Prediction (MELP) based system that reconstructs speech from whisper while preserving the individuality of a speaker's speech is developed. The proposed system can be used as speech prosthesis. To reconstruct speech from whisper, pitch generation by using the perceived pitch relationship with formant frequencies, formant and voicing modification steps were processed. To design and test the proposed system 20 speaker’s whispered speech were recorded. In the analyzing phase the acoustic differences observed between normal and whispered speech were discussed. Acoustic parameters of the whispered speech modified in order to obtain a synthetic speech that is closer to normal speech and as the last part enhanced speech is synthesized by MELP. 1. Giri Sözel iletiim, sosyal iletiimin en etkin ve efektif yollarndan biridir. Ses telleri, grtlak içinden geçen havann etkisiyle titrer ve ses çkartlmasnsalar. Fslt, iddeti ve tonu, normal konumannkine göre belirgin olarak azalm, gürültülü konuma biçimidir. Bu konuma ekli günlük yaantmzda sessizlik ve gizlilik gerektiren durumlarda ve bazsalk sorunlardolaysyla kullanlmaktadr. Normal konumann aksine fsltl konumada, nefes borusu açlr, nefesle alnan hava, nefes borusuna gönderilerek ses kayna oluturulur, ses telleri çok az titreir ya da hiç titremez. Bu çalmann amac, konuma deitirme tekniklerinden faydalanlarak, fsltdan gerçek konumann elde edilmesidir. Bu sayede, normal sesin mevcut olmad durumlarda, sesli iletiimin iyiletirilmesi için kullanlabilecek bir uygulama gelitirilebilir. Fsltlkonumann, normal konumadan farkllklarn inceleyen ve fsltdan normal ses elde edilmesine yönelik az sayda çalma yaplmtr. Icat ve Ilk, sürdürülebilir Türkçe fonemler için, fsltve normal konuma arasndaki farkllklar incelemilerdir [1]. Itoh ve Takeda, fsltlkonumann akustik özellikleri ve tannmasüzerine bir çalma yapmlardr [2]. Thomas [3] ile Higashikawa ve Nakai [4], fsltlsesler için alglanabilir perde deeri ve formant frekanslarbalantsnincelemitir. Morris ve Clements [5], fsltnn normal sese dönütürülmesi üzerine çalmlardr. Çalmalarnda, KUDÖK ile normal ses sentezleyebilmek için, perde ve seslilik özelliklerinin alabilecei deerleri tahmin etmiler ve Çizgisel Spektrum Frekans(ÇSF) uyarlamas yapmlardr. Bu çalmada, sesin analizi ve iyiletirilmesi için KUDÖK algoritmaskullanlmtr. Gelitirilen sistemde [5]’ten farkl olarak fsltlses için perde oluturmak üzere, sesin formant frekanslaryla perdesi arasndaki iliki kullanlmtr. Sistem, temel olarak üç admdan olumaktadr. Sisteme ait blok diyagram <ekil 1‘de görülmektedir. >lk admda fsltlses, KUDÖK ile analiz edilir. >kinci admda, konuma sinyalinin her çerçevesi için analiz sonunda elde edilen, perde, ses borusu ve seslilik parametreleri, fsltlsesi normal sese yaknlatracak ekilde uyarlanr. Son admda ise, uyarlanm parametreler kullanlarak yeni ses sentezlenir. 8ekil 1: FsltlSes >yiletirme Sistemi Blok Diyagram