Computational Linguistics and Chinese Language Processing Vol. 24, No. 2, December 2019, pp. 37-52 37 The Association for Computational Linguistics and Chinese Language Processing 適合漸凍人使用之語音轉換系統初步研究 Deep Neural-Network Bandwidth Extension and Denoising Voice Conversion System for ALS Patients 黃百弘 、廖元甫 、鄧廣豐 、Matúš Pleva 、Daniel Hládek Bai-Hong Huang, Yuan-Fu Liao, Guang-Feng Deng, Matúš Pleva and Daniel Hládek 摘要 漸凍人症(肌萎縮性脊隨側索硬化症,Amyotrophic lateral sclerosis, ALS) 為一種神經退化性疾病,這種疾病目前還沒有治癒的方法,並會讓漸凍人慢慢 去說話能力,最終致無法利用語音與人溝通,而去自我認同。因此,我 們需要為漸凍人建立適合其使用之語音溝通輔具(voice output communication aids, VOCAs),其是讓其能具有個人化的合成語音,即病友發病前的聲音, 以保持自我。但部分在 ALS 後期,已經不能講話的病友,都沒有事先善 保個人的錄音,最只能找出有量約 20 分鐘的低品質語音,例經 過真縮(MP3)、只保留低頻(8 kHz),或是具有強烈背景雜訊干擾 等等,以致無法建構出適合 ALS 病友使用的個人化語音合成系統。針以上 困難,本論文嘗試使用通用語音合成系統搭配語音轉換演算法,並在前級加上 語音雜訊消除( speech denoising ),後級輔以超頻模組( speech super-resolution)。以能忍有背景雜訊的錄音,並能低頻的合成語音加 國立臺北科技電子工程系 Department of Electronic Engineering, National Taipei University of Technology E-mail: tjtkng@gmail.com; yfliao@ntut.edu.tw Innovative DigiTech-Enabled Applications & Services Institute, Institute for Information Industry (III), Taipei, Taiwan E-mail: raymalddeng@iii.org.tw Department of Electronics and Multimedia Communications, Technical University of Košice, Slovakia E-mail: {matus.pleva; daniel.hladek}@tuke.sk