1 VISUALISASI PENGENALAN UCAPAN VOKAL BAHASA INDONESIA DENGAN METODE LPC-DTW Syaiful Rachman (L2F001644) Jurusan Teknik Elektro, Fakultas Teknik Universitas Diponegoro Semarang, Indonesia Ipoelteknik2001@yahoo.com Abstrak- Usaha manusia untuk memaksimalkan fungsi PC sebagai alat untuk mempermudah pekerjaan manusia terus dikembangkan. Salah satunya menciptakan PC yang mampu berinteraksi secara langsung dengan manusia melalui ucapan, menggantikan fungsi keyboard dan mouse pada PC. Berdasarkan hal ini berkembanglah studi tentang pengenalan suara digital. Untuk dapat mengenali kata-kata dalam lingkup yang luas perlu penelitian terhadap elemen penyusun kata yaitu vokal. Visualisasi terhadap pengenalan ucapan berguna bagi seseorang yang ingin mempelajari dan memahami proses pengenalan ucapan dengan metode tertentu. Untuk itu pada tugas akhir ini divisualisasikan proses pengenalan ucapan vokal dalam Bahasa Indonesia yakni /a/, /i/, /u/, /e/, dan /o/ menggunakan metode LPC-DTW. Visualisasi yang dilakukan adalah visualisasi hasil ekstraksi ciri dari metode LPC berupa nilai koefisien-koefisien cepstral LPC, dan juga visualisasi pengenalan pola menggunakan DTW melalui suatu matrik yang dinamakan matrik distorsi. Ada beberapa hasil yang diperoleh dari penelitian yang dilakukan. Koefisien-koefisien cepstral LPC dapat digunakan untuk mewakili sinyal ucapan dalam proses pengenalan pola DTW. Panjang frame yang digunakan dalam pembingkaian suatu sinyal ucapan mempengaruhi jumlah frame yang dihasilkan dari analisis LPC. Pencocokan waktu yang digunakan oleh metode DTW untuk mengatasi adanya variasi yang terjadi pengucapan suatu vokal dapat digambarkan melalui jalur terbaik. Jalur terbaik dari vokal yang dikenali berbentuk diagonal dan akan berupa garis diagonal sempurna apabila 2 buah pola yang dicocokan identik. Kata kunci: ucapan, pengenalan, DTW, visualisasi I. Pendahuluan 1.1 Latar Belakang Teknologi pengenalan ucapan dikembangkan untuk mewujudkan keinginan manusia dalam memaksimalkan fungsi PC sebagai alat yang mampu mempermudah pekerjaan manusia di segala aspek. Hal yang hendak dicapai adalah menciptakan PC yang mampu berinteraksi dengan manusia secara langsung menggunakan bahasa manusia sehari-hari sesuai tata bahasa yang berlaku. Studi tentang pengenalan ucapan sudah dilakukan selama bertahun-tahun untuk mencapai sukses yang ideal, tetapi hal tersebut belum juga dapat terpenuhi sampai saat ini. Masih perlu dilakukan penelitian dan peningkatan lebih lanjut terhadap metode pengenalan yang sudah ada. Untuk dapat mengenali kata-kata dalam lingkup yang luas maka perlu penelitian terhadap penyusun kata yakni vokal. Dalam Tata Bahasa Indonesia terdapat lima buah vokal yakni: /a/, /i/, /u/, /e/, /o/. Kelimanya memiliki cara pengucapan berbeda yang menghasilkan ciri sinyal yang berbeda pula. Untuk itu pada tugas akhir ini divisualisasikan proses pengenalan terhadap kelima buah vokal ini, dengan metode LPC (Linear Predictive Coding) sebagai pengektraksi ciri dan DTW (Dynamic Time Warping) sebagai pengenal pola. Visualisasi proses pengenalan ini bermanfaat untuk mempermudah bagi orang yang ingin mempelajari dan memahami proses pengenalan ucapan dengan menggunakan metode LPC dan DTW. 1.2 Tujuan Tugas akhir ini bertujuan untuk melakukan visualisasi terhadap proses pengenalan ucapan vokal yang ada dalam Tata Bahasa Indonesia yakni: /a/, /i/, /u/, /e/, /o/, dengan menggunakan metode LPC dan DTW. 1.3 Pembatasan Masalah Tugas akhir ini memiliki batasan-batasan antara lain : 1. Pengenalan ucapan bersifat speaker dependent. Pengenalan dapat dilakukan dengan baik terhadap orang yang telah memiliki referensi. 2. Merupakan pengenalan vokal /a/, /i/, /u/, /e/, /o/. 3. Metode ekstraksi ciri yang digunakan dalam tugas akhir ini adalah LPC. 4. Metode pengenalan pola yang dipakai untuk tugas akhir ini adalah DTW. II. Landasan Teori 2.1 Pengenalan Suara Digital Proses pengenalan ucapan pada program komputer terdiri atas beberapa tahap. Gambar 1 memperlihatkan gambaran secara umum tahapan-tahapan pengenalan suara. Gambar 1 Tahapan dalam pengenalan ucapan. Tahap pertama dari pengenalan ucapan adalah pemrosesan awal yang di dalamnya terdapat 3 proses yakni peningkatan kualitas sinyal (enhancement), pembingkaian (segmentation), dan penjendelaan