ISSN (Online) 2747-0563 Seminar Nasional Informatika Bela Negara (SANTIKA) Volume 1 Tahun 2020 164 Histogram Profil Proyeksi sebagai Metode Ekstraksi Fitur pada Pengenalan Karakter Tulisan Tangan Fetty Tri Anggraeny 1 , M. Syahrul Munir 2* , Intan Yuniar Purbasari 3 1,2,3 Informatika, Universitas Pembangunan Nasional “Veteran” Jawa Timur 2 syahrul.attraktiv@gmail.com 3 intanyuniar.if@upnjatim.com *Corresponding author email: 1 fettyanggraeny.if@upnjatim.ac.id Abstrak— Penelitian tentang pengenalan karakter masih sangat diminati sampai saat ini karena area aplikasinya yang luas. Topik penelitiannya dapat terkait dengan preprocessing, ekstraksi fitur dan metode pengenalan karakter. Dalam bidang pengenalan karakter ada beberapa metode ekstraksi fitur yang dapat digunakan, salah satunya profil proyeksi. Profil proyeksi adalah suatu histogram yang memproyeksikan piksel citra kearah horisontal maupun vertikal. Histogram proyeksi menghitung jumlah piksel non-background pada arah spesifik tertentu, horisontal dan vertikal. Dalam penelitian ini dilakukan analisa terhadap penggunakan proyeksi vertikal, horisontal, dan gabungan terhadap karakter huruf Roman yang diklasifikasi menggunakan k-NN. Hasil dari penelitian ini memberikan performa akurasi terbaik 80,95% dengan waktu yang dibutuhkan 0,66 detik. Kata Kunci— profil proyeksi, karakter roman, tulisan tangan, k- nearest neighbor I. PENDAHULUAN Optical Character Recognition (OCR) merupakan suatu proses mengenali karakter tersegmentasi dari dokumen yang dipindai menjadi citra berdasarkan fitur yang diekstrak dari gambar karakter tersebut [1]. Penelitian tentang pengenalan karakter masih sangat diminati sampai saat ini karena area aplikasinya yang luas. Topik penelitiannya dapat terkait dengan preprocessing, ekstraksi fitur dan metode pengenalan karakter. Dalam bidang pengenalan karakter ada beberapa metode ekstraksi fitur yang dapat dilakukan. Soora membahas dalam penelitiannya membagi fitur menjadi 2 kelompok, yaitu fitur berbasis bentuk dan fitur tidak berbasis bentuk [2]. Salah satu fitur tidak berbasis bentuk adalah profil proyeksi yang merupakan fitur statistic. Dari beberapa paper yang di review, pemakaian variasi profil proyeksi sebagai fitur memberikan performa yang cukup bagus. Jika umumnya OCR memproses gambar dokumen yang terdiri dari objek karakter ketikan. Ada bidang pengenalan karakter yang tidak kalah menarik, yaitu pengenalan karakter tulisan tangan. Selain tulisan tangan berbentuk alphabet baku, di beberapa wilayah dunia memiliki huruf daerah yang unik. Misalnya di pulau Jawa Indonesia terdapat aksara jawa yang sering disebut aksara hanacaraka. Dalam jenis karakter yang sama, tulisan tangan sangat beragam tergantung pada si penulis, sehingga hal ini sangat menarik untuk diteliti secara berkelanjutan. Dan salah satu parameter yang menjadi tantangan para peneliti adalah waktu yang dibutuhkan untuk mengenali karakter. Dalam perkembangannya banyak penelitian yang mengunakan variasi profil proyeksi. Referensi [3] membandingan antara profil proyeksi horisontal, profil proyeksi vertikal dan run histogram pada dokumen. Uicoba menunjukkan bahwa profil proyeksi vertikal membutuhkan waktu lebih lama daripada 2 proyeksi yang lain. Non-linear multi-projection menggunakan radon transform menggunakan karakter Romawi (aksara yang biasa kita gunakan A-Z, 0-9). Ujicoba menunjukkan pada karakter Roman baik berupa angka, huruf, dan symbol memberikan performa yang sangat bagus 100% akurasi pada parameter transformasi radon 180 o [4]. Penelitian lain menggunakan zona proyeksi, antara lain proyeksi vertikal zona atas, proyeksi vertikan zona bawah, proyeksi horisontal zona kiri, dan proyeksi horisontal zona kanan. Dengan menggunakan mesin klasifikasi EMDC dan SVM memberikan akurasi 83% dan 90% [5]. Pengenalan huruf Bangla yang menggunakan proyeksi vertikal dan horisontal menunjukkan performa yang sangat tinggi. Dalam penelitian ini juga menunjukkan bahwa dengan penambahan proses skeletoning, performa yang dihasilkan menjadi maksimal [6]. Penelitian yang juga menggunakan proyeksi vertikal, horisontal dan gabungan pada dataset karakter Gurmukhi memberikan hasil bahwa penggabungan proyeksi vertikal dan horisontal memberikan peningkatan performa yang cukup pada keseluruhan sistem [7]. Penelitian sebelumnya [8], [9] memiliki kelemahan terutama pada waktu proses, selain itu beberapa metode klasifikasi juga menunjukkan performa yang tidak terlalu baik jika dibandingkan dengan waktu yang dibutuhkan. Oleh karena itu, dalam penelitian ini digunakan metode ekstraksi fitur yang lebih cepat untuk memangkas proses pengenalan karakter. II. METODOLOGI Dalam penelitian ini, digunakan profil proyeksi citra untuk mengekstraksi fitur citra karakter tulisan tangan yang umumnya digunakan sebagai metode segmentasi. Metodologi dalam penelitian ini disajikan pada Gbr. 1. Pertama, citra input dilakukan ekstraksi bounding box untuk mendapatkan ROI. Kedua, citra ROI yang ukurannya beragam, disamakan menjadi ukuran 32x32 piksel. Ketiga, dilakukan ekstraksi skeleton untuk mendapatkan tulang dari