1 Tutorial Singkat v.1.0 RANSAC ‐ Teknik optimisasi data berbasis iterative model fitting Oleh: Sunu Wibirama, M.Eng 1 Pada sebuah eksperimen yang melibatkan puluhan, ratusan atau bahkan ribuan data, kita seringkali dihadapkan pada sejumlah data yang memiliki relasi linier. Dari data-data tersebut, biasanya kita akan menjelaskan relasi linier antar data dengan menurunkan sebuah persamaan linier melalui teknik regresi atau least-square. Apabila data-data tersebut memiliki relasi linier yang cukup sempurna, model persamaan yang diturunkan pun akan mengandung kesalahan yang cukup kecil. Namun bila data-data tersebut memiliki relasi linier yang tidak terlalu baik (dengan berbagai macam noise atau outliers), model persamaan yang dihasilkan akan berubah dan bukan tidak mungkin memiliki tingkat akurasi yang cukup rendah. Ketidakakuratan data ini bisa muncul dari beberapa hal, antara lain: ‐ Kesalahan pada proses pengukuran: pada kasus observasi yang melibatkan puluhan atau ratusan data, seringkali kita menghadapi beberapa titik data yang tidak sesuai dengan kondisi yang kita inginkan. Pada tutorial computer vision, hal ini banyak dijumpai saat kita mendeteksi feature points di sebuah citra. ‐ Kesalahan klasifikasi: seringkali kesalahan terletak pada proses klasifikasi titik-titik data (mis- identified). Apabila hal ini terjadi, kesalahan yang muncul pada model persamaan yang akan diturunkan dari data tersebut biasanya cukup besar Menyikapi kondisi ketidakakuratan tersebut, diperlukan sebuah metode yang efisien untuk mendeteksi outliers, yakni titik-titik data yang memiliki jarak terbesar dari model persamaan yang akan diturunkan. Bila titik-titik data yang dianggap sebagai outliers sudah bisa ditemukan, outliers tersebut bisa disishkan dan model persamaan tersebut bisa dihitung ulang dengan titik-titik data yang tersisa. Pada teknik least-square, asumsi yang digunakan adalah semakin banyak data yang digunakan, persamaan linier yang dihasilkan semakin baik. Namun pada beberapa kondisi tertentu, asumsi yang digunakan adalah sebaliknya, yakni semakin sedikit data yang digunakan akan semakin baik untuk menghasilkan persamaan linier, sebab apabila data-data yang digunakan mengandung banyak outliers, maka model yang dihasilkan akan memiliki akurasi rendah, sebagaimana tergambar pada ilustrasi di bawah ini. 1 Penulis adalah pengajar dan peneliti di Jurusan Teknik Elektro dan Teknologi Informasi, Fakultas Teknik, Universitas Gadjah Mada, Yogyakarta. Penulis bisa dihubungi melalui email: sunu[at]ugm.ac.id