Analisis Ekstraksi Fitur Principle Component Analysis pada Klasifikasi Microarray Data Menggunakan Classification And Regression Trees Rizky Pujianto 1 , Adiwijaya 2 , Aniq A. Rahmawati 3 1,2,3 Prodi Ilmu Komputasi, Fakultas Informatika, Universitas Telkom, Bandung 1 rizkyrp@students.telkomuniversity.ac.id, 2 adiwijaya@telkomuniversity.ac.id, 3 aniqatiqi@telkomuniversity.ac.id Abstrak Di era yang sudah maju seperti saat ini pendeteksian kanker bisa dilakukan dengan beberapa cara, salah satunya dengan bioinformatika, yaitu dengan menggunakan teknologi microarray. Teknologi tersebut berupa DNA yang berbentuk microchip dengan ukuran dimensi yang sangat besar. Ukuran dimensi yang besar menyebabkan lamanya perhitungan komputasinya. Untuk mengurangi masalah komputasi maka dilakukan reduksi dimensi terlebih dahulu sebelum diklasifikasi menggunakan (Classification and Regression Trees) CART. Reduksi dimensi adalah pendekatan dengan memilih komponen, komponen ini dipilih karena tidak semua atribut pada data microarray dipilih, mengingat data pada microarray sangat banyak. Komponen yang paling memiliki ciri yang dipilih agar perhitungan bisa lebih menghasilkan hasil yang optimum. Reduksi dimensi yang digunakan pada penelitian ini adalah ekstraksi fitur dengan menggunakan algoritma principle component analysis (PCA). Ekstraksi fitur biasanya digunakan untuk data kontinu dengan cara mengekstrak atributnya sehingga tersisa atribut yang dapat mengoptimalkan hasilnya. Data kanker yang digunakan ada tiga yaitu, kanker usus besar, leukimia, dan kanker paru-paru. Akurasi yang dihasilkan dari penelitian ini rata-rata diatas 70% dengan algoritma PCA untuk reduksi dimensi dan CART sebagai klasifikasinya. Kata kunci: kanker, microarray, reduksi dimensi, CART Abstract In an advanced era such as the current detection of cancer can be done in several ways, one of which is bioinformatics by using microarray technology. The technology consists of DNA that forms microchips with very large dimensions. Large size dimensions cause computational calculations. To reduce computational problems, the reduction is done before being classified using (Tree Classification and Regression) CART. Dimension reduction by selecting components, this component is selected because not all attributes in the microarray data are selected, considering that the data on the microarray is very large. Components that have the most characteristics are chosen so that calculations can produce optimal results. Dimension reduction used in this study is feature extraction using the principal component analysis (PCA) principle. Feature extraction is usually used for continuous data by extracting attributes so that they can produce attributes. There are three cancer data used, namely, colon cancer, leukemia, and lung cancer. The accuracy generated from this study averages over 70% with the PCA algorithm for reducing dimensions and CART as its classification. Key word: cancer, microarray, dimention reduction, CART 1. Pendahuluan Latar Belakang Sel-sel didalam tubuh pada umumnya membelah diri sesuai dengan waktunya, namun pada orang yang terkena kanker, sel-sel didalam tubuhnya mengalami mutasi yang sangat cepat dimana sel-sel baru yang tidak dibutuhkan akan terus tumbuh sampai tidak terkendali. Untuk memperkecil risiko terkena kanker, dapat dilakukan pendeteksian kanker dengan beberapa metode yaitu, CT (Computed Tomography), MRI (Magnetic Resonance Imaging), PET (Positron Emission Tomography), Ultra sound examination, Endoscopic examinations, In mammography, In isotopic diagnostics, dan gene expression [1]. Selain itu pendeteksian dengan gene expression bisa dilakukan dengan teknologi microarray. Microarray adalah teknologi yang digunakan untuk mempelajari ekspresi dari banyak gen, teknologi microarray ini lebih khusunya untuk menangani kanker walaupun bisa juga untuk berbagai macam penyakit. Teknologi microarray ini sudah digunakan dalam bidang kedokteran, teknologi ini digunakan karena pendeteksian kanker melalui tekologi microarray yang cepat, tetapi ada kendala dalam penggunaan microarray, yaitu besarnya dimensi yang dimiliki sehingga perlu dilakukan reduksi dimensi [2]. Dimensi yang dimaksud adalah ukuran data berupa atribut dan sample. Atribut berisi tentang informasi-informasi gene expression dari DNA dan sample berisi banyaknya DNA. Reduksi dimensi ada dua jenis yaitu feature selection dan feature extraction. Feature adalah atribut pada microarray data. Pada penelitian ini digunakan reduksi dimensi feature extraction. Feature extraction adalah salah satu cara untuk mereduksi dengan mengkompres atribut yang jumlahnya banyak menjadi lebih sedikit ISSN : 2355-9365 e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 2368