Optimasi Alur Kerja Ekstraksi dan Transformasi dalam proses ETL dengan Representasi State-Space dan Algoritma Heuristic-greedy Extraction and Transformation Workflow Optimization in ETL process with State- Space Representation and Heuristic-greedy Algorithm Muhammad Fardan Universitas Telkom muhammad.fardan55@gmail.com Abstrak - Extraction, Transformation, dan Loading, yang lebih dikenal dengan singkatan ETL, merupakan salah satu proses yang sangat penting dalam penerapan konsep data warehouse. Secara garis besar tugas dari proses ETL adalah untuk mengumpulkan data yang berasal dari sumber data dengan sistem operasi dan environment berbeda-beda menjadi sebuah kumpulan besar data yang terintegrasi. Dengan demikian semakin besarnya jumlah data yang akan diintegrasikan maka akan semakin berat dan semakin lama pula kinerja dari proses ETL. Hal tersebut akan mempengaruhi performansi data warehouse keseluruhan. Dalam buku tugas akhir ini penulis melakukan optimasi terhadap ETL dengan representasi state-space dan algoritma heuristic-greedy yang dapat mengurangi jumlah baris data yang diproses dalam setiap transformasi. Kemudian dilakukan analisis pada hasil optimasi ETL dengan membandingkan antara cost value dan waktu eksekusi yang dihasilkan algoritma heuristic-greedy dan algoritma exhaustive. Hasil akhir dari penelitian tugas akhir ini menunjukkan waktu eksekusi algoritma heuristic-greedy jauh lebih sedikit dibandingkan dengan algoritma exhaustive, dan algoritma heuristic- greedy menghasilkan nilai cost minimal yang sedikit lebih besar atau sama dengan nilai cost minimal yang dihasilkan algoritma exhaustive. Maka dari itu algoritma heuristic-greedy memberikan solusi yang sangat baik, karena dapat menghasilkan nilai cost minimal yang cukup memuaskan jika dibandingkan dengan hasil dari algoritma exhaustive dengan waktu yang jauh lebih cepat. Kata kunci : etl, optimasi etl, data warehouse, heuristic-greedy, state-space, cost model Abstract - Extraction, Transformation, and Loading, also known as ETL, is an important process in implementation of data warehouse concept. In general, ETL’s task is to collect data from various sources with different environments and opeation systems to become an integrated data collection. Thus, the greater size of data, the greater workload and execution time of ETL process, and that will influence all over datawarehouse performance. In this book, the author performs an ETL optimization with state- space representation and heuristic-greedy algorithm that can reduce the number of rows of data that are processed in each transformation. Afterward, the results of optimization are analyzed by comparing the cost value and execution time between heuristic-greedy and exhaustive algorithms. The end result of this research shows the execution time of heuristic-greedy algorithm is much less than the exhaustive algorithm, and heuristic-greedy algorithm generates minimal cost value slightly greater than or equal to the value of minimal cost that generated by exhaustive algorithm. Thus heuristic-greedy algorithm provides an excellent solution, because it can generates a minimum cost value that quite satisfactory when compared with the results of the exhaustive algorithm with much faster time. Keywords : etl, optimasi etl, data warehouse, heuristic-greedy, state-space, cost model brought to you by CORE View metadata, citation and similar papers at core.ac.uk provided by Open Library