JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 5, Oktober 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i5.4968 Hal 1434−1443 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom Copyright © 2022 Yadhi Aditya, Page 1434 JURIKOM is licensed under a Creative Commons Attribution 4.0 International License Implementasi RESTful untuk Mengurangi Mean Time to Resolve pada Alert Handling Yadhi Aditya, Setiadi Rachmat, Maisevli Harika * , Mufqi Uwais Nastiar Salim, Dewanto Joyo Pramono Jurusan Teknik Informatika, Politeknik Negeri Bandung, Bandung, Indonesia Email: 1 yadhi@polban.ac.id, 2 s.rachmat@polban.ac.id, 3,* maisevli@polban.ac.id, 4 mufqi21mufqi@gmail.com, 5 dewantoade11@gmail.com Email Penulis Korespondensi: maisevli@polban.ac.id Submitted 13-10-2022; Accepted 25-10-2022; Published 31-10-2022 Abstrak Pemeliharaan layanan IT atau service supaya tetap dapat diakses menjadi salah satu tugas dari tim infrastruktur IT perusahaan. MTTR (Mean Time To Resolve) atau waktu rata-rata yang diperlukan untuk memulihkan service yang sedang bermasalah. MTTR merupakan salah satu aspek penilaian kinerja infrastruktur IT. Peringatan atau alert muncul sebagai tanda bahwa terdapat service yang sedang mengalami masalah. on-call engineer (bagian dari tim infrastruktur IT) bertanggung jawab untuk menangani alert tersebut. Permasalahan yang terjadi pada PT Sense Health Indonesia berupa repetisi alert artinya peringatan yang muncul dari permasalahan yang sudah pernah diatasi atau diselesaikan sebelumnya. Repetisi alert ini terjadi dalam jumlah yang cukup besar sehingga dapat meningkatkan nilai MTTR. Hasil penelitian menunjukkan integrasi tools yang digunakan menggunakan metode RESTful mampu mengefisienkan proses penanganan alert (alert handling). Hasil implementasi menunjukkan terjadi pengurangan waktu rata-rata penanganan alert sebesar 78%. Penelitian ini memberikan kontribusi dengan menunjukkan salah satu solusi untuk mengurangi MTTR untuk alert handling. Kata Kunci: Sistem Integrasi; Alert handling; On-call engineer; Infrastructure IT; Mean Time to Resolve Abstract One of the responsibilities of the company's IT infrastructure team is ensuring that IT services or services stay available. One part of analyzing the performance of IT infrastructure is MTTR (Mean Time to Resolve) or the average time necessary to restore a service that is experiencing issues. Warnings or alerts are shown when a service is encountering difficulties. As a member of the IT infrastructure team, the on-call engineer is responsible for managing alarms. At PT Sense Health Indonesia, difficulties manifest in the form of recurrence alerts, or warnings resulting from previously fixed or rectified issues. This warning is repeated with sufficient frequency to enhance the MTTR value. The findings demonstrated that the integration of tools using the RESTful approach streamlined the process of processing alerts. The deployment led to a 78% decrease in the average time required to handle alarms. This study contributes by demonstrating one method for decreasing MTTR for alert handling. Keywords: Integrated System; Alert Handling; On-call Engineer; Infrastructure IT; Mean Time to Resolve 1. PENDAHULUAN Peran dari seorang Infrastructure Engineer di antaranya adalah mendesain, membangun, melakukan deploy, dan memelihara/maintaining infrastruktur IT [1] terlepas menggunakan teknologi terkini atau tidak. Infrastructure engineer harus bisa menjamin menunjang bisnis perusahaan yang berkaitan dengan sistem IT (service) berfungsi secara efisien. Karena sistem IT pada sebuah perusahaan biasanya berskala besar dan kompleks, kegagalan merupakan hal yang tidak dapat dihindarkan [2]. Service yang gagal dapat disebabkan berbagai hal, seperti hardware outages, software bugs, atau perubahan load user [3], [4]. PT Sense Health Indonesia, terdapat Infrastructure engineer yang bertugas untuk menjaga database agar tetap dapat digunakan setiap saat, baik untuk menyimpan atau mengambil data. Sense Health adalah perusahaan multinasional yang berkantor pusat di kota Rotterdam, Belanda. Pada cabang Indonesia, Sense Health Indonesia infrastructure engineer dibagi menjadi dua profesi yaitu problem management engineer dan on-call engineer. Tugas dari problem management engineer adalah menyelesaikan masalah yang ada pada daftar dokumentasi alert (problem record) untuk menghasilkan solusi (workaround) sehingga masalah yang terjadi dapat diselesaikan. Sedangkan on-call engineer bertugas untuk memantau ketersediaan (availability) dari setiap layanan (service) yang ada di perusahaan. Saat ini banyak sekali tools yang dikembangkan untuk memudahkan pengguna menyelesaikan permasalahan bidang IT-nya. Sebut saja ada (1) Red Hat CodeReady Workspaces [5] untuk mengotomatiskan sepenuhnya penyebaran file teks/biner dari server target, (2) GitHub [6] dan BitBucket [7] untuk source control dengan fungsi tambahan lain pada masing-masingnya, (3) Ansible AWS [8] yang mampu untuk mendefinisikan, menerapkan, dan mengelola berbagai macam layanan platform cloud AWS, (4) Opsgenie [9] merupakan tools untuk incident management pada sistem IT, dan lain sebagainya. Kadang untuk bekerja lebih efektif dibutuhkan tools lain. Hal ini juga sama dengan yang terjadi pada Sense Health Indonesia. Opsgenie digunakan untuk memantau service, problem record dicatatkan pada GitHub Issues, kemudian eksekusi workaround melalui Ansible AWX. On-call engineer memantau service menggunakan Opsgenie. Apabila terjadi sesuatu pada service maka akan ada alert dari Opsgenie, on-call engineer mencari solusi pada problem record di GitHub Issues karena akan double effort jika harus melakukan investigasi terlebih dahulu sebelum menyelesaikan permasalahan. Apabila solusi dari alert telah ada pada problem record, maka on-call engineer akan langsung mengeksekusi workaround yang didapat dari problem record melalui Ansible AWX. Namun apabila alert belum mempunyai workaround pada problem record di GitHub Issues, maka