JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 5, Oktober 2022
e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak)
DOI 10.30865/jurikom.v9i5.4968
Hal 1434−1443
http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom
Copyright © 2022 Yadhi Aditya, Page 1434
JURIKOM is licensed under a Creative Commons Attribution 4.0 International License
Implementasi RESTful untuk Mengurangi Mean Time to Resolve pada
Alert Handling
Yadhi Aditya, Setiadi Rachmat, Maisevli Harika
*
, Mufqi Uwais Nastiar Salim, Dewanto Joyo Pramono
Jurusan Teknik Informatika, Politeknik Negeri Bandung, Bandung, Indonesia
Email:
1
yadhi@polban.ac.id,
2
s.rachmat@polban.ac.id,
3,*
maisevli@polban.ac.id,
4
mufqi21mufqi@gmail.com,
5
dewantoade11@gmail.com
Email Penulis Korespondensi: maisevli@polban.ac.id
Submitted 13-10-2022; Accepted 25-10-2022; Published 31-10-2022
Abstrak
Pemeliharaan layanan IT atau service supaya tetap dapat diakses menjadi salah satu tugas dari tim infrastruktur IT perusahaan. MTTR
(Mean Time To Resolve) atau waktu rata-rata yang diperlukan untuk memulihkan service yang sedang bermasalah. MTTR merupakan
salah satu aspek penilaian kinerja infrastruktur IT. Peringatan atau alert muncul sebagai tanda bahwa terdapat service yang sedang
mengalami masalah. on-call engineer (bagian dari tim infrastruktur IT) bertanggung jawab untuk menangani alert tersebut.
Permasalahan yang terjadi pada PT Sense Health Indonesia berupa repetisi alert artinya peringatan yang muncul dari permasalahan
yang sudah pernah diatasi atau diselesaikan sebelumnya. Repetisi alert ini terjadi dalam jumlah yang cukup besar sehingga dapat
meningkatkan nilai MTTR. Hasil penelitian menunjukkan integrasi tools yang digunakan menggunakan metode RESTful mampu
mengefisienkan proses penanganan alert (alert handling). Hasil implementasi menunjukkan terjadi pengurangan waktu rata-rata
penanganan alert sebesar 78%. Penelitian ini memberikan kontribusi dengan menunjukkan salah satu solusi untuk mengurangi MTTR
untuk alert handling.
Kata Kunci: Sistem Integrasi; Alert handling; On-call engineer; Infrastructure IT; Mean Time to Resolve
Abstract
One of the responsibilities of the company's IT infrastructure team is ensuring that IT services or services stay available. One part of
analyzing the performance of IT infrastructure is MTTR (Mean Time to Resolve) or the average time necessary to restore a service
that is experiencing issues. Warnings or alerts are shown when a service is encountering difficulties. As a member of the IT
infrastructure team, the on-call engineer is responsible for managing alarms. At PT Sense Health Indonesia, difficulties manifest in the
form of recurrence alerts, or warnings resulting from previously fixed or rectified issues. This warning is repeated with sufficient
frequency to enhance the MTTR value. The findings demonstrated that the integration of tools using the RESTful approach streamlined
the process of processing alerts. The deployment led to a 78% decrease in the average time required to handle alarms. This study
contributes by demonstrating one method for decreasing MTTR for alert handling.
Keywords: Integrated System; Alert Handling; On-call Engineer; Infrastructure IT; Mean Time to Resolve
1. PENDAHULUAN
Peran dari seorang Infrastructure Engineer di antaranya adalah mendesain, membangun, melakukan deploy, dan
memelihara/maintaining infrastruktur IT [1] terlepas menggunakan teknologi terkini atau tidak. Infrastructure engineer
harus bisa menjamin menunjang bisnis perusahaan yang berkaitan dengan sistem IT (service) berfungsi secara efisien.
Karena sistem IT pada sebuah perusahaan biasanya berskala besar dan kompleks, kegagalan merupakan hal yang tidak
dapat dihindarkan [2]. Service yang gagal dapat disebabkan berbagai hal, seperti hardware outages, software bugs, atau
perubahan load user [3], [4].
PT Sense Health Indonesia, terdapat Infrastructure engineer yang bertugas untuk menjaga database agar tetap
dapat digunakan setiap saat, baik untuk menyimpan atau mengambil data. Sense Health adalah perusahaan multinasional
yang berkantor pusat di kota Rotterdam, Belanda. Pada cabang Indonesia, Sense Health Indonesia infrastructure engineer
dibagi menjadi dua profesi yaitu problem management engineer dan on-call engineer. Tugas dari problem management
engineer adalah menyelesaikan masalah yang ada pada daftar dokumentasi alert (problem record) untuk menghasilkan
solusi (workaround) sehingga masalah yang terjadi dapat diselesaikan. Sedangkan on-call engineer bertugas untuk
memantau ketersediaan (availability) dari setiap layanan (service) yang ada di perusahaan.
Saat ini banyak sekali tools yang dikembangkan untuk memudahkan pengguna menyelesaikan permasalahan
bidang IT-nya. Sebut saja ada (1) Red Hat CodeReady Workspaces [5] untuk mengotomatiskan sepenuhnya penyebaran
file teks/biner dari server target, (2) GitHub [6] dan BitBucket [7] untuk source control dengan fungsi tambahan lain pada
masing-masingnya, (3) Ansible AWS [8] yang mampu untuk mendefinisikan, menerapkan, dan mengelola berbagai
macam layanan platform cloud AWS, (4) Opsgenie [9] merupakan tools untuk incident management pada sistem IT, dan
lain sebagainya. Kadang untuk bekerja lebih efektif dibutuhkan tools lain. Hal ini juga sama dengan yang terjadi pada
Sense Health Indonesia. Opsgenie digunakan untuk memantau service, problem record dicatatkan pada GitHub Issues,
kemudian eksekusi workaround melalui Ansible AWX.
On-call engineer memantau service menggunakan Opsgenie. Apabila terjadi sesuatu pada service maka akan ada
alert dari Opsgenie, on-call engineer mencari solusi pada problem record di GitHub Issues karena akan double effort jika
harus melakukan investigasi terlebih dahulu sebelum menyelesaikan permasalahan. Apabila solusi dari alert telah ada
pada problem record, maka on-call engineer akan langsung mengeksekusi workaround yang didapat dari problem record
melalui Ansible AWX. Namun apabila alert belum mempunyai workaround pada problem record di GitHub Issues, maka