“Proqram mühəndisliyinin aktual elmi praktiki problemləri” I respublika konfransı, Bakı, 17 may 2017-ci il 30 Bulud İnfrastrukturunun Keyfiyyət Göstəricilərində Anomaliyaların Real Zamanda Aşkarlanması Metodu Rasim Əliquliyev 1 , Ramiz Alıquliyev 2 , Fərqanə Abdullayeva 3 1,2,3 AMEA İnformasiya Texnologiyaları İnstitutu, Bakı, Azərbaycan 1 rasim@science.az, 2 r.aliguliyev@gmail.com, 3 farqana@iit.ab.az XülasəBulud istifadəçilərə sorğu əsasında miqyaslanan resurslar təqdim edən texnologiyadır. Bulud infrastrukturuna istənilən qurğu vasitəsi ilə daxil olmağın mümkünlüyü və açıq şəbəkələrdən istifadə etməsi bu mühiti müxtəlif tipli kiber- hücumların təsirinə məruz qoymuşdur. Burada informasiya təhlükəsizliyi hücumlarının reallaşması bulud infrastrukturunun serverlərinin yaddaş, CPU resurslarında anomal davranışın yaranmasına səbəb olur. Bu sistemlərin generasiya etdiyi böyük həcmdə verilənlərin təsnif edilməsi prosesi böyük xərc və vaxt tələb etdiyi üçün burada bu məsələnin həllində anomaliyaların yarım-öyrədilən (semi-supervised) metodların köməyilə aşkarlanması qənaətbəxş hesab olunur. Məqalədə bulud infrastrukturunun keyfiyyət göstəricilərində anomaliyaların aşkarlanması üçün yarım-öyrədilən metod təklif edilir. Burada anomal davranışı aşkarlamaq üçün keyfiyyət göstəriciləri üzrə Google və Yahoo! şirkətlərinin açıq verilənləri, Python 2.7, Matlab, Weka və Google Cloud SDK Shell proqramları istifadə edilmişdir. Modelin eksperimental tədqiqi nəticəsində 0.99% aşkarlama dəqiqliyi əldə edilmişdir. Açar sözlərkeyfiyyət göstəricilərində anomaliya; CPU sərfiyyatı; yaddaş sərfiyyatı; Isolation forest; Naive Bayes; J48 qərar ağacı, yarım-öyrədilən alqoritmlər; klassifikatorlar ansamblı I. GİRİIŞ Son zamanlar bulud texnologiyalarının tətbiq sahəsinin çox yayılması bu infrastrukturun miqyasının və mürəkkəbliyinin böyük sürətlə artmasına səbəb olmuşdur. Bu iri miqyaslı sistemlərin keyfiyyət göstəricilərində deqradasiya və fasilələrin (downtimes) yaranması olduqca böyük problem hesab olunur [1]. Bu problemlərin aradan qaldırılmasında başlıca məsələ bulud infrastrukturunun aparat təminatında, sistemlərinin vəziyyətində və proqram təminatlarının yerinə yetirilməsində baş verə bilən anomaliyaların aşkarlanmasıdır. Bulud infrastrukturunda anomal davranışlar sistemin resurslarının yüklənməsi, imtinalar, konfiqurasiya səhvləri, DDoS hücumlar səbəbindən baş verə bilir. Bu anomallıq gözlənilməz vəziyyətin yaranmasına səbəb olur və verilənlər mərkəzinin effektivliyinin aşağı düşməsi və işinin dayanması ilə nəticələnir [2]. Bulud infrastrukturunda anomal davranışı aşkarlamaq üçün resurs sərfiyyatının vəziyyətini qiymətləndirmək lazımdır. Bu qiymətləndirməni zaman sıraları ilə təsvir edilmiş server kriteriyalarını (ləngimə, CPU, yaddaş) izləməklə təmin edirlər [3]. Bulud infrastrukturunda anomaliyaların maşın təlimi üsulları ilə aşkarlanması üçün olduqca çox sayda tədqiqatlar aparılmışdır [1,4]. [5]-də öyrədilməyən aşkarlama metodlarının effektivliyini artırmaq məqsədi ilə klasterizasiya ansamblı yanaşmasından istifadə edirlər. [6]-da müdaxilələrin aşkarlanması məsələsində klassifikatorlar ansamblı istifadə edilir. [7]-də bizim yanamaya oxşar yanaşma təklif edilmişdir. Belə ki, təsnif olunmamış verilənlərə ballandırma üsulu tətbiq olunaraq verilənlərin iki sinfə bölünməsi həyata keçirilmişdir. Burada yüksək anomaliya balına malik olan verilənlər anomal, qalanları isə normal davranış kimi təsnif edilmişdir. Daha sonra təsadüfi olaraq normal verilənlər çoxluğu seçilmişdir və anomal verilənlərlə birləşdirilərək təsnif edilmiş verilənlər bazası formalaşdırılmışdır. Növbəti mərhələdə öyrədilən alqoritm bu təsnif edilmiş verilənlərlə öyrədilmiş və nəticədə anomal davranış normal davranışdan fərqləndirilmişdir. Təqdim olunan məqalədə təklif edilən metodun mövcud metodlardan fərqi odur ki, burada təbiəti əvvəlcədən məlum olmayan verilənlərdən təsnif edilmiş verilənlər formalaşdırılır və bir neçə öyrədilən klassifikatorlar istifadə olunaraq robast aşkarlama sistemi qurulur. Burada klassifikatorlar çoxluğundan istifadə edilməsinin məqsədi, hər bir klassifikatorun mövcud anomaliyanı fərqli aşkarlamasıdır. Bundan başqa mövcud üsullarda aşkarlama prosesində kənaraçıxmaların (outlier) meydana çıxması halı nəzərə alınmır. Bu vəziyyət isə öz növbəsində anomaliyaların aşkarlanması dəqiqliyini azaldır. Burada verilənlər obyektinin qiyməti əlamət üçün təyin edilmiş sərhəd qiymətlərini aşarsa və verilənlər obyektinin sinfi normal kimi təsnif olunarsa, həmin element kənar element hesab olunur. Və əksinə əgər verilənlər obyektinin qiyməti əlamət üçün təyin edilmiş rhəd qiymətlərindən aşağıdırsa verilənlər obyektinin sinfi anomal kimi təsnif olunarsa, həmin element kənar element hesab olunur. Təqdim olunan məqalədə bulud infrastrukturunda anomal davranışları aşkarlamaq üçün yanaşma təklif edilir. Təklif edilmiş metod vasitəsi ilə loq fayllar analiz edilir, qəbul edilmiş sərhəd qiyməti vasitəsi ilə resurs sərfiyyatı proqnozlaşdırılaraq təsnif olunmuş anomaliyalar formalaşdırılır. Metodda sərhəd qiymətinin istifadə edilməsi anomaliyaları yüksək dəqiqliklə aşkarlamağa imkan verir. Təklif edilmiş yanaşma dörd mərhələdən ibarətdir. 1) Verilənlər bazasının normal və anomal siniflərə bölünməsinin təşkili. 2) Çoxsaylı klassifikatorların təsnif edilmiş verilənlər əsasında hər birinin fərdi qərarlarının formalaşdırılması. 3) Kollaborativ qərarın qəbul olunması üçün klassifikatorların irəli sürdüyü fərdi qərarları birləşdirən yekun anomaliya balının hesablanması. 4) Qərarın qəbulu. DOI: 10.25045/NCSoftEng.2017.05