Özetçe Elektronik postanın (e-posta) hızlı ve kolay bir haberleşme aracı olması, insanlar tarafından iletişimde yoğun şekilde kullanılmasına neden olmaktadır. E-postanın bu özellikleri; reklam yapmak, fikirlerini insanlara duyurmak ve çeşitli istismar çalışmaları yapmak isteyen insanlar için bir cazibe merkezi olmasını sağlamaktadır. Bu tür girişimler de bir güvenlik zafiyeti oluşturmaktadır. Temelleri Vladimir N. Vapnik tarafından atılan bir makine öğrenme algoritması olan destek vektör makineleri 1995’den itibaren sınıflandırma ve eğri uydurma problemlerinde başarılı sonuçlar vermiştir. Bu çalışmada, destek vektör makineleri kullanılarak yaramaz (istenmeyen) e-postaların filtrelenmesi işlemi gerçekleştirilmiştir. Anahtar Sözcükler: Yaramaz (İstenmeyen e-posta) destek vektör makinesi, filtreler, öznitelik, çekirdek fonksiyonları. Abstract Electronic mail (e-mail) is a communication medium that is fast and easy to use, making people to use it frequently. These features of e-mail cause it to be the center of attraction for the people who want to advertise, share their ideas with others or involve in malicious activities. Thus, these kind of activities create security threats. Support vector machines are machine learning algorithms that are developed by Vladimir N. Vapnik and produce successful results in several application domains such as clustering and curve fitting problem. In this study, we carry out unwanted (spam) e-mail filtering using support vector machine. Keywords : spam, support vector machine, filters, feature, kernel functions. 1. GİRİŞ Haberleşmenin temeli e-posta kullanımına dayanmaktadır. Bu popüler aracı kullanan insan sayısı çok fazla olduğundan birçok insan, grup veya şirketler, insanlara seslerini bu araç vasıtasıyla duyurmaya çalışmaktadır. Bir çalışmaya göre bir şirket ağına gelen mesajların %10’nunu yaramaz (istenmeyen) postalar (YP) oluşturmaktadır[12]. İnternet vasıtasıyla mesaj alma talebinde bulunmadığı halde çok sayıda kişiye gönderilen bu mesaj veya mesajlara yaramaz e-posta (YP) denir. YP’nin kullanılmasının en önemli avantajı, kısa bir süre içerisinde çok sayıda insana ulaşılmasıdır. YP’nin en belirgin zararları ise internet bant genişliğini doldurması ve zaman israfıdır. YP genellikle ticari amaçlı olmasının yanında siyasi bir propaganda ya da kamuoyu araştırması yapmak amacıyla gönderilmiş e-postalar da olabilmektedir. Bir e-posta adresine YP gelmesi için o adresin YP göndericinin eline geçmesi gerekmektedir. YP göndericileri adresleri ele geçirmek için ağı tarayan botlar kullanmaktadırlar. Arama motorlarının kullandığı türden olan bu botlar tüm siteleri veya formları tarayarak korumasız şekilde tutulan tüm bilgileri almaktadır. Kullanıcılar, üye oldukları ( kişisel bilgilerini ve e-posta adreslerini verdikleri) her site ve forumlar üzerinden bilmeden YP sektörünü beslemektedirler. Destek vektör makineleri(DVM) makine öğrenmesi gerektiren bir çok alanda başarılı sonuçlar vermiştir. YP'lerin filtrelenmesi konusunda da bir çok çalışmada farklı yöntemler ile birleştirilerek kullanılmıştır. Rafiqul ve Zhou çalışmalarında DVM Destek Vektör Makineleri ile Yaramaz Elektronik Postaların Filtrelenmesi Spam e-mail Filtering Using Support Vector Machine E. U. Küçüksille 1 ve N. Ateş 2 1 Süleyman Demirel Üniversitesi, Isparta/Turkey, ecirkucuksille@sdu.edu.tr 2 Süleyman Demirel Üniversitesi, Isparta/Turkey, nurullahates@sdu.edu.tr