978-1-4673-5563-6/13/$31.00 ©2013 IEEE Rastlantısal Karar Ağaçlarıyla Nesne ve Renk Dağılımına Göre Sahne Sınıflandırılması Scene Classification with Random Forests and Object and Color Distributions Ahmet İşcen, Eren Gölge, Anıl Armağan, Pınar Duygulu Bilgisayar Mühendisliği Bölümü Bilkent Üniversitesi Ankara, Türkiye {ahmet.iscen, eren.golge, anil.armagan}@bilkent.edu.tr duygulu@cs.bilkent.edu.tr Özetçe—Bu çalışmada, görüntülerin içeriğindeki renkler venesneler bulunarak görüntüler için sahne sınıflandırması için bir yöntem sunulmuştur. Görüntülerdeki nesne ve renk içeriği göz önüne alınarak öznitelik vektörleri oluşturulur. Bu öznitelik vektörleri ile her bir sahne için, rastlantısal karar ağaçları kullanılarak, birer model elde edilir. Oluşturulan ağaç modelleri görüntünün sahnesinin sınıflandırılmasında kullanılmaktadır. Sunduğumuz yöntem, kategori bazlı sınıflandırmada Object Bank gibi en ileri yöntemlerle kıyaslanabilir sonuçlar vermektedir. Ayrıca, bilinen yöntemlerin hesaplama maliyeti görece yüksekken, sunduğumuz yöntem daha makul bir hesaplama maliyeti ile çalışır. Anahtar Kelimeler — sahne sınıflandırması, rastlantısal karar ağaçları, bilgisayarlı görü, parça modelleri. AbstractWe propose a method to recognize the scene of an image by finding the objects and the colors it contains. We approach this problem by creating a binary vector of detected objects and a histogram of the colors that the image contains. We then use these features to train a random forest classifier in order to determine the scene of each image. For class-based classifiers, our method gives comparable results with the state of art methods, such as Object Bank method, for the indoor scene dataset that we used. Additionally, while well-known methods are computationally expensive, our method has a low computational cost. Keywords — scene recognition, random forests, computer vision, part based models I. GİRİŞ Dijital kameraların ve sosyal medyanın kullanımının artması ile birlikte çok sayıda imge internet ortamında bulunmaktadır. Bu imgelerin etkin bir şekilde erişilebilmesi için, görüntülerdeki sahnelerin sınıflandırılması büyük önem kazanmıştır. Sahnenin bulunabilmesi için verilen görüntünün anlamını ve içeriğini öğrenmek önemlidir. Ne yazık ki görüntüye ait etiket kelimeler veya metinsel açıklamalar gibi metinsel veriler gürültülü, yanlış ya da görüntü hakkında eksik bilgiler içeriyor olabilir. Bu nedenle metinsel veriler her zaman yeterli olmayabilir. Bu sorunu çözebilmek için görsel bilgileri çıkarmak gereklidir. Bu işlevi yapmak için birçok başarılı yöntem vardır. Bu yöntemler üç alt başlıkta sınıflandırılabilir: Renk, SIFT [2] ve HOG [4] gibi öznitelikleri kullanan alt düzey yöntemler, bölütlenmiş bölgelerden çıkarılmış özellikleri kullanan orta düzey öznitelik yöntemleri ve de son olarak nesneler gibi yüksek seviye öznitelikleri kullanan yöntemler, Nesne Bankası (Object Bank)[1] yöntemi vb. Bu çalışmada alt ve üst düzey yöntemleri birleştiren bir yöntem öneriyoruz. Sunulan yöntemde ilk olarak belirli nesnelerin verilen görüntüde var olup olmadığı kontrol edilir. Bu bilgiler ikili vektörlerde saklanılır. Nesnelerin görüntüde bulunup bulunmamasına ek olarak, renk histogram seleleri bir görüntüyü temsil eden özniteliklere eklenir. Çıkarılan nesne ve renk öznitelikleri rastlantısal karar ağaçlarınından çıkarılan modeller ile görüntü sahnelerinin sınıflandırılmasında kullanılmıştır. II. İLGİLİ ÇALIŞMALAR Bilgisayar ile görme alanında önemli bir yeri olan yöntemlerden biri SIFT[2] tanımlayıcıları yöntemidir. Bu yöntem görüntülerdeki yerel öznitelikleri algılamak ve tanımlamak için sunulmuştur. Nesnelerin yerel öznitelikleri, o