978-1-4673-5563-6/13/$31.00 ©2013 IEEE
Rastlantısal Karar Ağaçlarıyla Nesne ve Renk
Dağılımına Göre Sahne Sınıflandırılması
Scene Classification with Random Forests and
Object and Color Distributions
Ahmet İşcen, Eren Gölge, Anıl Armağan, Pınar Duygulu
Bilgisayar Mühendisliği Bölümü
Bilkent Üniversitesi
Ankara, Türkiye
{ahmet.iscen, eren.golge, anil.armagan}@bilkent.edu.tr
duygulu@cs.bilkent.edu.tr
Özetçe—Bu çalışmada, görüntülerin içeriğindeki renkler
venesneler bulunarak görüntüler için sahne sınıflandırması için
bir yöntem sunulmuştur. Görüntülerdeki nesne ve renk içeriği
göz önüne alınarak öznitelik vektörleri oluşturulur. Bu öznitelik
vektörleri ile her bir sahne için, rastlantısal karar ağaçları
kullanılarak, birer model elde edilir. Oluşturulan ağaç modelleri
görüntünün sahnesinin sınıflandırılmasında kullanılmaktadır.
Sunduğumuz yöntem, kategori bazlı sınıflandırmada Object
Bank gibi en ileri yöntemlerle kıyaslanabilir sonuçlar
vermektedir. Ayrıca, bilinen yöntemlerin hesaplama maliyeti
görece yüksekken, sunduğumuz yöntem daha makul bir
hesaplama maliyeti ile çalışır.
Anahtar Kelimeler — sahne sınıflandırması, rastlantısal karar
ağaçları, bilgisayarlı görü, parça modelleri.
Abstract—We propose a method to recognize the scene of an
image by finding the objects and the colors it contains. We
approach this problem by creating a binary vector of detected
objects and a histogram of the colors that the image contains. We
then use these features to train a random forest classifier in order
to determine the scene of each image. For class-based classifiers,
our method gives comparable results with the state of art
methods, such as Object Bank method, for the indoor scene
dataset that we used. Additionally, while well-known methods are
computationally expensive, our method has a low computational
cost.
Keywords — scene recognition, random forests, computer
vision, part based models
I. GİRİŞ
Dijital kameraların ve sosyal medyanın kullanımının
artması ile birlikte çok sayıda imge internet ortamında
bulunmaktadır. Bu imgelerin etkin bir şekilde erişilebilmesi
için, görüntülerdeki sahnelerin sınıflandırılması büyük önem
kazanmıştır. Sahnenin bulunabilmesi için verilen görüntünün
anlamını ve içeriğini öğrenmek önemlidir. Ne yazık ki
görüntüye ait etiket kelimeler veya metinsel açıklamalar gibi
metinsel veriler gürültülü, yanlış ya da görüntü hakkında eksik
bilgiler içeriyor olabilir. Bu nedenle metinsel veriler her zaman
yeterli olmayabilir. Bu sorunu çözebilmek için görsel bilgileri
çıkarmak gereklidir. Bu işlevi yapmak için birçok başarılı
yöntem vardır. Bu yöntemler üç alt başlıkta sınıflandırılabilir:
Renk, SIFT [2] ve HOG [4] gibi öznitelikleri kullanan alt
düzey yöntemler, bölütlenmiş bölgelerden çıkarılmış özellikleri
kullanan orta düzey öznitelik yöntemleri ve de son olarak
nesneler gibi yüksek seviye öznitelikleri kullanan yöntemler,
Nesne Bankası (Object Bank)[1] yöntemi vb. Bu çalışmada alt
ve üst düzey yöntemleri birleştiren bir yöntem öneriyoruz.
Sunulan yöntemde ilk olarak belirli nesnelerin verilen
görüntüde var olup olmadığı kontrol edilir. Bu bilgiler ikili
vektörlerde saklanılır. Nesnelerin görüntüde bulunup
bulunmamasına ek olarak, renk histogram seleleri bir
görüntüyü temsil eden özniteliklere eklenir. Çıkarılan nesne ve
renk öznitelikleri rastlantısal karar ağaçlarınından çıkarılan
modeller ile görüntü sahnelerinin sınıflandırılmasında
kullanılmıştır.
II. İLGİLİ ÇALIŞMALAR
Bilgisayar ile görme alanında önemli bir yeri olan
yöntemlerden biri SIFT[2] tanımlayıcıları yöntemidir. Bu
yöntem görüntülerdeki yerel öznitelikleri algılamak ve
tanımlamak için sunulmuştur. Nesnelerin yerel öznitelikleri, o