STEREO DAĞITIK VIDEO KODLAMA İÇİN SIKIŞTIRMALI ALGILAMALI
VIDEO KODLAMA GOP DESENLERİ İLE KARŞILAŞTIRMALI BİR ÇALIŞMA
A COMPARATIVE STUDY OF COMPRESSED SENSING VIDEO ENCODING GOP
PATTERNS FOR STEREO DISTRIBUTED VIDEO CODING
Sinem Aslan
Uluslararası Bilgisayar Enstitüsü
Ege Üniversitesi
sinem.aslan@ege.edu.tr
E. Turhan Tunalı
Bilgisayar Mühendisliği Bölümü
İzmir Ekonomi Üniversitesi
turhan.tunali@ieu.edu.tr
ÖZETÇE
Bu çalışmada, sıkıştırmalı algılama kavramları çok-bakışlı
video kodlamaya uygulanmıştır. Tek bakışlı video için
sıkıştırmalı algılama ile gerçekleştirilmiş olan mevcut öneriler
kullanılarak, stereo kodlama için etkin GOP desenleri ve
referans sistem çatısı oluşturmak hedeflenmiştir. Önerilen
bakışlar-arası seyreklik modelini büyük yoğunlukta kullanan
en tipik desen ile bu modelden daha az yararlanan desene
göre 0,4 dB’lik Video PSNR artışı elde edilmiştir. Gelecek
çalışmalar için alternatif çözümler önerilmiştir.
ABSTRACT
In this study, compressed sensing concepts are applied to
multi-view video coding. Existing work from single view video
is utilized to develop efficient GOP patterns and reference
framing for stereo coding. It has been observed that the most
typical choice of pattern improved the characteristics 0.4 dB
with respect to the model that do not benefit from interview
sparsity for all frames. Alternatives for future work are
proposed.
1. GİRİŞ
Günümüzün, ITU-T ve MPEG standartları tarafından
tanımlanmış olan sayısal video kodlama sistemleri, girdi
çerçeveleri üzerinde örnekleme yapmakla birlikte
tahminlemede gerçekleştiren yüksek karmaşıklıkta bir
kodlayıcı ve tahminleme işlemini tekrarlayan düşük
karmaşıklıkta bir kodçözücü içermektedir. Şüphesiz ki, bu
tipte bir mimari, videonun bir kez kodlandığı ve birçok kez
kodçözümünün gerçekleştirildiği uygulamalar için avantajlı
olmaktadır.
Son yıllarda, mobil aygıtların, telsiz duyarga ağlarının ve
çok-bakışlı video gözetleme sistemlerinin yaygın
kullanımının bir sonucu olarak bir takım yeni kısıtlamaların
gerekliliği doğmuştur. Bunlardan en önemlileri, kameralar
arasındaki iletişimsizliğe, geciktirme eğilimini enaza indirmek
için aynı anda işlem yapan kameralara ve enerji-etkinliği için
düşük karmaşıklıklı kodlayıcılara olan ihtiyaçtır. Bu
beklentileri karşılamak için, Slepian-Wolf [1] ve Wyner-Ziv
[2] teoremlerine dayanan Dağıtık Video Kodlama (DVK) [3-
4] olarak isimlendirilen yeni bir kodlama sistemi önerilmiştir.
Wyner-Ziv teoremine göre, kaynaklar arasında hiçbir bilgi
paylaşımı olmadan, birbirinden bağımsız bir şekilde kodlama
yapılmasına rağmen, kodçözümü ortak bir şekilde
gerçekleştirildiğinde iyi kalitede kodlama performansı elde
edilebilmektedir. Bu teoreme dayanan DVK uygulamalarında
kodlayıcının karmaşıklığı kodçözücü tarafına kaydırılmıştır.
Son yıllarda, DVK araştırmacılar tarafından oldukça ilgi
toplamıştır [5-8]. Bununla birlikte, yeni ve gelecek vadeden
bir teori olan Sıkıştırmalı Algılama (Compressive Sensing),
DVK uygulamalarında, sinyallerin ortak seyrekliğini esas
alarak kullanılmaya başlanmıştır [9-10]. [11]’de, sinyalleri
ortak yeniden oluşturmak için modifiye edilmiş GPSR
kullanan bir sistem önerilmiştir. [12]’de, ortak-seyreklik
modeli, yerel sözlük tabanlı bir yaklaşımla oluşturulmuştur ve
blok-tabanlı tahminleme bu yöntemle gerçekleştirilmiştir. Bu
çerçeveler arası seyreklik modeli, [13]’de, Yapısal Rastgele
Matrisler [14] ile elde edilen çerçeve-tabanlı ölçümlerin
eklenmesiyle geliştirilmiştir.
Çok-bakışlı Dağıtık Video Kodlamada (ÇDVK), kameralar
arasında hiçbir bağlantının olmadığı varsayımı ile birlikte,
DVK’da olduğu gibi düşük karmaşıklıklı kodlayıcı
hedeflenmektedir. [15]’de, zamansal ve homografi-tabanlı yan
bilgiler arasında bir kaynaşma yan bilgisi kullanan yeni bir
yöntem önerilmiştir ve kaynaşmanın veri hızı-bozulum
performansını geliştirdiği gösterilmiştir. [16]’da, ÇDVK için
farklı yan bilgi üretme yöntemlerinin performansları
karşılaştırılmıştır.
Bu bildiride, ÇDVK için, sıkıştırmalı algılama kavramını
stereo çiftlerine uygulayan ve [13]’deki çerçeveler-arası
seyreklik modeline dayanan bir bakışlar-arası seyreklik
modeli kullanımı önerilmektedir. Üç referans GOP modeli
sunularak bunların kodlama performansları karşılaştırılmıştır.
Bölüm 2’de temel kavramlar tanıtılmıştır. Bölüm 3’de
önerilen GOP yapıları sunulmuş ve deneysel sonuçlar Bölüm
4’de verilmiştir. Bölüm 5 sonuçlar ile ilgili yorumları
içermektedir.
2. TEMEL KAVRAMLAR
2.1. Sıkıştırmalı Algılama (Compressive Sensing)
Klasik veri sıkıştırma yöntemleri Shannon/Nyquist Teoremini
esas alarak çalışmaktadır ve bu teoreme göre, en büyük
frekans değeri F olan bir analog sinyal, saniyede en az 2F
oranında (veya 1/2F saniyelik birbiçimli aralıklarda)
örneklenerek elde edilen bir dizi örnekten mükemmel bir 978-1-4673-0056-8/12/$26.00 ©2012 IEEE