STEREO DAĞITIK VIDEO KODLAMA İÇİN SIKIŞTIRMALI ALGILAMALI VIDEO KODLAMA GOP DESENLERİ İLE KARŞILAŞTIRMALI BİR ÇALIŞMA A COMPARATIVE STUDY OF COMPRESSED SENSING VIDEO ENCODING GOP PATTERNS FOR STEREO DISTRIBUTED VIDEO CODING Sinem Aslan Uluslararası Bilgisayar Enstitüsü Ege Üniversitesi sinem.aslan@ege.edu.tr E. Turhan Tunalı Bilgisayar Mühendisliği Bölümü İzmir Ekonomi Üniversitesi turhan.tunali@ieu.edu.tr ÖZETÇE Bu çalışmada, sıkıştırmalı algılama kavramları çok-bakışlı video kodlamaya uygulanmıştır. Tek bakışlı video için sıkıştırmalı algılama ile gerçekleştirilmiş olan mevcut öneriler kullanılarak, stereo kodlama için etkin GOP desenleri ve referans sistem çatısı oluşturmak hedeflenmiştir. Önerilen bakışlar-arası seyreklik modelini büyük yoğunlukta kullanan en tipik desen ile bu modelden daha az yararlanan desene göre 0,4 dB’lik Video PSNR artışı elde edilmiştir. Gelecek çalışmalar için alternatif çözümler önerilmiştir. ABSTRACT In this study, compressed sensing concepts are applied to multi-view video coding. Existing work from single view video is utilized to develop efficient GOP patterns and reference framing for stereo coding. It has been observed that the most typical choice of pattern improved the characteristics 0.4 dB with respect to the model that do not benefit from interview sparsity for all frames. Alternatives for future work are proposed. 1. GİRİŞ Günümüzün, ITU-T ve MPEG standartları tarafından tanımlanmış olan sayısal video kodlama sistemleri, girdi çerçeveleri üzerinde örnekleme yapmakla birlikte tahminlemede gerçekleştiren yüksek karmaşıklıkta bir kodlayıcı ve tahminleme işlemini tekrarlayan düşük karmaşıklıkta bir kodçözücü içermektedir. Şüphesiz ki, bu tipte bir mimari, videonun bir kez kodlandığı ve birçok kez kodçözümünün gerçekleştirildiği uygulamalar için avantajlı olmaktadır. Son yıllarda, mobil aygıtların, telsiz duyarga ağlarının ve çok-bakışlı video gözetleme sistemlerinin yaygın kullanımının bir sonucu olarak bir takım yeni kısıtlamaların gerekliliği doğmuştur. Bunlardan en önemlileri, kameralar arasındaki iletişimsizliğe, geciktirme eğilimini enaza indirmek için aynı anda işlem yapan kameralara ve enerji-etkinliği için düşük karmaşıklıklı kodlayıcılara olan ihtiyaçtır. Bu beklentileri karşılamak için, Slepian-Wolf [1] ve Wyner-Ziv [2] teoremlerine dayanan Dağıtık Video Kodlama (DVK) [3- 4] olarak isimlendirilen yeni bir kodlama sistemi önerilmiştir. Wyner-Ziv teoremine göre, kaynaklar arasında hiçbir bilgi paylaşımı olmadan, birbirinden bağımsız bir şekilde kodlama yapılmasına rağmen, kodçözümü ortak bir şekilde gerçekleştirildiğinde iyi kalitede kodlama performansı elde edilebilmektedir. Bu teoreme dayanan DVK uygulamalarında kodlayıcının karmaşıklığı kodçözücü tarafına kaydırılmıştır. Son yıllarda, DVK araştırmacılar tarafından oldukça ilgi toplamıştır [5-8]. Bununla birlikte, yeni ve gelecek vadeden bir teori olan Sıkıştırmalı Algılama (Compressive Sensing), DVK uygulamalarında, sinyallerin ortak seyrekliğini esas alarak kullanılmaya başlanmıştır [9-10]. [11]’de, sinyalleri ortak yeniden oluşturmak için modifiye edilmiş GPSR kullanan bir sistem önerilmiştir. [12]’de, ortak-seyreklik modeli, yerel sözlük tabanlı bir yaklaşımla oluşturulmuştur ve blok-tabanlı tahminleme bu yöntemle gerçekleştirilmiştir. Bu çerçeveler arası seyreklik modeli, [13]’de, Yapısal Rastgele Matrisler [14] ile elde edilen çerçeve-tabanlı ölçümlerin eklenmesiyle geliştirilmiştir. Çok-bakışlı Dağıtık Video Kodlamada (ÇDVK), kameralar arasında hiçbir bağlantının olmadığı varsayımı ile birlikte, DVK’da olduğu gibi düşük karmaşıklıklı kodlayıcı hedeflenmektedir. [15]’de, zamansal ve homografi-tabanlı yan bilgiler arasında bir kaynaşma yan bilgisi kullanan yeni bir yöntem önerilmiştir ve kaynaşmanın veri hızı-bozulum performansını geliştirdiği gösterilmiştir. [16]’da, ÇDVK için farklı yan bilgi üretme yöntemlerinin performansları karşılaştırılmıştır. Bu bildiride, ÇDVK için, sıkıştırmalı algılama kavramını stereo çiftlerine uygulayan ve [13]’deki çerçeveler-arası seyreklik modeline dayanan bir bakışlar-arası seyreklik modeli kullanımı önerilmektedir. Üç referans GOP modeli sunularak bunların kodlama performansları karşılaştırılmıştır. Bölüm 2’de temel kavramlar tanıtılmıştır. Bölüm 3’de önerilen GOP yapıları sunulmuş ve deneysel sonuçlar Bölüm 4’de verilmiştir. Bölüm 5 sonuçlar ile ilgili yorumları içermektedir. 2. TEMEL KAVRAMLAR 2.1. Sıkıştırmalı Algılama (Compressive Sensing) Klasik veri sıkıştırma yöntemleri Shannon/Nyquist Teoremini esas alarak çalışmaktadır ve bu teoreme göre, en büyük frekans değeri F olan bir analog sinyal, saniyede en az 2F oranında (veya 1/2F saniyelik birbiçimli aralıklarda) örneklenerek elde edilen bir dizi örnekten mükemmel bir 978-1-4673-0056-8/12/$26.00 ©2012 IEEE