羅歡,洪遠泉,文昊翔,楊森泉
(韶關學院 物理與機電工程學院,廣東 韶關 512005)
摘要:針對目前市面上顯示系統在分布式視頻編解碼方向上的不足,提出了一種基于物聯網的多視角分布式視頻傳輸與處理系統,使用多視角RPRISM編解碼來實現分布式系統架構。主要介紹了該系統的總體結構以及主要功能,重點研究了多視角分布式的編碼方法以及MDVC處理子系統的實現。
關鍵詞:多視角;分布式;RPRISM;編解碼
0引言
多視角分布式視頻傳輸與處理系統是一種在物聯網環境下,高帶寬網絡的分布式多角度視頻監控與拼接視頻墻顯示系統。一般地,物聯網視頻墻系統也稱為物聯網大屏,主要適用于諸如環境監測、軍事、公共安全和公共空間視頻監控等相關領域。物聯網視頻墻系統主要由視頻傳感器構成的輸入節點、網絡交換機、控制臺、集成了解碼節點的綜合服務器和液晶屏拼接單元組成。各個設備只通過網絡連接、傳遞和交互信息流。
目前,國際上視頻墻系統主流產品是美國Jupiter公司的Canvas產品、CineMassive公司的專利產品CineView液晶視頻墻以及三星公司的視頻墻產品。國內主要有研華科技的AVS系列電視墻產品和無錫思朗電子科技有限公司的VLAN 視頻墻拼接系統。Jupiter公司的Canvas是采用面向企業的新型多點可視化和協作解決方案。三星公司視頻墻產品主要應用于金融監控方面的顯示系統[1],其優勢在于液晶視頻墻。比較而言,以上產品各具優勢,但它們在分布式視頻編解碼方面的優勢不足,尤其多視角呈現尚未見提及。
1系統總體構架
針對上述情況,本文提出一種基于物聯網的多視角分布式視頻傳輸與處理系統,如圖1所示。視頻傳感器終端(攝像機)采集到的視頻經過多視角分布式視頻編碼器進行壓縮編碼處理,再將編碼比特流通過無線視頻傳感網絡傳輸給綜合服務器解碼。視頻拼接控制器能在視頻墻上顯示單點或多點視頻內容[2]。各輸入終端分布式視頻處理節點也可顯示其他終端的多點視頻內容。控制臺則可以對整個系統進行實時的監控與管理。視頻墻既可以對各監控終端單點內容進行視頻拼接縮放或者疊加,也可以對多個攝像機終端融合后的多視角內容進行呈現。系統還能夠提供用戶遠程視頻查看與管理功能。遠程視頻顯示終端可以在任意可上網的地方依據不同權限調用查看某些輸入終端的內容。
多視角分布式視頻編碼(Multiview Distributed Video Codiry,MDVC)算法在FPGA平臺上實現,建立專用的分布式多視角視頻編碼工具集,根據編碼模型劃分不同的功能模塊,并采用不同的系統控制策略、優化算法、總線結構以及片上存儲方法等,以實現MDVC處理子系統的高速高效性能[3]。每個分布式視頻處理節點都具備獨立的編解碼和通信能力,能顯示不多于2×2個子屏。
控制臺作為系統中的主控單位,統籌控制視頻數據在網絡中的傳輸,并對視頻墻上顯示的視頻內容進行全權調配,包括實時視頻或者錄像視頻,顯示單點內容或者多點圖1系統結構圖
內容,視頻縮放或者疊加等。視頻墻能顯示不多于8×8個子屏。
服務器主要負責對多路MDVC處理子系統傳輸過來的數據進行多視角分布式解碼,并且通過視頻拼接控制器使其在視頻墻上顯示,用戶還可以使用筆記本、PDA、智能手機、智能電視等通過Internet遠程登錄來觀看任何一個MDVC子系統的視頻。
系統能夠實現的主要功能有:(1)視頻墻顯示終端能夠同時對多路視頻信號進行平鋪顯示與跨屏顯示;(2)能夠對播放的視頻圖像進行拖動、疊加以及縮放等操作,同時能對視頻圖像的技術參數如對比度、亮度以及飽和度等進行設置;(3)系統能夠對當前已經設置好的環境進行保存,同時能調用之前已保存的環境設置;(4)能夠支持同時輸入多路視頻信號、HDMI信號、VGA信號以及DVI信號等,最高可支持1 080 P信號采集輸入,全圖像處理無損傳輸,控制方式支持WiFi。
2MDVC處理子系統的研究
2.1分布式視頻編解碼
圖2分布式編碼體系結構圖隨著電子技術、通信技術以及計算機技術的飛速發展,大數據量的視頻流信號在網絡上進行實時傳輸已經成為一個非常重要的研究課題。分布式視頻編碼(Distributed Video Coding,DVC)為其提供了一個良好的新型解決方案。DVC主要是在SlepianWolf與WynerZiv理論的基礎上提出的,其編碼體系結構圖如圖2所示。分布式編碼體系結構主要由分布式編碼與分布式解碼兩部分組成,其中分布式編碼可以看作是由一個量化器和一個SlepianWolf 編碼器(SWC)構成的,也可稱為WynerZiv 編碼器(WZC) [4]。分布式解碼器主要是經過編碼的信號再通過SlepianWolf 解碼器和最小失真的視頻重構,也可稱為WynerZiv 解碼器,最后輸出視頻流信號。目前,針對分布式編碼的研究重點主要還是集中在WynerZiv解碼器中邊信息的產生、估計、量化以及變換等。
本文采用的分布式編碼主要是基于由美國加州大學伯克利分校的RAMCHANDRAN K等研究人員提出的經典模型,是一種基于Syndrome編碼技術[5]。它主要有兩個分支體系:Powerefficient Robust Highcompression Syndromebased Multimedia Coding(PRISM)和Distributed Source Coding Using Syndromes(DISCUSS), 其中PRISM結構由于其內在的信源與信道是聯合在一起進行編碼,因此具備傳統的預測編碼所不具有的魯棒性,同時還具有低編碼復雜度,并行的編碼機制特點。因此,本文分布式編碼采用PRISM結構實現。
PRISM結構主要是利用trellis碼機來進行Syndrome編碼,采集到的原始視頻通過DCT變換與量化器,再通過Syndrome編碼器得到編碼比特流,然后在網絡中進行傳輸,終端接收到的比特流再通過Syndrome解碼器、CRC校驗,最后經過估計、重構以及反DCT變換等處理最終得到已解碼的視頻數據,其編碼和解碼框圖如圖3所示。
2.2MDVC
多視角視頻傳感器系統會產生大量的視頻流信號,因此必須采用高壓縮率的算法。然而傳統的視頻編碼的方式僅僅只是針對每一個攝像頭設備進行單獨的高級視頻編碼(Advanced Video Coding, AVC),如圖4所示。顯然,這種配置沒有考慮利用不同視角間的相關性,而且,AVC在編碼器端的復雜度很大,負擔很重。
DUFAUX F等人針對傳統視頻編碼的不足提出了一種MDVC結構。該結構共有3個攝像頭,其左右兩邊的攝像頭采用傳統的AVC算法,中間的攝像頭則使用DVC算法[6]。其系統結構圖如圖5所示。
圖4傳統的視頻編碼方案圖5多視角分布式視頻編解碼方案綜上所述,本文提出的多視角分布式編解碼系統如圖6所示。WynerZiv是一種使用獨立編碼與聯合解碼的方法來對視頻流信號進行編解碼的編碼方式,即在編碼過程中對各個視頻流信號分別進行獨立的編碼,這時只需要考慮邊信息和編碼幀之間的一些相關性;在解碼過程中則使用相關的邊信息即可進行WynerZiv解碼,得到視頻流信號。使用WynerZiv編碼能夠避免一些由于預測編碼所形成的如錯誤擴散等問題[7]。
使用這種結構進行編解碼可以使攝像頭端的編碼復雜度降低,并且攝像頭之前不需要相互通信。每個攝像頭采集到得視頻流信號均使用PRISM結構的WynerZiv編碼器進行編碼,然后通過網絡交換機發送到服務器終端來進行解碼,WynerZiv解碼器接收到數據之后通過運動搜索以及邊信息估計來進行融合解碼。
2.3MDVC處理子系統
MDVC處理子系統是在Altera的DSP Development Kit Stratix III Edition開發平臺上,采用硬件描述語言編程實現該多角度分布式視頻編解碼的硬件電路,能夠達到技術指標要求的高速目標。Altera的FPGA產品Stratix III擁有硬DSP功能,適用于視頻圖像處理領域、無線通信和數字顯示領域。
3系統測試
本系統在基于WiFi的局域網環境下進行測試,智能終端設備選用智能電視,攝像頭采集圖像的頻率設置為704×576。經測試,在分辨率以及其他測試環境保持不變的情況下,同時滿足視頻實時傳輸保持在20 fps,未經過MDVC的延時為2~3 s,經過MDVC的延時可以保持1 s左右,系統總體還需進一步改善以滿足更高的實時性的要圖7系統測試圖
求。測試圖如圖7所示。
4結論
本文提出了一種基于物聯網的多視角分布式傳輸與處理系統,采用MDVC用于提高邊信息的準確度,并使用FPGA實現分布式節點編解碼器。該系統能夠顯示各監控點單點內容和多個攝像頭綜合后的多視角內容,在實際應用中間有重大意義,可以應用到如環境監測、軍事指揮、公共安全和公共空間視頻監控等相關領域。
參考文獻
[1] 翟曉輝.基于FPGA的嵌入式視頻采集及網絡傳輸系統的應用研究[D].哈爾濱:哈爾濱工程大學,2013.
[2] 張彤,呂東歡,歐陽寧.基于SOPC的雙目視頻采集及顯示系統設計[J].電視技術,2013,37(19):8286.
[3] 張威.分布式編碼的關鍵技術研究[D].合肥:中國科學技術大學,2011.
[4] 檀會娟,唐加山.WynerZiv視頻編碼中的碼率控制算法研究[J].微型機與應用,2015,34(10):3840,47.
[5] 蔡述庭,王欽若,謝云,等.視頻傳感網中魯棒多視角分布式視頻編碼[J].計算機工程,2009,35(24):219221.
[6] 蔡述庭,王欽若,尹明.使用對極幾何的多視角分布式視頻編碼[J].計算機工程與應用,2010,46(17):121124.
[7] 劉曉文,劉歡,張雷,等.基于分布式視頻編碼的井下傳感器節點設計[J].電子技術應用,2014,40(6):2022,26.