摘 要: 結合礦井的實際環境討論了井下數字漏泄移動通信系統中語音編解碼方法的選擇原則;分析了LD-CELP算法的特點和優勢,研究了該算法的性能;給出了在TMS320DM643平臺上LD-CELP編解碼方法的具體設計方案。
關鍵詞: 井下數字通信;語音編解碼;LD-CELP;TMS320DM643
國家工信部近年將逐步停止對模擬對講機型號的核準,并將在幾年內完成模擬對講機到數字對講機的過渡。根據這一規定及市場的發展前景可以看出,現有的礦井下模擬漏泄通信系統在未來5~6年后將逐步淘汰,因此開發先進的礦井下數字漏泄通信系統是現代通信技術發展的必然趨勢。而語音通信作為數字通信的核心部分必然會作為研究的重點,其中選擇適應井下復雜環境的數字語音編解碼方法顯得尤為重要。
1 語音編解碼技術及井下選擇標準
1.1 語音編碼的分類及介紹
語音信號的編碼方法可分為波形編碼、參數編碼和混合編碼三類。波形編碼自適應能力強,語音質量好,但所需要的編碼速率較高,一般在16 kb/s以上。而參數編碼以數學模型模擬語音信號產生機制為基礎,通過提取信號的特征參數來編碼,優點是編碼速率低,但語音質量較差,清晰度不高。混合編碼則是在保留分析合成編碼的技術基礎上,引進了波形編碼準則去優化激勵信號,從而在低碼率上獲得了較高質量的合成語音。連續可變斜率增量調制(CVSD)是增量調制的一種改進方法。這種方法中信號斜率是根據碼流中連“1”或連“0”的個數來檢測,所以又稱為數字檢測。低時延碼激勵線性預測編碼(LD-CELP)是G.728語音編碼標準算法,這種算法采用后向自適應線性預測、50階全極點合成濾波、短激勵矢量(5個樣值)等改進方法,達到高質量和低時延的目的,總的編碼時延小于2 ms。
1.2 適合井下通信要求的編碼方式
礦井下環境復雜,存在著巷道繁多、干擾較大等特點,所以在選擇編碼方式時一定要結合實際環境選擇適合井下通信的方法,其原則有:(1)雖然井下通信對語音的清晰度要求不是很高,但井下環境比較復雜,巷道距離長,彎道多,噪聲大,所以編碼應有較強的抗噪聲干擾和抗誤碼性能;(2)井下帶寬資源有限,所以語音編碼速率在保證話音清晰的前提下應盡可能低,以減少在系統帶寬中的占有率;(3)對編譯碼時延要求不是很高,但編譯碼器必須簡單,性價比要高;(4)井下環境易燃易爆,所以設備功率要小,必須是本安型的防爆設備。目前國內井下通信系統主要應用的數字語音編碼方式為CVSD編碼,它主要有以下優點:原理簡單,硬件要求低,抗誤碼性能強和技術成熟,具有專屬芯片產品CMX639。但隨著技術的發展,現代井下通信系統有了更高的要求,在語音通信的基礎上要求圖像或視頻的通信功能,這樣就要求利用DSP、FPGA等模塊化的嵌入式系統來實現,而且要求語音編碼的速率更低,盡可能地不占用寶貴的井下帶寬資源。CVSD在編碼速率方面有著局限性,在16 kb/s以上語音質量比較良好,但是在16 kb/s下語音質量下降很快,不能適應現代井下數字通信系統的要求,所以尋找一個更加合適的語音編碼方式勢在必行,而作為ITU-T的G.728標準的LD-CELP方法是系統最佳的選擇。
2 LD-CELP原理及實現
LD-CELP被ITU-T定為標準的G.728語音編碼協議,圖1和圖2是算法的編解碼器原理圖。LD-CELP和CELP(碼本激勵線性預測)算法一樣利用了合成分析法進行碼本搜索,并在此基礎上利用后向自適應預測技術對短時譜包絡和增益進行預測,所以能達到算法延時0.625 ms,一路編解碼延時小于2 ms。編碼過程首先將速率為64 kb/s的A律或者μ律PCM輸入信號轉換成均勻量化的PCM信號,接著由5個連續的語音樣點su(5n),su(5n+1),……su(5n+4)形成一個五維語音矢量。激勵碼本中共有1 024個五維的碼矢量。對于每個輸入語音矢量,編碼器利用合成分析法從碼本中搜索出最佳碼矢量,然后將10 bit的碼本標號送出去。線性預測(LP)系數是用先前量化過的語音信號來提取和更新的。每4個相鄰的輸入矢量(20個樣點)構成一幀,每幀更新一次LP系數;激勵的增益也是利用之前量化激勵信號的增益信息逐矢量地進行提取和更新。LD-CELP這種獨特的編碼技術在16 kb/s速率上編解碼后的語音質量在MOS(平均意見分,最大值5分)評分標準中達到了4.173的高分,基本可以還原原始的語音信號,并且在低于16 kb/s速率下語音質量能保持較好的穩定狀態。其優良的性能完全適合礦井下數字漏泄移動通信的要求。
3 硬件設計
系統采用了SEED-DEC643作為算法實時實現的硬件平臺,以高性能的32 bit定點DSP(TMS320DM643)為主控芯片的DSP系統,處理能力達到了4 800 MIPS,完全滿足運算的需求。芯片上集成了一個多通道音頻串行接口(McASP)外設,具有8根串行數據線,由軟件配置輸入和輸出,具有很強的可編程能力,可以配置為多種同步串口標準,可以和音頻ADC、DAC,Codec,數字音頻接口接收器DIR和S/PDIF傳輸物理層器件實現無縫連接,直接與各種器件高速接口。圖3所示為TMS320DM643接口框圖。
以TMS320DM643為核心的聲碼器結構框圖如圖4所示。DEC643開發板通過XDS510PLUS仿真器與PC機連接,由PC機通過CCS(Code Composer Studio)集成開發環境進行調試。運行時,語音信號由MIC輸入,經A/D轉換為數字信號,通過設定的串口0進入DM643編碼器部分對該語音信號進行編碼,編碼后進入解碼模塊進行解碼,輸出重建語音信號,最后經串口1送至D/A轉換器輸出至耳機,從而完成編解碼的過程。
4 軟件設計
軟件設計主要采用混合編程方法實現,在DSP資源配置、通信串口模塊、中斷模塊、濾波器等模塊采用了匯編程序編寫。編碼模塊流程圖和主程序流程圖分別如圖5、圖6所示。主程序首先用GEL文件對DM643進行初始化,再初始化McASP模塊,然后打開中斷控制寄存器,允許中斷請求,設置數據接收緩存,進入主循環,開始接收、處理和發送數據。在接收過程中不斷檢測接收緩存區,直至緩存區為空,數據接收完畢,將一幀數據從中取出,同時緩存區計數器清零,開始對接收的語音數據進行壓縮編碼處理。解碼過程則是編碼的逆過程。重復上述循環過程完成對一組語音數據的編解碼處理。
利用系統對語音數據進行采集與分析,對一段男聲錄音“合肥工業大學”的原始語音信號和編解碼后的信號的時域波形進行比較,如圖7、圖8所示,可以看出,原始錄音人為夾雜了一些噪聲時,波形相對比較尖銳,而在假定信道無噪聲干擾的情況下利用LD-CELP編解碼后的語音信號波形能夠很好地重建原始信號的包絡,可以過濾出原始信號中尖銳的環境噪聲,并且語音編碼速率得到了很大的降低,實現在低速率下滿足人們對語音可懂度和清晰度的要求,節約了整個系統的帶寬。
本文通過對LD-CELP算法原理的分析,在TMS320DM643平臺上實現了編解碼的過程,演示了算法的性能。說明了LD-CELP完全可以在數字通信快速發展的今天代替目前礦井下常用的CVSD算法,實現更高質量的語音通信,并且其在低速率通信下能保持高清晰度的特點,大大節省了整個漏泄通信系統的帶寬,為以后在DM643平臺上開發礦井數字漏泄移動通信系統中先進的視頻通信模塊提供了良好的條件。在下一步的研究中將結合礦井下復雜的巷道環境,在傳輸過程中模擬加入一些礦井中常見的噪聲,進一步分析LD-CELP算法在井下特定環境具有各種干擾的情況下能否適應數字漏泄移動通信系統對語音通信功能的要求。
參考文獻
[1] CCITT. Recommendation G.728.coding of speech at 16 kb/s using low-delay code excited linear prediction.Geneva,1992.
[2] Texas Instruments. TMS320DM643 user′s guide[Z]. 2004.
[3] 張雪英.數字語音處理及MATLAB仿真[M].北京:電子工業出版社,2010.
[4] 楊行峻.語音信號數字處理[M].北京:電子工業出版社,2007.
[5] SEED-DTK643V1.0實驗手冊.北京合眾達電子技術有限公司,2009.