文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.183300
中文引用格式: 袁冰清,王巖松,鄭柳剛. 深度學習在無線電信號調制識別中的應用綜述[J].電子技術應用,2019,45(5):1-4.
英文引用格式: Yuan Bingqing,Wang Yansong,Zheng Liugang. A survey of deep learning applied to radio signal modulation recognition[J]. Application of Electronic Technique,2019,45(5):1-4.
0 引言
無線電信號的調制識別是頻譜監測過程中的重要組成部分,也是難點之一。隨著現代無線電通信技術的發展與應用,無線電信號特征與電磁環境變得更加復雜,因此,無線電信號更容易受到外界信號的干擾,監測人員須對監測到的信號進行調制分析、頻譜波形比較等才能判斷信號的屬性,并與正常登記的臺站比對,確定是否為干擾信號,為進一步抗干擾做鋪墊。然而這種傳統的人工分析判斷,不僅效率低下,而且存在諸多不可靠因素,并且能識別的信號類型也有限。為了提高無線電信號的調制識別效率和準確率,無線電信號的自動調制識別的研究勢在必行。
目前,無線電信號調制自動識別方法從原理上看主要有兩大類:一類是基于貝葉斯決策論的方法;一類是基于統計機器學習理論的方法[1-3]。貝葉斯決策論的實現方法本質上可歸結為一個多重假設檢驗的問題,雖然理論完備,但是通用性較差,實現復雜度很高,而識別率卻一般,特別是在電磁環境復雜、低信噪比條件下,識別率會急劇下降[3]。隨著人工智能(Artificial Intelligence,AI)的興起,基于人工神經網絡(Artificial Neural Networks,ANNs)的統計機器學習理論的信號調制識別漸漸成為信號調制識別領域的主流研究方向。其優勢在于:技術思路簡單清晰,算法切實可行,實現流程簡單明了,性能優良,適用于通用的模擬和數字信號識別。另外,基于人工神經網絡的調制識別分類器具有很好的魯棒性,可以自適應電磁環境的變化,即使在較低信噪比條件下仍然可以很好完成無線電信號調制識別任務。
1 基于人工神經網絡的信號調制識別
基于人工神經網絡的信號調制識別的通用流程如圖1所示,包括信號的預處理和特征提取,信號分類器的訓練學習,待分類信號的識別[2]。
其中,如何提取合適的信號特征來區分不同的調制模式對識別效果有重要影響,一般特征提取方法有:基于信號瞬時特征、基于小波變換、基于高階累積量、基于星座圖、基于循環譜等。在搭建神經網絡架構方面,大多都是構建BP(Back Propagation,BP)神經網絡或者傳統的多層感知器(Multi-Layer Perceptrons,MLPs)來實現自動識別。最早可以追溯到1996年AZZOUZ E E、NANDI A K等提取信號的瞬時值為特征向量,利用人工神經網絡作為分類器,完成多種模擬數字信號的調制識別[4],指出ANN架構優于決策論架構的原因在于:決策論只能同時考慮信號的一個特征,而ANN架構可以同時考慮信號所有的特征,導致關鍵特征的時序性不影響信號調制類型的判斷。2009年HASSAN K基于小波變化理論利用多層神經網絡對不同的M進制移位鍵控類型(M-ASK,M-FSK,M-PSK等)的信號進行調制識別[5];2010年Qian Lanjun基于循環譜的差異設計的BP神經網絡調制分類器[6],但是對于16QAM與64QAM區分效果不太理想;2015年ADZHEMOV S S基于信號的二階及四階統計量設計的MLPs兩層神經網絡調制分類器[7],對FSK、PSK、ASK、QAM的識別率高達0.7~0.99,但是對PSK-4信號識別率僅僅為0.7。國內文獻顯示基于BP神經網絡或者多層感知器(MLPs)的信號分類系統,對某一類的數字信號的自動識別效果也很好[8],特別是在信噪比SNR≥10時,如2007年電子科技大學的潘明從信號的瞬時幅度、瞬時相位、瞬時頻率特征中提取5種特征參數,設計了一種分層式結構的BP神經網絡分類器對2ASK、4ASK、2FSK、4FSK、BPSK、QPSK 6種調制信號進行分類,采用動量梯度算法分類器的正確識別率達到98%以上(SNR>10 dB時)[3,9];此外,基于人工神經網絡對某一特定波段內的信號類型的識別也是很好的,如2015年于成龍基于BP神經網絡利用偏差權重法的特征提取方法對C波段無線電信號分類識別[10]。但是以上設計的神經網絡模型都是屬于淺層神經網絡分類識別器范疇[11],設計者需要從原始的信號采樣數據中人工設計和提取特征,用于優化網絡的輸入,因此最終模型識別的準確率很大部分取決于信號特征這部分,這要求特征設計者具備良好通信和信號領域的專業知識 。如果一旦選擇的分類器不合適,那么就可能造成分類效果極差,也就是說,基于人為的特征提取的方法,泛化能力弱。另外,基于一般ANN的識別分類器,對全波段的所有類型的信號識別率有待提高。因此,需要一種神經網絡架構,弱化前期的特征提取部分而達到自動識別的功能,并且提高所有類型的信號識別率。因此,有必要找到一種更加魯棒和有效的方法,基于深度學習的深度神經網絡架構的信號調制識別系統應運而生。
2 深度學習神經網絡
2.1 深度學習的起源與主要思想
2006年,HINTON G E等人提出深度信念網絡[12](Deep Belief Network,DBN)及其相應的非監督貪心逐層訓練算法,解決了深層結構相關的優化難題,并以此引入了深度學習的概念。如圖2所示,傳統的ANN的淺層結構(即通常只包含1層或2層)直接將原始輸入信號或特征轉換到待求解問題的特征空間中,因而對復雜函數的表示能力有限。
而深度學習可通過學習一種深層非線性網絡結構,實現復雜函數逼近,本質上是構建含有多層隱層的機器學習架構模型[13],將特征和分類器結合到一起,通過大規模數據進行訓練學習大量更具代表性的特征信息,減少了手工設計特征的巨大工作量。因此,深度學習是一種可以自動地學習特征的方法。
2.2 深度學習主要的兩個模型
目前,深度學習算法廣泛應用在計算機視覺和語音識別等領域。卷積神經網絡和循環神經網絡是其中最典型的模型。
2.2.1 卷積神經網絡
卷積神經網絡(Convolution Neural Network,CNN)最早由LECUN Y提出并應用在手寫字體識別上(MINST),2012年,HINTON G E課題組構建的CNN網絡AlexNet參加ImageNet圖像識別比賽一舉奪得冠而吸引了眾多研究者對深度學習的注意與研究熱情,隨后各種更多層的深度神經網絡結構如GoogleNet、Residual Net被相繼發明。
卷積神經網絡的結構如圖3所示,包含卷積層、池化層、全連接層[14-15]。
卷積層是CNN的核心,在卷積層中,每個神經元看做一個濾波器(filter)或內核(kernel),具有小的視覺感受野,共享權值。一組內核對層(layer l)的輸入出數據進行卷積(即計算內核與輸入數據之間的點積),對應的輸出稱之為特征圖,用于后一層即池化層(layer l+1)的輸入數據。如果標記dl[x,y,c]為三維數據中某一點的數據,標記Kl為卷積層的某一個卷積核,該卷積核表征了一個四維的數據[kx,ky,cl,cl+1],且0≤kx≤Kx-1,0≤ky≤Ky-1,卷積層的輸出數據dl+1[x,y,c]與各卷積核和輸入數據的關系可表達為式(1)[14]:
池化層又稱下采樣,它的作用是減少訓練參數的數量并降低卷積層輸出的特征向量的維度,同時保留有用特征信息。最常見的兩種池化層的形式:最大池化,選取指定區域內最大的一個數來代表正片區域;均值池化,選取指定區域內數值的平均值來代表整片區域。
全連接層的工作原理與一般的淺層神經網絡學習很類似,只需把池化層輸出的張量重新排布成向量,乘上權重矩陣,加上偏置值,然后對其使用ReLU激活函數,之后用梯度下降法優化網絡參數即可。
2.2.2 循環神經網絡
循環神經網絡(Recurrent Neural Networks ,RNNs)的結構如圖4所示,RNN與各層按單一方向相連接的基本前向全連接神經網絡相比,多了一層從前一隱層輸出反饋到當前輸入的循環層,因此,RNN表現出了在時間維度上的深度結構特性。它的深度是時間的長度按時間序列展開來看,就是當前隱藏層的輸出值不僅與當前的輸入值有關,還取決于上一次隱藏層的值。對于給定的輸入序列X=(x1,…,xT),RNN通過式(2)、式(3)循環迭代計算從t=1到t=T時刻,隱層的矢量輸出序列H=(h1,…,hT)和輸出層的矢量序列Y=(y1,…,yT)[15]。
式中,Wxh、Why、Whh分別代表了輸入層與隱層、輸出層與隱層、隱層之間的權重矩陣,bh和by分別表征了隱層和輸出層的偏置向量,σ為隱層的激活函數,一般選為sigmoid函數。循環神經網絡的訓練算法是BP算法的變體BPTT(Back Propagation Trough Time)。在實踐中,為了更好解決長時的依賴問題,通常使用一種改進的循環神經網絡如長短時記憶網絡(Long Short Term Memory Network,LSTM)及其變體GRU(Gated Recurrent Unit)。
3 基于深度學習的無線電信號調制識別的研究現狀
目前深度學習在無線電信號調制識別的研究中主要是基于CNN及LSTM架構。最早在深度學習網絡信號調制識別分類器中,特別是在CNN分類器中,一般根據CNN對圖片識別的原理,對接收到的信號進行預處理,生成循環譜圖或者星座圖[16]等,并將生成的圖形作為CNN網絡的輸入,通過卷積層和子采樣層交替進行對循環譜圖或星座圖的特征提取并完成自動識別。其中利用信號的循環譜特征識別方法是早前比較受歡迎的識別方法,因為每一個調制信號的循環譜都是不一樣的,所以可以根據信號的循環譜中峰值個數排列方式等特點來對不同的調制信號進行識別[17-18]。同時因為譜相關函數對噪聲的抑制能力很強,即使在低信噪比的情況下,依然能夠檢測出信號的類型。這些方法本質也需要特征提取,并且需要對信號進行預處理,形成圖片模式,再通過卷積神經網絡自動學習圖片的特征,進而對原始信號進行分類。而在2016年O′SHEA T J提出了利用CNNs的框架對通信信號中11種調制信號進行自動調制識別[19],并且是對接收信號的原始采集數據進行自動學習分類,相比于傳統的機器學習算法,識別率有了很大的提升。O′SHEA T J提出的調制識別分類器的模型是一個四層的卷積神經網絡,兩個卷積層和兩個全連接層,前三層使用ReLU函數作為激活函數,在最后的輸出層使用SoftMax激活函數,經過最后一層SoftMax激活函數的計算,得到概率最大的輸出即為當前數據的分類結果。
后續研究發現,LSTM模型中隱含層中的節點保留了信號的動態時域特性[20],因此,在目前流行的調制識別分類器中,結合了CNN和LSTM的結構,即一般在卷積層與全連接層中間插入一層LSTM層,在同等條件下,這種混合結構的分類器的識別率要高于單一的CNN模型。
綜合國內外各種文獻發現,基于深度學習的信號調制識別模型的識別率隨著信噪比的減小而降低,一般在10 dB以上信噪比識別率達到90%,0 dB以上信噪比條件下識別率最高能達到80%,但是一般0 dB以下信噪比的識別率一般不到50%。因此,除了結合CNN與LSTM的優點,搭建一種混合神經網絡架構,提高0 dB以下信噪比的信號識別率之外,進一步的工作應該側重于設計新型的架構,比如結合CNN與GRU的架構,或者通過新穎的訓練方法來達到省事省力并且高效的識別率。
4 結論
本文主要介紹了深度學習在無線電信號調制識別中的應用。由于基于人工神經網絡的信號調制識別沒有完善明確統一的理論,特別是基于深度學習神經網絡模型更是沒有統一明確的理論,而處于探索摸索的階段。因此綜合以上發現及結合無線電監測工作,未來深度學習在無線電信號調制識別中的應用可以發展提升的地方有以下幾個方面:提高低信噪比信號的調制識別率,特別是信噪比0 dB以下信號的識別率;對于CNN-LSTM混合架構,在不降低識別率的條件下,探索新的訓練方法,減少模型參數,達到省力而有效的自動學習方法;探索CNN-GUR網絡模型,對某一段波段(如短波、超短波、C波段等)內所有類型信號的自動識別并保證模型的泛化性;在特定的業務頻段,如廣播業務頻段,深度利用RNN-HMM混合聲學模型對整個無線電頻段內可能的非法發射的廣播進行自動識別。
參考文獻
[1] 楊敏,王金庭,朱靜.一種PSK/QAM數字調制方式識別方法[J].電子技術應用,2013,41(11):11-13.
[2] 潘明.基于神經網絡的軟件無線電信號調制識別[D].成都:電子科技大學,2007.
[3] 周江.基于神經網絡的通信信號調制識別研究及實現[D].成都:電子科技大學,2018.
[4] AZZOUZ E E,NANDI A K.Modulation recognition using artificial neural networks[J].Signal Processing,1996,56(2):165-175.
[5] HASSAN K,DAYOUB,HAMOUDA H,et al.Automatic modulation recognition using wavelet transform and neural network[C].IEEE International Conference on Intelligent Transport Systems Telecommunications,2010.
[6] QIAN L J,ZHU C Y.Modulation classification based on cyclic spectral features and neural network[C].IEEE International Congress on Image & Signal Processing,2010.
[7] ADZHEMOV S S,TERESHONOK M V,CHIROW D S.Type recognition of the digital modulation of radio signals using neural networks[J].Engineering Physics,2015,70(1):23-28.
[8] 馮濤.基于人工神經網絡的通信信號分類識別[J].Radio Engineering,2006,36(6):24-26.
[9] 王康利,謝建菲,趙蘭華.基于神經網絡的軟件無線電信號的調制識別[J].計算機測量與控制,2004,12(9):877-894.
[10] 于成龍,趙寶江.基于BP神經網絡的C波段無線電信號分類識別[J].牡丹江師范學院學報,2015(2):21-22.
[11] 李佳宸.基于深度學習的數字調制信號識別方法研究[D].哈爾濱:哈爾濱工程大學,2017.
[12] HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.
[13] LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521:436-444.
[14] SONG L H,QIAN X H,CHEN Y R,et al.A pipelined ReRAM-based accelerator for deep learning[C].IEEE International Symposium on High Performance Computer Architecture,2017.
[15] GUAN Y G,YUAN Z H,SUN G Y,et al.FPGA-based accelerator for long short-term memory recurrent neural networks[C].IEEE Asia and South Pacific Design Automation Conference,2017.
[16] 彭超然,刁偉鶴,杜振宇.基于深度卷積神經網絡的數字調制方式識別[J].計算機測量與控制,2018,26(8):222-226.
[17] WEST N E,O′SHEA T J.Deep architectures for modulation recognition[C].2017 IEEE International Symposium on Dynamic Spectrum Access Networks,2017.
[18] 張永樂.基于CNN架構的通信信號調制模式分類識別研究[D].沈陽:沈陽航空航天大學,2018.
[19] O′SHEA T J,CORGAN J,CLANCY T C.Convolutional radio modulation recognition networks[C].International Conference on Engineering Applications of Neutral Networks,2016.
[20] ZHANG M,ZENG Y,HAN Z D,et al.Automatic modulation recognition using deep learning architectures[C].2018 IEEE 19th International Workshop on Signal Processing Advances in Wireless Communications(SPAWC),2018.
作者信息:
袁冰清,王巖松,鄭柳剛
(國家無線電監測中心上海監測站,上海201419)