摘 要: 提出基于腦電信號(EEG)的睡眠分期研究。利用離散小波變換(DWT)的db8小波分解得到的細節分量作為信號新的表達,把各個細節分量能量作為特征,建立帶高斯徑向基核函數(RBF)的非線性支持向量機(SVM)模型。研究發現,其對睡眠分期研究的方案是可行的,滿足模型對泛化能力的要求。
關鍵詞: 睡眠分期;離散小波變換;支持向量機
0 引言
睡眠是人體一種非常重要且不可或缺的生理活動,但工作壓力、疾病、不良的生活習慣等因素會影響人的睡眠質量,長期睡眠質量低下會引發各種心理、生理疾病。依據生理信號數據自動識別睡眠,分期對睡眠狀態與睡眠質量的科學評估以及相關疾病的診斷及治療有很重要的意義和參考價值。
對睡眠的研究往往是基于相關生理數據。在清醒和不同睡眠階段,人的腦電信號(Electroencephalogram,EEG)在不同的腦區會出現不同的節律變化分布,可以表征人體的不同睡眠階段。參考文獻[1-3]提取最小值、最大值、均值、標準差等頻域特征和排列組合熵、樣本熵等非線性動力學參數,但其樣本較少,模型推廣性能不足。參考文獻[4]分別使用Choi–Williams分布、連續小波變換和Hilbert-Huang變換(Hilbert-Huang Transform,HHT)提取特征,利用隨機森林分類器說明不同方法提取特征對分類器的準確率有一定影響,其中使用CWT提取特征的分類器準確率最高。參考文獻[5-6]分別建立復發性神經分類器和支持向量機(Support Vector Machine,SVM)模型,對非快速眼動深睡期沒有細分。而參考文獻[7]使用EEG各個節律波頻帶的相對功率作為特征,所建立的SVM模型準確率高于神經網絡(Neural Network,NN)模型,該研究只是將睡眠分為4個階段,未具體區分非快速眼動睡眠各個階段,且清醒期的識別率偏低,并沒有突出提高清醒期識別率的基礎作用。參考文獻[8]研究了25位受試者睡眠EEG、眼電(Electrooculogram,EOG)和肌電(Electromyogram,EMG)信號,提取特征后在深度信念網絡(Deep Belief Networks,DBN)基礎上建立的馬爾科夫模型準確率高于未提取特征的模型準確率,說明提取特征是建立模型的重要步驟。由于樣本來自疑似睡眠呼吸障礙者,該模型具有較強的針對性和局限性。
由于人的生理信號存在個體差異,當被試者人數增加時與信號特征離散性增大,而導致模型的推廣能力下降。本文使用Sleep-EDF數據庫EEG Fpz-Cz、EEG Pz-Oz這2個通道的數據。采樣頻率為100 Hz,由專家根據R&K標準[9],基于經驗標定受試者每30 s區間的狀態。R&K標準將睡眠分為6個階段,分別是清醒期(Wake)、非快速眼動期(Non-Rapid Eye Movement,NREM)和快速眼動期(Rapid Eye Movement,REM),其中NREM又可分為淺睡期(包括NREM1、NREM2)和深睡期(包括NREM3、NREM4)。
1 離散小波變換
利用EEG將睡眠分期的關鍵是對能表征各個睡眠階段的特征進行提取。受試者在長時間的測試過程中,電極松動或移動會帶來基線漂移,而對頻譜圖的研究發現,低頻信號的幅值相對較大,尤其以1 Hz以內的幅值最為顯著,據此可以判斷,信號主要存在基線漂移現象。通過離散小波變換處理數據,在消除基線漂移之后提取各個分量的能量作為模型特征。
小波變換是在傅里葉變換的基礎上發展起來的一種時頻分析方法,在處理非平穩信號方面,具有良好的時頻特性。由于實驗采集到的信號大多是經過采集系統采集的離散數據,因此離散小波變換的應用非常廣泛[10]。將信號f(t)進行k尺度離散小波變換,計算公式如下:
原始時域信號經由離散小波變換得到逼近分量 Ai(t)和細節分量Di(t)(i=1,2,...,k)。本文使用db8小波分解,分別得到細節分量Di(t)(i=1,2,...,8)和逼近分量A8(t)。細節分量Di(t)(i=1,2,...,8)從D1(t)到 D8(t)的頻率逐次降低。其中,D7(t)和D8(t)的頻譜主要集中在1 Hz以內,故可以將其作為基線漂移分量,置零即可。圖1顯示了一名受試者在REM期的EEG Fpz-Cz通道的30 s信號經離散小波變換得到細節分量Di(t)(i=1,2,…,6)的頻域信號。
在不同睡眠階段,各個細節分量的能量不同,可以作為特征區分各個睡眠階段。本文使用細節分量Di(t)(i=1,2,...,6)的能量信息作為部分特征實現睡眠分期。
2 非線性SVM模型分析
SVM在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢。非線性SVM問題的基本思想是,通過非線性變換,將輸入變量x轉化到某個高維空間,然后再變換空間求最優分類面。非線性SVM問題的最優化目標是:
相應的判決函數為:
如果y≥0,判為一類,類別為1;否則,類別為-1。
式(2)和式(3)中K(xi,x)為核函數,本文選擇使用了高斯徑向基核函數:
參數C、選擇對模型的準確性有很大的影響,本文使用了基于交叉驗證的網格搜索法來進行SVM參數尋優。
3 實驗結果
選取Sleep-EDF數據庫中8位受試者的數據。將6位受試者的數據作為一組,其中的75%用來建立非線性SVM模型,剩余的25%用來測試模型精度,驗證模型是否出現過擬合問題。利用額外2位受試者的數據測試模型的精度,驗證模型的泛化能力。本研究的整體流程如圖2所示。
使用臺灣林智仁的LIBSVM作為研究平臺。模型測試精度如表1所示。
本文模型的分期平均準確率為85.72%,說明模型沒有出現過擬合。實際有以下方面對模型精度存在較大的影響:原始時域EEG信號中的干擾成分過多;專家標定狀態本身就有一定誤差;睡眠的各個階段是連續的;等等。
使用已經建立的SVM模型,將剩余2名受試者的數據經測試對比,平均精度為81.65%。因此,本文的模型滿足了對泛化能力的要求,驗證了本研究的可行性。
4 結論
使用腦電信號研究睡眠分期對數據預處理、降維處理、提取特征、分類器的選擇都是很重要的環節。本文對db8小波分解EEG得到的各個層次小波提取能量特征,使用SVM進行睡眠分期。本文的模型經過測試之后,達到比較理想的分類效果,即具有良好的推廣能力。
本文的研究只是基于EEG。在今后的研究中,還有很多工作需要進一步深入研究,也可將其他的生理指標引入睡眠分期的研究,如EOG、心電(Electrocardiogram,ECG)、EMG,相信也會有好的研究前景。
參考文獻
[1] GNE?S, POLAT K, YOSUNKAYA . Efficient sleep stage recognition system based on EEG signal using K-means clustering based feature weighting[J]. Expert Systems with Applications, 2010,37(12):7922-7928.
[2] 李谷,范影樂,龐全.基于排列組合熵的腦電信號睡眠分期研究[J].生物醫學工程學雜志,2009,26(4):869-872.
[3] 周鵬,李向新,張翼,等.基于主成分分析和支持向量機的睡眠分期研究[J].生物醫學工程學雜志,2013,30(6):1176-1179.
[4] FRAIWAN L, LWEESY K, KHASAWNEH N, et al. Automated sleep stage identification system based on time–frequency analysis of a single EEG channel and random forest classifier[J]. Computer Methods and Programs in Biomedicine, 2012,108(1):10-19.
[5] HSU Y L, YANG Y T, WANG J S, et al. Automatic sleep stage recurrent neural classifier using energy features of EEG signals[J]. Neurocomputing, 2013,104:105-114.
[6] KOLEY B, DEY D. An ensemble system for automatic sleep stage classification using single channel EEG signal[J]. Computers in Biology and Medicine, 2012,42(12):1186-1195.
[7] LEE J, YOO S K. Electroencephalography analysis using neural network and support vector machine during sleep[J]. Engineering, 2013(5):88-92.
[8] L?魧NGKVIST M, KARLSSON L, LOUTFI A. Sleep stage classification using unsupervised feature learning[J]. Advances in Artificial Neural Systems, 2012,2012:9.
[9] RECHTSCHAFFEN A, KALES A. A manual of standardized terminology, techniques and scoring systems for sleep stages of human subjects[M]. Los Angeles: UCLA Brain Information Service/Brain Research Institute, 1968.
[10] OCAK H. Automatic detection of epileptic seizures in EEG using discrete wavelet transform and approximate entropy[J]. Expert Systems with Applications, 2009, 36(2): 2027-2036.