文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.171839
中文引用格式: 金純,陳光勇. 基于優化的LSTSVM的多模態生理信號情感識別[J].電子技術應用,2018,44(3):112-116.
英文引用格式: Jin Chun,Chen Guangyong. Emotion recognition of multimodal physiological signals based on optimized LSTSVM[J]. Application of Electronic Technique,2018,44(3):112-116.
0 引言
人們對計算機的依賴性越來越強,智能人機交互已經引起人們廣泛的關注,情感識別能力成為度量人機交互智能化程度的重要依據[1]。相比于語音、動作和表情信號,生理信號難以隱藏,能更加真實地反應人的情感狀態。研究表明,使用多模態的生理信號比使用單一模態的生理信號更能準確地識別出人的情感類型[2],因而基于多模態生理信號的情感識別受到越來越多研究人員的關注。
許多學者的研究表明,生理信號中包含很多有價值的情感信息。目前基于生理信號的情感識別主要是提取信號的時域、頻域特征,然后進行目標情感狀態的分類。文獻[3]使用支持向量機來對情感進行分類。文獻[4]使用改進的支持向量機進行情感分類。但傳統支持向量機計算復雜度較高,當需要處理的數據規模逐漸變大時,其分類精度下降較快,訓練需要的時間也變得更長,參數選擇也對其分類效果有較大影響。本文提出改進螢火蟲算法優化的最小二乘雙支持向量機并將其用于多模態情感識別中,實驗結果表明,提出的算法識別精確性和訓練開銷均有一定的提高。
1 最小二乘雙支持向量機模型
雙胞胎支持向量機(Twin Support Vector Machine,TSVM)是一種用于二分類問題的分類器。TSVM從傳統的支持向量機優化而來,具有傳統支持向量機的一些優點,同時對大規模數據有較好的處理能力。TSVM分類器的關鍵是為兩種不同類別的數據分別確定一個分類平面,實際分類過程中,樣本數據距離哪個分類平面更近就被判別為對應類別的數據。
最小二乘雙支持向量機(Least squares Twin Support Vector Machine,LSTSVM)是基于雙胞胎支持向量機(TSVM)提出的,將TSVM的兩個小規模的二次規劃問題轉化為求解一組相對簡單線性方程組的問題,其運算過程被極大地簡化了,因此 LSTSVM分類器比傳統向量機的運算速度更快。非線性的最小二乘雙支持向量機通過核函數的映射作用,可以將線性分類的情況擴展到非線性分類的情況,從而非線性樣本的分類問題得以有效解決。
2 改進型螢火蟲算法
2.1 標準螢火蟲算法
標準的螢火蟲算法(Firefly Algorithm,FA)是由YANG X S提出的一種新型的群體智能優化算法[5],在許多領域都得到了應用。
算法將每個螢火蟲的位置近似為待求問題的一個解,將螢火蟲間相互吸引和位置更新的過程近似為對最優解進行搜索和迭代。該算法涉及兩個關鍵點,即熒光亮度和吸引度。吸引度與亮度相關,亮度較高的螢火蟲將吸引一定范圍中亮度低的螢火蟲。算法迭代多次后,最亮的螢火蟲的位置就是問題的最優解。
算法實現過程中,從數學角度定義以下幾個概念:
定義1:螢火蟲的熒光亮度為:
其中,xi(t+1)為螢火蟲xi第t+1次移動后的位置;α為步長因子,一般為[0,1]中的常數;rand為[0,1]上服從均勻分布的隨機因子。
2.2 改進的螢火蟲算法
2.2.1 基于Logistic映射的種群初始化
FA使用隨機化的方法產生初始化種群,這種方式產生的種群其多樣性較低,而種群多樣性對算法的性能有重要的影響,低種群多樣性會帶來收斂速度變慢、優化精度降低等問題。
為了提高初始種群的多樣性,將混沌動力學引入螢火蟲算法。混沌運動表面來看是無序的、隨機的,具有不確定性,但實際上混沌運動與一般意義上的隨機運動不同,混沌運動實質上具有遍歷性、規律性等特點,在一定范圍內有其特定的規律。
當精確度趨近于無限大時,混沌序列可以被看作為一種理想的隨機序列,本文采用Logistic映射所生成混沌序列實現來初始化種群。相比于隨機化產生初始種群的方式,Logistic映射不僅能夠產生多樣性的初始種群,也能在一定程度上避免早熟收斂。Logistic映射表達式為:
2.2.2 新的吸引度計算方式
螢火蟲之間的吸引力的大小應該與兩個螢火蟲的距離和螢火蟲各自的熒光亮度有關,當距離一定時,熒光亮度越大,吸引力就越大;當熒光亮度一定時,距離越遠,吸引度越小。而式(10)中螢火蟲間吸引度的大小與距離和最大吸引力有關,并且通常最大吸引力取值為常數,這與實際情況是不相符的,所以將兩個螢火蟲間的吸引力公式更新為:
2.2.3 基于隨機慣性權重的位置調節
慣性權重表明了螢火蟲以前的位置對當前位置的影響,合理調節慣性權重就能較好地平衡算法的全局探索能力和局部搜索能力。在算法迭代初期,較高的慣性權重可以使螢火蟲以較快的速度趨近最優解,算法全局的探索能力較強。算法迭代后期,螢火蟲已移動至最優解附近,此時較低的慣性權重可以避免螢火蟲因移動的距離過大而越過最優解導致在最優解附近出現震蕩的問題。
文獻[6]給出了線性遞減的慣性權重,算法的收斂速度比標準FA快,但算法也存在過早收斂的問題。為克服線性遞減的慣性權重的不足,給出隨機慣性權重的權重計算方法:
在每次迭代中,為了避免部分螢火蟲偶然不規則的移動而造成權重的大幅度改變,實際權重取N只螢火蟲慣性權重的平均值。
2.2.4 基于萊維飛行的隨機移動
萊維分布是法國數學家萊維(Lévy)提出的一種概率分布,自然界中動物的許多行為都符合萊維分布的情形。Lévy飛行是一種短距離和長距離行走相間的行走方式[7],行走步長服從萊維分布。
Lévy飛行能擴大搜索的范圍、增加種群多樣性并使算法更容易跳出局部最優點。在螢火蟲算法的隨機移動項中引入Lévy飛行能極大地增強算法的搜索性能,當螢火蟲位于最優解附近時,Lévy飛行使算法可以較快地搜索到最優解。
Lévy飛行的隨機步長符合萊維分布,參數為λ的萊維分布為:
3 改進型螢火蟲算法優化的最小二乘雙支持向量機
本文的核函數采用徑向基核函數,徑向基核函數的參數取值范圍較大,不同的取值對分類器的分類性能也會產生不同影響。使用徑向基核函數的LSTSVM,需要確定的參數有LSTSVM的懲罰系數c1、c2和核函數的參數σ。
懲罰系數c1、c2可看作是對偏離正確類別的樣本數據的懲罰程度,選取合適的懲罰系數c1、c2可以較好地平衡分類模型的訓練誤差以及模型的復雜性兩者的差別,從而使分類模型具備較強的推廣能力。
核函數參數σ的選取對模型的性能也有著重要影響。如果選取的參數σ過小,模型的泛化能力難以保證;如果選取的參數σ過大,模型的分類精度又難以提高。因此在進行參數的選擇時,需要對多個參數間的相互影響進行綜合考慮。本文提出MFA-LSTSVM算法,基于改進型螢火蟲算法優選最小二乘雙支持向量機的各項參數,使算法達到泛化能力增強的同時具備較高的識別精度,算法步驟如下:
(1)系統初始化,由式(10)生成螢火蟲初始種群的規模、位置信息,并設置光強吸收系數、最大吸引度和步長因子等參數;
(2)將懲罰系數c1、c2和核函數的參數σ賦值給LSSTSVM,計算適應度函數,適應度函數為f=RMSEtraindata;
(3)根據式(6)計算群體中每個螢火蟲的熒光亮度;
(4)對各個螢火蟲的亮度排序,得到亮度最高的螢火蟲所對應的位置;
(5)根據式(11)、式(14)、式(16)分別計算螢火蟲吸引力、權重和步長值;
(6)根據式(20)更新螢火蟲的位置;
(7)判斷是否達到結束條件,結束條件為適應度函數的值需要達到指定的搜索精度,若不滿足結束條件返回步驟(2),若滿足條件則執行下一步;
(8)獲得最優參數,并賦值給LSTSVM;
(9)由訓練數據得到最優LSTSVM分類模型,并使用最優LSTSVM分類模型對測試數據進行測試。
算法流程圖如圖1所示。
4 MFA-LSTSVM在情感識別中的應用
本文使用KOELSTRA S和SOLEYMANI M等人公布的“DEAP”生理情感數據庫[8]中的數據來測試情感識別算法的效果。研究人員招募了32名志愿者(19~37周歲,平均年齡26.9,男、女各50%),志愿者在刺激材料的刺激下分別產生不同的情感,同時他們的多種生理信號被記錄,信號共48導聯。每名志愿者在觀看相應材料后分別在效價、喚醒度、優勢度、喜歡度和熟悉度5個維度上的進行評分,自評分是范圍為1~9的整數。這些記錄形成了生理情感數據庫“DEAP”。本文將基于“DEAP”數據庫中的生理數據進行情感狀態的識別,使用的生理信號為腦電、皮膚電、肌電、呼吸4種模態的信號。
著名心理學家Ekman提出了離散的情感模型,將人的基本情感分為6種,即憤怒、厭惡、恐懼、高興、悲傷和驚訝。繼而其他學者提出了連續情感模型,其中最常用的是RUSSELL J A提出的效價-喚醒度(valence-arousal)情感模型[9],該模型使用喚醒度(情感是主動的還是被動的)和效價(情感是正面的還是負面的)兩個維度來衡量情感狀態,有很強的描述情感的能力。本文使用效價-喚醒度情感模型對情感狀態進行分析,在效價和喚醒度兩個維度上分別將情感分為兩個類別。本文中自評分與情感類別的關系如表1所示。
本文中各個模態生理信號的最佳特征子集如表2所示。
為衡量分類器的分類效果,本文采用精確率、召回率、F1-measure 3個指標來分析,數值越大表示分類器效果越好,它們的計算方式如式(21)~式(23)所示。同時與文獻[10]提出的LSTSVM和文獻[11]提出的算法(Particle Swarm Optimization Algorithm Least squares Twin Support Vector Machine,PSO-LSTSVM)做了對比,各分類器分類結果如表3所示。
其中,TP表示正確類別被判為正確類別的數目,FP表示錯誤類別被判為錯誤類別的數目,FN表示正確的類別被判為錯誤類別的數目。
分類結果表明,在精確率、召回率和F1-measure值方面,MFA-LSTSVM的效果要好于LSTSVM和PSO-LSTSVM,提出的MFA-LSTSVM的分類效果更佳。
為了更加明確地衡量不同分類器的性能,做出了不同情感狀態不同算法的ROC平面,如圖2,ROC平面由正確識別率(True Positive Rate,TPR)和錯誤識別率(False Positive Rate,FPR)構成。對角線TPR=FPR將二維平面分成了兩部分,在TPR>FPR區域內,距離對角線較遠表示識別效果較好;在TPR<FPR區域內,距離對角線較遠表示識別效果較差。
可以看出對不同的情感狀態,MFA-LSTSVM的分類效果均比其他兩種算法更優。對于各種情感狀態,PSO-LSTSVM的效果比默認參數的LSTSVM好,對于低喚醒度低效價情感和高喚醒度低效價情感,MFA-LSTSVM的效果明顯好于其他兩者。
為進一步分析分類器的性能,記錄了分別用訓練數據和測試數據對3種分類器進行訓練和測試所需要的時間,如表4所示。
實驗結果表明,無論在訓練還是測試所需要的時間,MFA-LSTSVM的消耗均少于LSTSVM 和PSO-LSTSVM,這說明提出的MFA-LSTSVM算法能夠降低訓練和測試的難度、提高效率。
5 結束語
本文基于新穎的群體智能算法和分類性能突出的最小二乘雙支持向量機,提出了一種改進型螢火蟲算法優化的最小二乘雙支持向量機情感識別算法,并使用公開的情感數據庫“DEAP”對算法進行了測試。通過與現有的兩種算法做了對比分析,從多個維度的實驗結果表明,本文提出的算法具有較好的識別效果,是一種性能較高的情感識別算法。
參考文獻
[1] ALZOUBI O,SIDNEY K D,CALVO R A.Detecting naturalistic expressions of nonbasic affect using physiological signals[J].Affective Computing IEEE Transactions on,2012,3(3):298-310.
[2] PICARD R W,VYZAS E,HEALEY J.Toward machine emotional intelligence:Analysis of affective physiological state(HTML)[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2001,23(10):1175-1191.
[3] PAN Y,SHEN P,SHEN L.Speech emotion recognition using support vector machine[J].International Journal of Smart Home,2012,1(20):6-9.
[4] YU B,LI H F,FANG C Y.Speech emotion recognition based on optimized support vector machine[J].Journal of Software,2012,7(12):2726-2733.
[5] YANG X S.Firefly algorithm,Lévy flights and global optimization[C].Research and Development in Intelligent Systems XXVI,2010,20:209-218.
[6] TIAN Y,GAO W,YAN S.An improved inertia weight firefly optimization algorithm and application[C].International Conference on Control Engineering and Communication Technology.IEEE Computer Society,2012:64-68.
[7] 楊嬌,葉春明.應用新型螢火蟲算法求解Job-shop調度問題[J].計算機工程與應用,2013,49(11):213-215.
[8] KOELSTRA S,MUHL C,SOLEYMANI M,et al.DEAP:A database for emotion analysis;using physiological signals[J].IEEE Transactions on Affective Computing,2012,3(1):18-31.
[9] RUSSELL J A.A circumplex model of affect[J].Journal of Personality and Social Psychology,1980,39(6):1161-1178.
[10] XU Y,CHEN M,LI G.Least squares twin support vector machine with Universum data for classification[J].International Journal of Systems Science,2015:1-9.
[11] LIU S,TIAN Y,PENG C,et al.Facial expression recognition approach based on least squares support vector machine with improved particle swarm optimization algorithm[C].IEEE International Conference on Robotics and Biomimetics.IEEE,2010:399-404.
作者信息:
金 純1,2,陳光勇1
(1.重慶郵電大學 無線移動通信理論與技術重點實驗室,重慶400065;2.重慶金甌科技發展有限責任公司,重慶400041)