《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于分解策略的多標(biāo)簽在線特征選擇算法
基于分解策略的多標(biāo)簽在線特征選擇算法
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 4期
張永偉1,2,朱 祁1,2,吳永城1,2
(1.南瑞集團(tuán)(國網(wǎng)電力科學(xué)研究院)有限公司,江蘇 南京210003; 2.南京南瑞智慧交通科技有限公司,江蘇 南京210032)
摘要: 在線學(xué)習(xí)方法是用于大規(guī)模數(shù)據(jù)集的、高效且可擴(kuò)展的機(jī)器學(xué)習(xí)算法。然而,在對(duì)多標(biāo)簽數(shù)據(jù)集進(jìn)行特征選擇時(shí),傳統(tǒng)的在線多標(biāo)簽學(xué)習(xí)方法需要訪問數(shù)據(jù)集的所有特征,當(dāng)數(shù)據(jù)集具有較高維度時(shí),這種在線學(xué)習(xí)方式并不能適用于實(shí)際情景。針對(duì)多標(biāo)簽數(shù)據(jù)集的特征選擇,在現(xiàn)有研究的基礎(chǔ)上,使用二類分解策略,提出基于分解策略的多標(biāo)簽在線特征選擇算法。該算法利用稀疏正則化和截取方法進(jìn)行在線特征選擇,降低計(jì)算復(fù)雜度。實(shí)驗(yàn)表明,算法的特征選擇性能優(yōu)于其他多標(biāo)簽在線特征選擇算法。
中圖分類號(hào): TP305;TP181
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2097-1788.2022.04.010
引用格式: 張永偉,朱祁,吳永城. 基于分解策略的多標(biāo)簽在線特征選擇算法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2022,41(4):65-71,77.
Online multi-label feature selection algorithm based on binary relevance strategy
Zhang Yongwei1,2,Zhu Qi1,2,Wu Yongcheng1,2
(1.NARI Group Corporation(State Grid Electric Power Research Institute),Nanjing 210003,China; 2.Nanjing NARI Intelligent Transport Technology Co.,Ltd.,Nanjing 210032,China)
Abstract: Online learning method is an efficient and extensible machine learning algorithm for large-scale applications. However, when selecting features for multi-label datasets, the traditional online multi-label learning algorithms need to access all the features of the dataset. When the dataset has a higher dimension, this online learning method cannot be applied to the actual situation. Based on the existing research, a multi-label online feature selection algorithm based on decomposition strategy is proposed by using binary relevance strategy. This algorithm uses sparse regularization and interception methods for online feature selection to reduce computational complexity. The experimental results show that the feature selection performance of the algorithm is better than that of other multi-label online feature selection algorithms.
Key words : feature selection;online learning;multi-label classification;binary relevance strategy

0 引言

近年來,隨著多標(biāo)簽分類問題的深入研究,出現(xiàn)了大量的多標(biāo)簽分類算法。目前,在多標(biāo)簽分類中,存在四種主要的處理策略:數(shù)據(jù)分解法、算法擴(kuò)展法、混合法和集成法。特征選擇是多標(biāo)簽分類問題中的一個(gè)重要課題,并且已經(jīng)進(jìn)行了廣泛研究。對(duì)于分類,特征選擇的目標(biāo)是通過相關(guān)特征的一個(gè)子集來構(gòu)建有效的預(yù)測模型,通過消除不相關(guān)和冗余特征,可以減輕維度災(zāi)難的影響,提高泛化性能,加快學(xué)習(xí)過程,提高模型預(yù)測的性能。特征選擇已在許多領(lǐng)域得到應(yīng)用,特別是在涉及高維數(shù)據(jù)的問題中。

雖然已經(jīng)進(jìn)行了廣泛研究,但大多數(shù)現(xiàn)有的特征選擇研究都局限于批量學(xué)習(xí),假定特征選擇任務(wù)是以離線/批量學(xué)習(xí)的方式進(jìn)行的,而且訓(xùn)練實(shí)例的特征是先驗(yàn)的。這樣的假設(shè)并不總是適用于訓(xùn)練樣本以順序方式到達(dá)的實(shí)際應(yīng)用。與批量學(xué)習(xí)方式相比,在線學(xué)習(xí)方式則采用增量的方式處理數(shù)據(jù)集,相對(duì)而言,計(jì)算代價(jià)要小于批量學(xué)習(xí)算法。在現(xiàn)有的多標(biāo)簽在線分類算法中計(jì)算數(shù)據(jù)的全部特征信息是需要代價(jià)的。尤其是存在高維數(shù)據(jù)和數(shù)據(jù)冗余時(shí),傳統(tǒng)的多標(biāo)簽在線分類算法,需大量計(jì)算且分類性能較差。本文利用在線學(xué)習(xí)的優(yōu)勢,研究了多標(biāo)簽在線特征選擇問題,旨在通過有效地探索在線學(xué)習(xí)方法來解決多標(biāo)簽特征選擇問題。具體而言,多標(biāo)簽在線特征選擇的目標(biāo)是研究在線分類器,其僅涉及用于分類的少量和固定數(shù)量的特征。當(dāng)處理高維度的連續(xù)訓(xùn)練數(shù)據(jù)時(shí),如在線垃圾郵件分類任務(wù)(其中傳統(tǒng)的批量特征選擇方法不能直接應(yīng)用),在線特征選擇尤為重要和必要。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://www.viuna.cn/resource/share/2000004992





作者信息:

張永偉1,2,朱  祁1,2,吳永城1,2

(1.南瑞集團(tuán)(國網(wǎng)電力科學(xué)研究院)有限公司,江蘇 南京210003;

2.南京南瑞智慧交通科技有限公司,江蘇 南京210032)


微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 国产麻豆永久视频 | 日本三级网络 | 久久久久久久网 | 亚洲欧美专区精品久久 | 97在线免费 | 成人a级特黄毛片 | 午夜看片影院在线观看 | 成人视屏网站 | 久久久久久一级毛片免费野外 | 亚洲色图欧美一区 | 成人h免费观看视频 | 成人在色线视频在线观看免费大全 | 欧美亚洲国产激情一区二区 | 美女一级ba大片免色野外 | www.色黄| 在线国产视频观看 | 国产特黄特色a级在线视 | 亚洲作爱视频 | 色综合天天干 | 在线精品小视频 | 曰韩高清一级毛片 | 日韩在线高清视频 | 国产一区二区不卡 | 国产综合精品日本亚洲777 | 国产精品伦子一区二区三区 | 最近中文字幕在线6 | 国产精品视频一 | 亚洲国产成人综合精品2020 | 天天操天天摸天天干 | bl高h肉边走边做 | 欧美日韩在线播放一区二区三区 | 国产毛片毛片精品天天看 | 男女免费爽爽爽在线视频 | 一级毛片高清大全免费观看 | 亚洲天堂视频在线播放 | 欧美日韩高清观看一区二区 | 亚洲无线一二三四区手机 | 色视频在线观看免费 | 亚洲一区中文字幕 | 国产伦精一区二区三区视频 | 欧美性xxx免费看片 欧美性导航 |