中文引用格式: 黃炯炯. 智慧農業下基于聯邦學習的水稻病蟲害分類研究[J]. 電子技術應用,2024,50(11):89-98.
英文引用格式: Huang Jiongjiong. Research on rice pest and disease classification based on federated learning under smart agriculture[J]. Application of Electronic Technique,2024,50(11):89-98.
引言
水稻是全世界重要的食物來源,在亞洲更是占據了不可代替的地位。中國60以上的人口以米飯為主食,水稻種植面積在3 000萬公頃左右,占我國總播種面積的五分之一以上[1]。在傳統的農業生產模式中,人力資源的消耗通常十分顯著。在水稻的種植過程中,細菌、真菌和其他微生物的侵害對水稻的健康狀況和產量構成了嚴重威脅,導致了巨大的損失。農業生產中為了應對病蟲害問題,需要投入大量勞動力,這不僅增加了農業成本,也加大了勞動力的工作負擔。
物聯網技術[2]和計算機視覺[3]等科技的引入、科技與農業的深度融合推動了農業智慧化方向的快速發展,實現智慧農業[4]的全新格局。在智慧農業下,農業通過智能農業設備進行水稻病蟲害的自動化治理,不僅顯著提升了農業種植的效率,更在減少農業損失方面發揮了至關重要的作用。這種智能化的治理模式不僅代表了農業現代化的重要方向,也為提高農業生產效益、促進農業可持續發展注入了新的動力與意義。
近年來,深度學習技術在各個領域都取得了巨大進展,特別是植物病蟲害分類方面。隨著農業智能化發展,人們對于智能治理植物病蟲害提出了更高要求。在智慧農場中,由于分散于不同地區且歸屬于不同組織機構的農業設備在運行中產生了數據孤島問題,給數據整合與分析帶來較大困擾。為了解決該問題,本文在研究中加入了聯邦學習框架(FL),聯邦學習在設備進行深度學習任務時對數據隱私保護和提高模型性有很大幫助。聯邦學習在2016年由谷歌研究院提出[5],它是一種分布式機器學習方法,允許在多個設備或計算節點上進行模型訓練,而無需將原始數據傳輸到中央服務器。這種學習方法的核心思想是在保護數據隱私的同時,允許多個參與方共同學習一個全局模型,聯邦學習有效地解決了數據孤島[6]這個難題。
在以往的研究中,不少學者通過改進深度學習的卷積神經網絡(CNN)來提高水稻病蟲害的識別分類性能。比如Latif等學者[7]對預訓練模型VGG19進行改進,在非歸一化增強數據上擁有96.08的準確率,高于相同或類似數據集在其他研究中的表現。Bhimavarapu[8]在卷積神經網絡中改進了激活和優化函數,減少了損失并明顯地提高了預測性能和分類準確性。預訓練能夠加速訓練過程并提高訓練效果,在研究中使用預訓練模型進行遷移學習也是不錯的方法[9]。Ahad等學者[10]對六種CNN預訓練模型進行了水稻病蟲害分類比較,對五種預訓練模型進行遷移學習,通過比較得到不同模型的效果及優缺點。
傳統的集中式機器學習要面對數據安全隱私和數據中心化的挑戰[11],醫療和金融領域飽受這些問題的困擾[12]。谷歌團隊設計了聯邦學習應用在這些領域來解決以上矛盾。在醫療領域,Sheller等研究者[13]發現,對十個醫療機構的數據進行聯邦學習的結果已經達到了集中數據模型質量的99%。他們又進一步研究了合作機構間的數據分布對模型質量和學習模式的影響,通過與其他多種協作方法相比證明了聯邦學習的優越性,聯邦學習在醫院數據上的應用將進一步推動個性化精準醫療的發展。Adnan等人[14]則是利用聯邦學習分析醫學上的組織病理學圖像,與傳統訓練相比他們所使用的差分私有聯邦學習是醫學圖像分析中機器學習模型協作開發的可行且可靠的框架。Li等人[15]提出一種聯邦學習用于金融信用風險管理領域的應用方案,聯邦學習在具有異構特征的Non-IID銀行小樣本數據下的金融信貸風險管理中的性能提高了14%。聯邦學習在近期開始應用到了農業領域中。Sharma等學者[16]利用聯邦學習下的CNN模型對馬鈴薯作物病蟲害進行準確分類;Kaur等人[17]則是利用該技術對辣椒葉的疾病進行了分類;Tripathy等人[18]在聯邦學習框架下,利用LeNet模型提取特征,對水稻病蟲害進行了分類優化。聯邦學習在這些農業場景下都有不錯的表現。
盡管病蟲害識別技術已相當成熟,但隨著智慧農業的崛起,對該場景的需求也呈現出新的趨勢和變化。本文在智慧農業場景下,使用聯邦學習解決了不同機構和地區設備的數據孤島問題。不同的數據分布對聯邦學習產生影響,本文將水稻病蟲害圖像分為IID和Non-IID數據[19],并把預訓練模型作為初模型進行特征提取以獲得更高的效率和準確率。
針對以上幾點,本文做了相應的研究和實驗加以驗證,證實了該場景下應用聯邦學習和使用預訓練模型的方案可行性并探索了適合該方案和實驗環境下的預訓練模型和條件。
本文詳細內容請下載:
http://www.viuna.cn/resource/share/2000006216
作者信息:
黃炯炯
(浙江農林大學 數學與計算機科學學院,浙江 杭州 311300)