基于生成對抗網絡的小樣本圖像數據增強技術
網絡安全與數據治理 6期
楊鵬坤,李金龍,郝潤來
(中國科學技術大學計算機科學與技術學院,安徽合肥230026)
摘要: 基于生成對抗網絡(GANs)的圖像數據增強方法在近年來展現出了巨大的潛力。然而生成高分辨率、高保真圖像通常需要大量訓練數據,這和缺乏訓練數據的現狀背道而馳。為解決這一問題,提出了一種能夠在小樣本、高分辨率圖像數據集上穩定訓練的條件生成對抗網絡模型,并且將該模型用于數據增強。實驗結果表明,在基準數據集上,該模型與當前最新模型相比能夠生成更加逼真的圖像并取得了最低的FID值;在圖像分類任務中使用其進行數據增強能夠有效緩解分類器的過擬合問題。
中圖分類號:TP391
文獻標識碼:A
DOI:10.19358/j.issn.2097-1788.2023.06.013
引用格式:楊鵬坤,李金龍,郝潤來.基于生成對抗網絡的小樣本圖像數據增強技術[J].網絡安全與數據治理,2023,42(6):79-84,102.
文獻標識碼:A
DOI:10.19358/j.issn.2097-1788.2023.06.013
引用格式:楊鵬坤,李金龍,郝潤來.基于生成對抗網絡的小樣本圖像數據增強技術[J].網絡安全與數據治理,2023,42(6):79-84,102.
Few-shot image data augmentation based on generative adversarial networks
Yang Pengkun,Li Jinlong,Hao Runlai
(School of Computer Science and Technology, University of Science and Technology of China, Hefei 230026, China)
Abstract: In recent years, image data augmentation methods based on Generative Adversarial Networks (GANs) have shown great potential. However, generating highresolution, highfidelity images typically requires a large amount of training data, which contradicts the current lack of training data situation. To address this issue, a conditional GAN model that can stably train on fewshot, highresolution image datasets has been proposed for data augmentation. Experimental results on benchmark datasets indicate that this model, compared to the current stateoftheart models, is capable of generating more realistic images and achieving the lowest Fréchet Inception Distance (FID) score. Furthermore, using this model for data augmentation in image classification tasks effectively mitigates overfitting issues in classifiers.
Key words : generative adversarial networks; data augmentation; image classification
0 引言
視覺深度學習的成功不僅僅取決于高容量的模型,還依賴于大規模標注數據的可用性。許多優秀的模型在大規模數據集上取得了良好的性能。然而,對于視覺識別任務,由于數據的收集和標注耗費巨大,通常在沒有足夠樣本的場景下訓練模型,往往會導致模型過擬合,從而降低其泛化性能。
為了解決這些問題,數據增強是常用的緩解數據匱乏的手段之一。雖然傳統的圖像增強技術(如旋轉和隨機裁剪)的確有效果,但一些轉換可能是無意義的,甚至會導致圖像語義上的改變。如數字‘6’旋轉180°變成了‘9’,改變了語義,這需要專家經驗進行評估。最近的研究表明,使用生成對抗網絡(GANs)進行數據增強具有巨大潛力。生成對抗網絡是一種隱式生成模型,通過對真實樣本的數據分布進行建模,可以根據已有數據集的高維特征組合生成與訓練集完全不同的圖像,能夠為深度學習模型提供更多的圖像特征,以緩解過擬合問題。Mirza等人提出的條件生成對抗網絡(cGAN)可以通過控制類別生成對應類別的樣本,因此可以得到帶有標簽的樣本。
本文詳細內容請下載:http://www.viuna.cn/resource/share/2000005378
作者信息:
楊鵬坤,李金龍,郝潤來
(中國科學技術大學計算機科學與技術學院,安徽合肥230026)
此內容為AET網站原創,未經授權禁止轉載。