文獻標志碼:A
DOI: 10.16157/j.issn.0258-7998.233921
引用格式: 崔燾,張昊楠,阮福明,等. 基于強化Q學習的海上地震勘探航線自動規劃方法[J]. 電子技術應用,2023,49(11):105-110.
【引言】
海上地震勘探航線規劃作為綜合導航系統的重要組成部分,一直是各家石油公司的研究重點。由于海上地震勘探的特殊作業環境,除洋流、障礙物、水下環境和漁業等因素的干擾外,拖纜船在工區內的航線規劃往往來自于工作人員的現場決策,受限于人員工作經驗等因素,拖纜作業實際施工效率較低,直接導致工區采集成本的增加。拖纜法地震勘探作為海上地震勘探的重要方法,當前國內外各主要石油公司都非常重視對拖纜地震勘探相關技術的研究,以提高作業效率,探索海上地震勘探新技術與新方法。
多年來,人們將機器學習應用于醫學、軍事等各種行業,但是其應用于石油物探領域是近年來才發展起來的,并取得了良好效果。2020年,何健等人利用隨機森林方法預測裂縫發育帶,證明隨機森林方法對裂縫帶預測結果準確度較高[1]。2021年,楊午陽等人提出一種基于U-Net深度學習網絡的地震數據斷層檢測方法,取得了良好效果[2] 。
近幾年,強化學習(Reinforcement Learning, RL)作為機器學習的重要組成部分,被廣泛應用于解決路徑規劃等優化策略問題。2018年,王程博等人提出一種基于強化Q學習(Q-Learning)的無人駕駛船舶路徑規劃模型,有效地在未知環境中規劃出較優路徑及成功避讓多個障礙物[3]。2019年,封佳祥等人提出一種多任務約束條件下基于強化學習的水面無人艇路徑規劃方法,實現了完成多任務約束條件下的無人艇路徑規劃[4]。Q-Learning是一種基于Q值迭代的無模型強化學習方法,如今被廣泛應用于各個領域[5]。2020年,胡學敏等人提出基于深度時空Q網絡的定向導航自動駕駛運動規劃方法來實現定向導航的目的[6]。2021年,周彬等人提出了基于導向強化Q學習的無人機路徑規劃方法,實現無人機的自主導航和快速路徑規劃[7]。2022年,楊秀霞等人提出一種基于階段Q學習的機器人路徑規劃方法,使得機器人在復雜環境中能夠迅速找到無碰撞路徑[8]。
作為一種新技術,Q-Learning方法在解決路徑規劃問題過程中取得了良好效果。該方法引入石油物探領域解決海上地震勘探航線規劃,將會顯著提升物探船的作業效率。
文章詳細內容下載請點擊:基于強化Q學習的海上地震勘探航線自動規劃方法AET-電子技術應用-最豐富的電子設計資源平臺 (chinaaet.com)
【作者信息】
崔燾1,2,張昊楠1,2,阮福明1,2,崔世峰1,2,張少鵬1,2
(1.中海油田服務股份有限公司物探事業部, 天津 300459;2.海洋油氣勘探國家工程研究中心, 北京 100028)