本發(fā)明屬于遙感圖像旋轉(zhuǎn)目標(biāo)檢測領(lǐng)域,旨在對遙感圖像中的目標(biāo)進(jìn)行分類與定位,具體為一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法。
背景技術(shù):
1、旋轉(zhuǎn)目標(biāo)檢測是遙感圖像處理中最基礎(chǔ)的任務(wù)之一,其目的是識別給定遙感圖像中的單個或多個特定目標(biāo)的類別并進(jìn)行精確定位。相比一般的目標(biāo)檢測,旋轉(zhuǎn)目標(biāo)檢測能夠提供目標(biāo)更準(zhǔn)確的方向和尺度信息,其在情報偵察、災(zāi)害監(jiān)測、城市規(guī)劃等領(lǐng)域發(fā)揮著重要作用,同時也是目標(biāo)跟蹤、圖像分割等任務(wù)的重要基礎(chǔ)。
2、目前,現(xiàn)有的旋轉(zhuǎn)目標(biāo)檢測技術(shù)大都是基于深度學(xué)習(xí)來實現(xiàn)的。基于深度學(xué)習(xí)的旋轉(zhuǎn)目標(biāo)檢測技術(shù)主要分為兩大類:基于卷積的旋轉(zhuǎn)目標(biāo)檢測和基于transformer的旋轉(zhuǎn)目標(biāo)檢測。基于卷積的旋轉(zhuǎn)目標(biāo)檢測方法通過預(yù)設(shè)錨點和先驗框或直接預(yù)測關(guān)鍵點的方式,使用卷積提取特征,有效捕捉圖像中的空間局部信息?;趖ransformer的旋轉(zhuǎn)目標(biāo)檢測方法引入自注意力增強(qiáng)特征表示能力,擴(kuò)大圖像感受野,建模全局關(guān)系,實現(xiàn)遠(yuǎn)距離信息融合。
3、盡管遙感圖像旋轉(zhuǎn)目標(biāo)檢測取得了顯著進(jìn)展,但仍面臨挑戰(zhàn)。純卷積方法僅提取局部特征,而transformer雖能建模全局依賴關(guān)系,卻缺乏局部信息提取能力,影響檢測精度。遙感圖像場景復(fù)雜,目標(biāo)尺度多樣且分布不均,密集排列的車輛、船舶等易受遮擋和相互干擾,增加檢測難度。此外,橋梁、港口等目標(biāo)寬高比大,角度偏差會導(dǎo)致交并比(intersection?over?union,iou)驟降,而分類與回歸獨立訓(xùn)練引發(fā)分類回歸不一致,影響檢測性能。因此,當(dāng)前需要一種新的旋轉(zhuǎn)目標(biāo)檢測方法,解決以上問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明旨在解決遙感圖像旋轉(zhuǎn)目標(biāo)檢測中因特征提取不足、場景復(fù)雜度高及目標(biāo)分布不均帶來的檢測精度下降問題。特別是針對寬高比較大的目標(biāo),其角度偏差易導(dǎo)致iou下降,以及分類與回歸不一致問題,影響預(yù)測框的質(zhì)量評估。
2、為了解決上述問題,本發(fā)明提供了一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法。該方法包括以下步驟:
3、1)對大小為h×w×3的遙感圖像提取初始特征x,作為分頻模塊的輸入。特征提取部分由兩個3×3的深度可分離卷積組成;
4、2)分頻模塊對輸入特征進(jìn)行處理,分別得到高頻特征、低頻特征、完整特征;
5、3)基于步驟2)得到的分頻特征輸入特征交互模塊增強(qiáng)特征的多層次信息表達(dá)。該模塊由位置感知注意力塊、自聚焦transformer塊和上下文transformer塊組成,分別對高頻特征、低頻特征和完整特征提取局部特征、全局特征和上下文特征。再將這三者按通道進(jìn)行拼接,使用1×1的卷積進(jìn)行融合;
6、4)步驟2)和步驟3)的分頻模塊與特征交互模塊被重復(fù)執(zhí)行四次,完成四階段的特征細(xì)化過程。再使用特征金字塔網(wǎng)絡(luò)(feature?pyramid?network,fpn)提取多尺度特征,并經(jīng)過候選區(qū)域生成網(wǎng)絡(luò)(region?proposal?network,rpn)和感興趣區(qū)域(regionofinterest,roi)對齊,得到最終的檢測特征;
7、5)最后,將檢測特征輸入檢測頭,分別通過分類分支和回歸分支完成目標(biāo)的類別判別和精確定位,從而得到最終的檢測結(jié)果。分類分支使用兩個全連接層,回歸分支使用兩個卷積層,并設(shè)計樣本協(xié)同調(diào)優(yōu)損失對模型進(jìn)行訓(xùn)練。
8、本發(fā)明的優(yōu)點是:首先,本發(fā)明提出四階段分頻特征細(xì)化過程,設(shè)計位置感知注意力塊、自聚焦transformer塊和上下文transformer塊,解決了復(fù)雜背景環(huán)境下特征提取不足和上下文信息丟失的問題。其次,本發(fā)明提出了樣本協(xié)同調(diào)優(yōu)損失,解決了分類分支和回歸分支獨立計算的問題。
1.一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法,其特征在于,對給定的遙感圖像,進(jìn)行如下操作:
2.根據(jù)權(quán)利要求1所述的一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法,其特征在于,所述步驟2)中分頻模塊具體為:
3.根據(jù)權(quán)利要求1所述的一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法,其特征在于,所述步驟3)中的特征交互模塊具體為:
4.根據(jù)權(quán)利要求1所述的一種基于分頻特征細(xì)化的旋轉(zhuǎn)目標(biāo)檢測方法,其特征在于,所述步驟5)中樣本協(xié)同調(diào)優(yōu)損失具體為: