国产真实乱全部视频,黄色片视频在线免费观看,密臀av一区二区三区,av黄色一级,中文字幕.com,日本a级网站,在线视频观看91

一種用于屬性預(yù)測的幾何增強(qiáng)分子表示學(xué)習(xí)方法

文檔序號(hào):42327208發(fā)布日期:2025-07-01 19:46閱讀:12來源:國知局

本發(fā)明涉及一種用于屬性預(yù)測的幾何增強(qiáng)分子表示學(xué)習(xí)方法,屬于深度學(xué)習(xí)領(lǐng)域。


背景技術(shù):

1、在科學(xué)研究的前沿陣地,分子的三維表征扮演著核心且不可或缺的角色,其精準(zhǔn)且詳盡地描繪了分子的空間幾何構(gòu)型,為深入探究分子的物理化學(xué)屬性奠定了堅(jiān)實(shí)的基礎(chǔ)。鑒于分子三維表征在揭示分子微觀世界的關(guān)鍵作用,高效且精確地提取分子三維特征顯得尤為迫切與重要。這一過程不僅是理解分子結(jié)構(gòu)與功能關(guān)系的關(guān)鍵步驟,也是推動(dòng)分子設(shè)計(jì)、藥物發(fā)現(xiàn)及材料開發(fā)等領(lǐng)域取得突破性進(jìn)展的先決條件。

2、在分子表征學(xué)習(xí)的研究領(lǐng)域內(nèi),眾多杰出的模型已被開發(fā)出來,其中deepdrug3d、atom3d及drug3d-net等方法尤為突出。這些方法通過體素化處理技術(shù),成功地將生物分子及小分子藥物轉(zhuǎn)化為三維數(shù)據(jù)形式,并巧妙地運(yùn)用3d卷積神經(jīng)網(wǎng)絡(luò)(3dcnn)對(duì)分子進(jìn)行特征提取與性質(zhì)預(yù)測。研究結(jié)果顯示,在預(yù)測復(fù)雜分子性質(zhì)的任務(wù)中,考慮分子的三維信息能夠顯著提升預(yù)測的精確度和模型的泛化能力。3dcnn在深度挖掘分子三維結(jié)構(gòu)特征以及精確預(yù)測分子性質(zhì)方面,展現(xiàn)出了不可或缺的關(guān)鍵作用,對(duì)分子表示學(xué)習(xí)領(lǐng)域的進(jìn)步產(chǎn)生了深遠(yuǎn)影響。

3、針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(cnn)的改進(jìn),近年來的研究主要聚焦于兩種策略:一是通過增加網(wǎng)絡(luò)層數(shù)來構(gòu)建更深的模型,二是采用更大的卷積核來擴(kuò)大感受野。例如,convnext模型在圖像處理任務(wù)中憑借7×7的dependency卷積取得了卓越成效。此外,諸如alexnet和inception?v1等經(jīng)典研究,也分別采納了高達(dá)11×11和7×7的大型卷積核。盡管堆疊多層卷積神經(jīng)網(wǎng)絡(luò)能夠逐層深入抽象輸入數(shù)據(jù)的特征,構(gòu)建出日益復(fù)雜的表示體系,但過度的卷積操作往往會(huì)導(dǎo)致原始信息的丟失,并帶來高昂的計(jì)算成本。有研究表明,在某些特定任務(wù)中,保留部分原始信息對(duì)于提升模型性能具有積極意義。另一方面,擴(kuò)大卷積核的尺寸雖然能夠擴(kuò)大模型的感受野,從而捕獲更廣泛的上下文信息,但這種方式存在特征提取角度單一的問題,并且由于卷積計(jì)算的密集性,擴(kuò)大卷積核還會(huì)導(dǎo)致計(jì)算資源的極大消耗。為了應(yīng)對(duì)這些挑戰(zhàn),inceptionnext對(duì)2dcnn進(jìn)行了改進(jìn)。該改進(jìn)策略將大卷積核沿著信道維度分解為四個(gè)并行的分支,包括小正方形卷積核、兩個(gè)正交的帶狀大卷積核以及一個(gè)恒等映射。這種設(shè)計(jì)不僅有效地構(gòu)建了具有高效吞吐量的網(wǎng)絡(luò)結(jié)構(gòu),還保持了卓越的性能表現(xiàn),為解決上述問題提供了新的思路。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種用于屬性預(yù)測的幾何增強(qiáng)分子表示學(xué)習(xí)方法,旨在通過改進(jìn)傳統(tǒng)的3dcnn來優(yōu)化模型對(duì)分子數(shù)據(jù)特征提取能力,提高卷積神經(jīng)網(wǎng)絡(luò)在分子性質(zhì)預(yù)測上的性能表現(xiàn)。

2、為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種用于屬性預(yù)測的幾何增強(qiáng)分子表示學(xué)習(xí)方法,具體步驟為:

3、step1:對(duì)分子的3d坐標(biāo)數(shù)據(jù)進(jìn)行建模,得到包含分子幾何信息的體素?cái)?shù)據(jù);

4、step2:擴(kuò)展分子體素?cái)?shù)據(jù)通道數(shù),并融合各個(gè)通道的特征;

5、step3:提取經(jīng)處理后的分子體素?cái)?shù)據(jù)的幾何特征;

6、step4:對(duì)提取到的幾何特征使用mlp進(jìn)行最終分子屬性預(yù)測,包括回歸和分類任務(wù)。

7、所述step1具體為:

8、step1.1:對(duì)于提供分子3d坐標(biāo)的分子數(shù)據(jù),將其建模為體素?cái)?shù)據(jù);

9、step1.2:對(duì)于不提供分子3d坐標(biāo)的分子數(shù)據(jù),使用分子動(dòng)力學(xué)技術(shù)模擬其3d坐標(biāo),再將其建模為體素?cái)?shù)據(jù)。

10、所述step2具體為:

11、step2.1:以獲得的體素?cái)?shù)據(jù)作為輸入,使用普通3dcnn擴(kuò)展通道數(shù),并融合各個(gè)通道的信息,得到經(jīng)3dcnn處理后的輸出;

12、step2.2:將得到的輸出作為輸入傳遞給cbam注意力模塊,所述cbam注意力模塊通過分析輸入特征圖,根據(jù)通道的重要性賦予不同的權(quán)重。

13、所述cbam注意力模塊具體為:

14、包括通道注意力模塊和空間注意力模塊;

15、所述通道注意力模塊首先通過全局平均池化操作對(duì)輸入3d特征圖的每個(gè)通道進(jìn)行全局信息匯聚,其次通過兩層3d卷積層對(duì)通道特征進(jìn)行壓縮和還原,其中,第一層卷積將通道數(shù)從原始維度壓縮至該層輸出數(shù)據(jù)的通道數(shù),第二層卷積將通道數(shù)恢復(fù)至原始維度,最后通過sigmoid激活函數(shù)生成一個(gè)通道權(quán)重圖,通道權(quán)重圖與輸入特征圖按元素相乘,實(shí)現(xiàn)對(duì)特征圖通道維度的加權(quán);

16、所述空間注意力模塊首先通過3d卷積操作生成一個(gè)深度為1的特征圖以反映每個(gè)空間位置的重要性,其次通過后續(xù)的卷積層提煉空間特征,然后通過sigmoid激活函數(shù)生成一個(gè)空間權(quán)重圖,最后空間權(quán)重圖與輸入特征圖按元素相乘,實(shí)現(xiàn)對(duì)特征圖空間維度的加權(quán)。

17、所述step3具體為:

18、step3.1:將輸入數(shù)據(jù)根據(jù)通道數(shù)劃分為五個(gè)部分;

19、step3.2:劃分后的第一個(gè)部分不進(jìn)行任何卷積操作,進(jìn)行恒等映射;

20、step3.3:對(duì)劃分后的第二部分,運(yùn)用3×3×3的三維卷積核進(jìn)行多維度特征提取,在高度、寬度和深度三個(gè)正交空間維度上實(shí)現(xiàn)立體特征表征;

21、step3.4:針對(duì)劃分后的第三部分,采用1×5×1的帶狀卷積核進(jìn)行卷積運(yùn)算,在高度和深度兩個(gè)維度上構(gòu)建特征映射,同時(shí)保留寬度的全局上下文信息;

22、step3.5:在劃分后的第四部分中,部署1×1×5的帶狀卷積核進(jìn)行卷積處理,在高度和寬度維度上提取局部特征模式,同時(shí)保持深度維度的連續(xù)性;

23、step3.6:對(duì)于劃分后的第五部分,實(shí)施5×1×1的帶狀卷積核進(jìn)行卷積操作,在寬度和深度維度上構(gòu)建特征關(guān)聯(lián),同時(shí)保持高度維度的結(jié)構(gòu)信息;

24、step3.7:將以上五個(gè)部分的輸出進(jìn)行拼接作為提取到的特征;

25、step3.8:對(duì)提取到的特征進(jìn)行池化操作;

26、step3.9:使用cbam注意力模塊對(duì)得到的特征根據(jù)重要性賦予不同的權(quán)重,實(shí)現(xiàn)權(quán)重分配。

27、所述step4具體為:

28、將提取到的幾何特征進(jìn)行展平處理,作為多層感知機(jī)mlp的輸入數(shù)據(jù);

29、在處理回歸任務(wù)時(shí),將輸出層配置為一個(gè)神經(jīng)元,所述神經(jīng)元直接輸出預(yù)測值,無需額外的激活函數(shù);

30、在處理二分類任務(wù)時(shí),將輸出層配置為單個(gè)神經(jīng)元,并采用sigmoid激活函數(shù),該函數(shù)將線性輸出映射到(0,1)區(qū)間內(nèi),生成概率值p?∈?(0,1),該概率值表示輸入樣本屬于目標(biāo)屬性類別的置信度,再比較p與預(yù)設(shè)閾值的大小,完成屬性預(yù)測。

31、本發(fā)明的有益效果是:

32、(1)本發(fā)明相較于許多基于卷積神經(jīng)網(wǎng)絡(luò)的模型,可以多尺度提取分子體素?cái)?shù)據(jù)的幾何特征,同時(shí)適用于回歸和分類任務(wù),具有較強(qiáng)的普適性;

33、(2)本發(fā)明實(shí)現(xiàn)了對(duì)傳統(tǒng)3dcnn的改進(jìn),提升了傳統(tǒng)3d卷積神經(jīng)網(wǎng)絡(luò)對(duì)分子體素?cái)?shù)據(jù)的處理能力;

34、(3)本發(fā)明提出的一種改良的3dcnn深度學(xué)習(xí)方法,用于增強(qiáng)分子表示學(xué)習(xí)任務(wù)的表現(xiàn),通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),有效捕捉分子三維特征,在包含與不包含分子幾何信息的多個(gè)數(shù)據(jù)集上驗(yàn)證,均顯著提升卷積神經(jīng)網(wǎng)絡(luò)在分子表示上的性能。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1