本發(fā)明涉及基因篩選,尤其涉及基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法。
背景技術(shù):
1、現(xiàn)有的耐熱基因篩選方法一般是先定位耐熱功能qtl區(qū)域,再在耐熱功能qtl區(qū)域內(nèi)計算每個10kb滑動窗口的hp值和fst值。將hp值低于0.001的區(qū)域判定為遺傳多樣性低的區(qū)域,可能受到選擇性清除的影響。fst值高于0.95的區(qū)域表明亞群之間存在顯著的遺傳分化,提示這些區(qū)域可能與耐熱功能相關(guān)。通過篩選同時滿足這兩個條件的snp位點,鎖定包含這些snp位點的基因作為耐熱功能候選基因。
2、現(xiàn)有技術(shù)所篩選的對象僅為已定位的耐熱功能qtl區(qū)域,缺乏基因表達(dá)層面的驗證,而且局限于單獨的兩個亞群,無法有效排除假陽性和非耐熱其他功能的snp位點與基因。
3、因此,需要一種可以整合群體遺傳學(xué)和轉(zhuǎn)錄組學(xué)的多組學(xué)數(shù)據(jù),提高水稻耐熱基因篩選的準(zhǔn)確性和可靠性的方法。
技術(shù)實現(xiàn)思路
1、為克服相關(guān)技術(shù)中存在的問題,本發(fā)明的目的是提供基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,該方法可以整合群體遺傳學(xué)和轉(zhuǎn)錄組學(xué)的多組學(xué)數(shù)據(jù),提高水稻耐熱基因篩選的準(zhǔn)確性和可靠性。
2、基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,包括:
3、獲取水稻群體,對所述水稻群體進(jìn)行群體分化分析,篩選出高分化位點;
4、對所述水稻群體進(jìn)行雜合度篩選,得到目標(biāo)snp位點;
5、結(jié)合所述高分化位點和所述目標(biāo)snp位點,將亞群間分化顯著且亞群內(nèi)純合的所述目標(biāo)snp位點作為候選snp位點;
6、對所述候選snp位點進(jìn)行功能注釋關(guān)聯(lián),得到潛在調(diào)控基因;
7、對所述水稻群體進(jìn)行轉(zhuǎn)錄組差異表達(dá)分析,得到差異表達(dá)基因;
8、根據(jù)所述潛在調(diào)控基因和所述差異表達(dá)基因確定最終候選基因。
9、在本發(fā)明較佳的技術(shù)方案中,所述水稻群體包括秈稻、溫帶粳稻和熱帶粳稻。
10、在本發(fā)明較佳的技術(shù)方案中,所述對所述水稻群體進(jìn)行群體分化分析,篩選出高分化位點,包括:
11、使用vcftools計算所述秈稻與所述溫帶粳稻、所述熱帶粳稻與所述溫帶粳稻之間的遺傳分化指數(shù);
12、將所述遺傳分化指數(shù)大于遺傳分化指數(shù)閾值對應(yīng)的snp位點作為高分化位點。
13、在本發(fā)明較佳的技術(shù)方案中,所述對所述水稻群體進(jìn)行雜合度篩選,得到目標(biāo)snp位點,包括:
14、計算所述水稻群體內(nèi)的雜合度;
15、將所述雜合度低于雜合度閾值的snp位點作為目標(biāo)snp位點。
16、在本發(fā)明較佳的技術(shù)方案中,所述對所述候選snp位點進(jìn)行功能注釋關(guān)聯(lián),得到潛在調(diào)控基因,包括:
17、將所述候選snp位點映射至基因啟動子區(qū)域,得到潛在調(diào)控基因;其中,所述基因啟動子區(qū)域位于轉(zhuǎn)錄起始位點上游2000bp處。
18、在本發(fā)明較佳的技術(shù)方案中,所述對所述水稻群體進(jìn)行轉(zhuǎn)錄組差異表達(dá)分析,得到差異表達(dá)基因,包括:
19、基于rna-seq數(shù)據(jù),采用deseq2分析出秈稻與溫帶粳稻,熱帶粳稻與溫帶粳稻之間的差異表達(dá)基因。
20、在本發(fā)明較佳的技術(shù)方案中,所述根據(jù)所述潛在調(diào)控基因和所述差異表達(dá)基因確定最終候選基因,包括:
21、將所述潛在調(diào)控基因和所述差異表達(dá)基因的交集作為最終候選基因。
22、在本發(fā)明較佳的技術(shù)方案中,所述遺傳分化指數(shù)閾值為0.95,所述雜合度閾值為0.001。
23、在本發(fā)明較佳的技術(shù)方案中,所述差異表達(dá)基因符合|log2fc|>1.2,pvalue<1e-8,padj<1e-8,log2fc為基因表達(dá)量相對值,pvalue為差異顯著性檢驗指標(biāo),padj為校正后p值。
24、在本發(fā)明較佳的技術(shù)方案中,所述最終候選基因與水稻的耐熱性相關(guān)。
25、本發(fā)明的有益效果為:
26、本發(fā)明提供的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法包括獲取水稻群體,對水稻群體進(jìn)行群體分化分析,篩選出高分化位點,高分化位點為遺傳分化指數(shù)大于遺傳分化指數(shù)閾值的snp位點。對水稻群體進(jìn)行雜合度篩選,得到目標(biāo)snp位點,目標(biāo)snp位點為雜合度低于雜合度閾值的snp位點。結(jié)合高分化位點和目標(biāo)snp位點,將亞群間分化顯著且亞群內(nèi)純合的目標(biāo)snp位點作為候選snp位點。高分化位點反映了遺傳分化指數(shù),目標(biāo)snp位點反映了雜合度,通過亞群間遺傳分化和群體內(nèi)純合度的聯(lián)合篩選,可以有效排除因遺傳背景差異導(dǎo)致的假陽性信號。對候選snp位點進(jìn)行功能注釋關(guān)聯(lián),得到潛在調(diào)控基因。對水稻群體進(jìn)行轉(zhuǎn)錄組差異表達(dá)分析,得到差異表達(dá)基因。根據(jù)潛在調(diào)控基因和差異表達(dá)基因確定最終候選基因。通過轉(zhuǎn)錄組數(shù)據(jù)驗證基因表達(dá)差異,確保候選基因與耐熱性直接相關(guān)。本發(fā)明通過群體遺傳學(xué)和轉(zhuǎn)錄組學(xué)的協(xié)同分析,同時驗證遺傳分化和功能表達(dá),可以顯著提高候選基因的準(zhǔn)確性和可靠性,避免單一維度篩選的局限性。
1.基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述水稻群體包括秈稻、溫帶粳稻和熱帶粳稻。
3.根據(jù)權(quán)利要求2所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述對所述水稻群體進(jìn)行群體分化分析,篩選出高分化位點,包括:
4.根據(jù)權(quán)利要求3所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述對所述水稻群體進(jìn)行雜合度篩選,得到目標(biāo)snp位點,包括:
5.根據(jù)權(quán)利要求1所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述對所述候選snp位點進(jìn)行功能注釋關(guān)聯(lián),得到潛在調(diào)控基因,包括:
6.根據(jù)權(quán)利要求2所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述對所述水稻群體進(jìn)行轉(zhuǎn)錄組差異表達(dá)分析,得到差異表達(dá)基因,包括:
7.根據(jù)權(quán)利要求1所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述根據(jù)所述潛在調(diào)控基因和所述差異表達(dá)基因確定最終候選基因,包括:
8.根據(jù)權(quán)利要求4所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述遺傳分化指數(shù)閾值為0.95,所述雜合度閾值為0.001。
9.根據(jù)權(quán)利要求6所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述差異表達(dá)基因符合|log2fc|>1.2,pvalue<1e-8,padj<1e-8,log2fc為基因表達(dá)量相對值,pvalue為差異顯著性檢驗指標(biāo),padj為校正后p值。
10.根據(jù)權(quán)利要求1所述的基于群體遺傳與轉(zhuǎn)錄組整合的水稻耐熱候選基因篩選方法,其特征在于,所述最終候選基因與水稻的耐熱性相關(guān)。