本發(fā)明涉及生物,具體涉及一種寡核苷酸集合以及多重?cái)U(kuò)增子建庫(kù)方法。
背景技術(shù):
1、目前的擴(kuò)增子建庫(kù),都是采用兩輪pcr擴(kuò)增的方式完成文庫(kù)的構(gòu)建,第一輪擴(kuò)增由帶有第二輪引物識(shí)別序列(即index序列)的基因特異性引物對(duì)特定區(qū)域進(jìn)行擴(kuò)增;第二輪擴(kuò)增通過帶有index序列互補(bǔ)序列的引物對(duì)第一輪產(chǎn)物進(jìn)行擴(kuò)增完成文庫(kù)擴(kuò)增。這種最通用的方法會(huì)帶來的問題:1.第一輪擴(kuò)增之后需要進(jìn)行純化回收,再進(jìn)行配制第二輪體系,并進(jìn)行第二輪擴(kuò)增,以及對(duì)最終產(chǎn)物進(jìn)行回收,即一共需要兩輪擴(kuò)增和兩輪回收,增加了操作的復(fù)雜性。2.由于第一輪產(chǎn)物兩端帶的是第二輪引物識(shí)別的通用序列,因此當(dāng)存在較多樣本同時(shí)進(jìn)行擴(kuò)增時(shí),第一輪產(chǎn)物進(jìn)行回收配制體系等操作容易通過氣溶膠進(jìn)行交叉污染,從而影響樣本間鑒定片段信號(hào)的真實(shí)性。3.由于兩輪擴(kuò)增之間具有較多的操作步驟,且需要開蓋加樣,有可能引起樣本間的交叉污染,進(jìn)而阻礙靶向擴(kuò)增子測(cè)序的自動(dòng)化操作。
2、中國(guó)專利cn104093890b和美國(guó)專利us10876108b2專利公開了一種通過先進(jìn)行建庫(kù),再使用一端特異性引物和另一端通用性引物擴(kuò)增特定片段進(jìn)行擴(kuò)增子建庫(kù),這種建庫(kù)模式仍然需要經(jīng)過多輪完成擴(kuò)增子建庫(kù),仍然存在操作步驟復(fù)雜以及氣溶膠交叉污染的情況。特別是在病原靶向測(cè)序(tngs)的應(yīng)用場(chǎng)景上,氣溶膠造成的樣本間交叉污染嚴(yán)重影響了靶向病原檢測(cè)技術(shù)的自動(dòng)化運(yùn)用和大規(guī)模推廣。
3、因此,將兩輪擴(kuò)增變成一輪擴(kuò)增是技術(shù)發(fā)展的趨勢(shì),也有利于解決在靶向病原檢測(cè)應(yīng)用中的樣本間的交叉污染的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種寡核苷酸對(duì)以及多重?cái)U(kuò)增子建庫(kù)方法,通過連接或互補(bǔ)延伸的方式將多重?cái)U(kuò)增體系中的基因特異性多重?cái)U(kuò)增引物和文庫(kù)擴(kuò)增引物生成連接產(chǎn)物或延伸產(chǎn)物,再通過該連接產(chǎn)物或延伸產(chǎn)物作為長(zhǎng)引物即可一步完成擴(kuò)增子文庫(kù)的構(gòu)建。相對(duì)于傳統(tǒng)的多重?cái)U(kuò)增子建庫(kù)方法,本發(fā)明提供的方法能夠減少開蓋操作步驟,避免交叉污染風(fēng)險(xiǎn)。
2、本發(fā)明的第一方面包括一種寡核苷酸集合,所述寡核苷酸集合包含第一寡核苷酸引物和第二寡核苷酸引物,所述第一寡核苷酸引物從5’端至3’端依次包含測(cè)序接頭序列、標(biāo)簽序列和測(cè)序引物序列,所述第二寡核苷酸引物從5’端至3’端依次包含基因特異性引物的反向互補(bǔ)序列和測(cè)序引物的反向互補(bǔ)序列。
3、在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物通過所述測(cè)序引物序列和所述測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。
4、在一些實(shí)施方案中,所述“反向互補(bǔ)序列”指通過堿基配對(duì)原則關(guān)聯(lián)的核苷酸序列。例如,序列“5'-atcg-3'”的反向互補(bǔ)序列是“5'-cgat-3'”。
5、在一些實(shí)施方案中,所述標(biāo)簽序列是用于區(qū)分不同待測(cè)樣本的隨機(jī)序列。在一些實(shí)施方案中,所述標(biāo)簽序列為至少3個(gè)核苷酸,例如4-12個(gè)核苷酸,優(yōu)選6-8個(gè)核苷酸,例如8個(gè)核苷酸。
6、在一些實(shí)施方案中,所述基因特異性引物序列是根據(jù)待測(cè)dna樣本的目標(biāo)片段設(shè)計(jì)的特異性引物序列。例如,所述基因特異性引物序列包含至少3個(gè)核苷酸,例如3-50個(gè)核苷酸,例如3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、11個(gè)、12個(gè)、13個(gè)、14個(gè)、15個(gè)、18個(gè)、20個(gè)、22個(gè)、25個(gè)、26個(gè)、28個(gè)、30個(gè)、32個(gè)、35個(gè)、38個(gè)、40個(gè)、42個(gè)、45個(gè)、48個(gè)和50個(gè)核苷酸。
7、在一些實(shí)施方案中,所述基因特異性引物的反向互補(bǔ)序列的一個(gè)或多個(gè)核苷酸上位點(diǎn)含有rna堿基修飾,所述修飾是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種。在一些實(shí)施方案中,所述修飾的數(shù)量是至少1個(gè),例如1個(gè)、2個(gè)、3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、12個(gè)或15個(gè)。
8、在一些實(shí)施方案中,當(dāng)所述基因特異性引物的反向互補(bǔ)序列的多個(gè)核苷酸位點(diǎn)上含有rna堿基修飾時(shí),所述多個(gè)核苷酸位點(diǎn)是連續(xù)的或不連續(xù)的,且彼此獨(dú)立是ra、ru、rg和rc中的一種。
9、在一些實(shí)施方案中,所述第二寡核苷酸引物中的一個(gè)或多個(gè)核苷酸位點(diǎn)上含有rna堿基修飾,所述修飾是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種,所述修飾的數(shù)量是至少1個(gè),例如1個(gè)、2個(gè)、3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、12個(gè)、15個(gè)、16個(gè)、18個(gè)或20個(gè)。
10、在一些實(shí)施方案中,當(dāng)所述第二寡核苷酸引物中的多個(gè)核苷酸位點(diǎn)上含有rna堿基修飾時(shí),所述多個(gè)核苷酸位點(diǎn)是連續(xù)的或不連續(xù)的,且彼此獨(dú)立是ra、ru、rg和rc中的一種。
11、在一些實(shí)施方案中,所述第二寡核苷酸引物的3’末端含有封閉修飾,其作用是阻止dntp添加至第二寡核苷酸引物的3’末端進(jìn)行延伸。在一些實(shí)施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優(yōu)選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
12、在一些實(shí)施方案中,所述第一寡核苷酸引物包括至少一對(duì)上游第一寡核苷酸引物和下游第一寡核苷酸引物。
13、在一些實(shí)施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測(cè)序接頭序列、上游標(biāo)簽序列和上游測(cè)序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測(cè)序接頭序列、下游標(biāo)簽序列和下游測(cè)序引物序列。
14、在一些實(shí)施方案中,所述上游第一寡核苷酸引物不包含(上游)標(biāo)簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標(biāo)簽序列。
15、在一些實(shí)施方案中,所述測(cè)序接頭序列是當(dāng)前或?qū)頊y(cè)序平臺(tái)(包括但不限于iontorrent平臺(tái)、illumina平臺(tái)和華大平臺(tái)mgi)使用的測(cè)序基質(zhì)相關(guān)序列。
16、在一些實(shí)施方案中,所述測(cè)序接頭序列包括上游測(cè)序接頭序列和/或下游測(cè)序接頭序列。
17、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是illumina平臺(tái)的p5接頭序列,所述下游測(cè)序接頭序列illumina平臺(tái)的p7接頭序列;反之亦然。
18、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是iontorrent平臺(tái)的p1銜接頭序列,所述下游測(cè)序接頭序列是iontorrent平臺(tái)的a銜接頭序列;反之亦然。
19、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。
20、在一些實(shí)施方案中,所述上游第一寡核苷酸引物是illumina平臺(tái)的i5引物,所述下游第一寡核苷酸引物是illumina平臺(tái)的i7引物;反之亦然。
21、在一些實(shí)施方案中,所述第二寡核苷酸引物包括至少一對(duì)上游第二寡核苷酸引物和下游第二寡核苷酸引物。
22、在一些實(shí)施方案中,所述上游第二寡核苷酸引物從5’端至3’端依次包含基因特異性上游引物的反向互補(bǔ)序列和上游測(cè)序引物的反向互補(bǔ)序列。
23、在一些實(shí)施方案中,所述下游第二寡核苷酸引物從5’端至3’端依次包含基因特異性下游引物的反向互補(bǔ)序列和下游測(cè)序引物的反向互補(bǔ)序列。
24、在一些實(shí)施方案中,所述上游第一寡核苷酸引物和所述上游第二寡核苷酸引物通過所述上游測(cè)序引物序列和所述上游測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。
25、在一些實(shí)施方案中,所述下游第一寡核苷酸引物和所述下游第二寡核苷酸引物通過所述下游測(cè)序引物序列和所述下游測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。
26、本發(fā)明的第二方面提供一種組合物,其包含dna聚合酶、核糖核酸內(nèi)切酶、dntp、緩沖成分、金屬鹽和引物組合;其中,所述引物組合包含第一方面所述的第一寡核苷酸引物和第一方面所述的第二寡核苷酸引物,特別是,至少一對(duì)上游第一寡核苷酸引物和下游第一寡核苷酸引物以及至少一對(duì)上游第二寡核苷酸引物和下游第二寡核苷酸引物。
27、在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物能夠通過測(cè)序引物序列及測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物各自分別以單鏈形式存在于所述組合物中。在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物通過所述測(cè)序引物序列和所述測(cè)序引物的反向互補(bǔ)序列形成部分雙鏈結(jié)構(gòu)的形式存在于所述組合物中。
28、在一些實(shí)施方案中,所述第一寡核苷酸引物包含至少一對(duì)第一方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
29、在一些實(shí)施方案中,每一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區(qū)別在于標(biāo)簽序列不相同。
30、在一些實(shí)施方案中,所述第二寡核苷酸引物包含至少一對(duì)第一方面所述的上游第二寡核苷酸引物和第一方面所述的下游第二寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
31、在一些實(shí)施方案中,每一對(duì)所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區(qū)別在于基因特異性引物序列不相同。
32、在一些實(shí)施方案中,所述組合物還包括dna樣本。
33、在一些實(shí)施方案中,所述dna樣本是gdna或cdna。
34、在一些實(shí)施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶。
35、在一些實(shí)施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶和一種常溫dna聚合酶。
36、在一些實(shí)施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、ventdna聚合酶、deep?vent?dna聚合酶或kod?dna聚合酶。
37、在一些實(shí)施方案中,所述耐熱聚合酶是熱啟動(dòng)的聚合酶,例如抗體封閉的聚合酶或配體封閉的聚合酶。
38、在一些實(shí)施方案中,所述dna聚合酶至少包含一種非熱啟動(dòng)的聚合酶和一種熱啟動(dòng)的聚合酶。
39、在一些實(shí)施方案中,所述常溫dna聚合酶是klenow?dna聚合酶、bst?dna聚合酶或phi?29dna聚合酶。
40、在一些實(shí)施方案中,本發(fā)明所述的“常溫聚合酶”是指能在常溫例如45℃以下發(fā)揮聚合活性的聚合酶。
41、在一些實(shí)施方案中,所述核糖核酸內(nèi)切酶識(shí)別rna/dna雜交鏈并切割rna鏈。
42、在一些實(shí)施方案中,所述核糖核酸內(nèi)切酶是能夠識(shí)別核糖核苷酸位點(diǎn)并切除磷酸二酯鍵的內(nèi)切酶;優(yōu)選地,所述所述核糖核酸內(nèi)切酶是rnase?h2。
43、在一些實(shí)施方案中,所述核糖核酸內(nèi)切酶是rnase?h2的同源蛋白。
44、在一些實(shí)施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優(yōu)選tris。
45、在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,優(yōu)選mgcl2。
46、在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
47、在一些實(shí)施方案中,所述組合物中還包含本領(lǐng)域公知的其它能夠幫助dna聚合酶、核糖核酸內(nèi)切酶發(fā)揮作用的組分,例如甘油。
48、在一些實(shí)施方案中,所述組合物中還包含表面活性劑,例如陰離子表面活性劑、陽(yáng)離子表面活性劑和非離子表面活性劑中的一種或多種。
49、本發(fā)明的第三方面提供一種多重?cái)U(kuò)增子建庫(kù)方法,所述方法包括如下步驟:
50、(1)配制包含至少一對(duì)第一寡核苷酸引物、至少一對(duì)第二寡核苷酸引物和樣本核酸的反應(yīng)體系;其中,所述第一寡核苷酸引物從5’端至3’端依次包含測(cè)序接頭序列、標(biāo)簽序列和測(cè)序引物序列,所述第二寡核苷酸引物從5’端至3’端依次包含基因特異性引物的反向互補(bǔ)序列和測(cè)序引物的反向互補(bǔ)序列,所述第二寡核苷酸引物中包含可切割基團(tuán);
51、(2)使所述第一寡核苷酸引物的3’端和所述第二寡核苷酸引物的3’端反向互補(bǔ)配對(duì),使所述第一寡核苷酸引物沿5’-3’方向延伸獲得延伸產(chǎn)物;
52、(3)切割所述第二寡核苷酸引物中的所述基因特異性引物的反向互補(bǔ)序列;
53、(4)以步驟(2)所述延伸產(chǎn)物作為引物對(duì)所述樣本核酸進(jìn)行pcr擴(kuò)增。
54、在一些實(shí)施方案中,所述標(biāo)簽序列是用于區(qū)分不同樣本的隨機(jī)序列。在一些實(shí)施方案中,所述標(biāo)簽序列為至少3個(gè)核苷酸,例如4-12個(gè)核苷酸,優(yōu)選6-8個(gè)核苷酸,例如8個(gè)核苷酸。
55、在一些實(shí)施方案中,所述基因特異性引物序列是根據(jù)待測(cè)dna樣本的目標(biāo)片段設(shè)計(jì)的特異性引物序列。例如,所述基因特異性引物序列包含至少3個(gè)核苷酸,例如3-50個(gè)核苷酸,例如3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、11個(gè)、12個(gè)、13個(gè)、14個(gè)、15個(gè)、18個(gè)、20個(gè)、22個(gè)、25個(gè)、26個(gè)、28個(gè)、30個(gè)、32個(gè)、35個(gè)、38個(gè)、40個(gè)、42個(gè)、45個(gè)、48個(gè)和50個(gè)核苷酸。
56、在一些實(shí)施方案中,所述第二寡核苷酸引物的3’末端含有封閉修飾,其作用是阻止dntp添加至第二寡核苷酸引物的3’末端進(jìn)行延伸。在一些實(shí)施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優(yōu)選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
57、在一些實(shí)施方案中,所述至少一對(duì)第一寡核苷酸引物包括至少一對(duì)上游第一寡核苷酸引物和下游第一寡核苷酸引物。
58、在一些實(shí)施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測(cè)序接頭序列、上游標(biāo)簽序列和上游測(cè)序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測(cè)序接頭序列、下游標(biāo)簽序列和下游測(cè)序引物序列。
59、在一些實(shí)施方案中,所述上游第一寡核苷酸引物不包含(上游)標(biāo)簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標(biāo)簽序列。
60、在一些實(shí)施方案中,所述測(cè)序接頭序列是當(dāng)前或?qū)頊y(cè)序平臺(tái)(包括但不限于iontorrent平臺(tái)、illumina平臺(tái)和華大平臺(tái)mgi)使用的測(cè)序基質(zhì)相關(guān)序列。
61、在一些實(shí)施方案中,所述測(cè)序接頭序列包括上游測(cè)序接頭序列和下游測(cè)序接頭序列。
62、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是illumina平臺(tái)的p5接頭序列,下游測(cè)序接頭序列illumina平臺(tái)的p7接頭序列;反之亦然。
63、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是ion?torrent平臺(tái)的p1銜接頭序列,所述下游測(cè)序接頭序列是ion?torrent平臺(tái)的a銜接頭序列;反之亦然。
64、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。
65、在一些實(shí)施方案中,所述上游第一寡核苷酸引物是illumina平臺(tái)的i5引物,所述下游第一寡核苷酸引物是illumina平臺(tái)的i7引物;反之亦然。
66、在一些實(shí)施方案中,所述至少一對(duì)第二寡核苷酸引物包括至少一對(duì)上游第二寡核苷酸引物和下游第二寡核苷酸引物。
67、在一些實(shí)施方案中,所述上游第二寡核苷酸引物從5’端至3’端依次包含基因特異性上游引物的反向互補(bǔ)序列和上游測(cè)序引物的反向互補(bǔ)序列。
68、在一些實(shí)施方案中,所述下游第二寡核苷酸引物從5’端至3’端依次包含基因特異性下游引物的反向互補(bǔ)序列和下游測(cè)序引物的反向互補(bǔ)序列。
69、在一些實(shí)施方案中,所述上游第一寡核苷酸引物和所述上游第二寡核苷酸引物通過所述上游測(cè)序引物序列和所述上游測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。
70、在一些實(shí)施方案中,所述下游第一寡核苷酸引物和下游第二寡核苷酸引物通過所述下游測(cè)序引物序列和所述上游測(cè)序引物的反向互補(bǔ)序列互補(bǔ)配對(duì)。
71、在一些實(shí)施方案中,所述第一寡核苷酸引物包含至少一對(duì)第一方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
72、在一些實(shí)施方案中,每一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區(qū)別在于標(biāo)簽序列不相同。
73、在一些實(shí)施方案中,所述第二寡核苷酸引物包含至少一對(duì)第一方面所述的上游第二寡核苷酸引物和下游第二寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
74、在一些實(shí)施方案中,每一對(duì)所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區(qū)別在于基因特異性引物序列不相同。
75、在一些實(shí)施方案中,所述樣本核酸是dna,例如,所述dna是gdna或cdna。
76、在一些實(shí)施方案中,所述可切割基團(tuán)是指可以被核酸內(nèi)切酶或核酸外切酶識(shí)別并切割的核苷酸底物。
77、在一些實(shí)施方案中,所述可切割基團(tuán)是脫氧尿苷三磷酸(dutp)或脫氧肌苷三磷酸(ditp)。在一些實(shí)施方案中,當(dāng)所述可切割基團(tuán)是dutp時(shí),所述反應(yīng)體系中還包含尿嘧啶dna糖基化酶(uracil?dna?glycosylase,udg酶)或單鏈選擇性單功能尿嘧啶dna糖基化酶(single-strand?selective?monofunctional?uracil-dnaglycosylase,smug酶);當(dāng)所述可切割基團(tuán)是ditp時(shí),所述反應(yīng)體系中還包含烷基腺嘌呤dna糖基化酶(alkyladenine?dnaglycosylase,aag酶)或者內(nèi)切酶ⅴ(endonuclease?v)。
78、在一些實(shí)施方案中,所述可切割基團(tuán)是rna堿基,所述rna堿基是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種。在一些實(shí)施方案中,所述rna堿基的數(shù)量是至少1個(gè),例如1個(gè)、2個(gè)、3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、12個(gè)或15個(gè)。在一切實(shí)施方案中,當(dāng)所述可切割基團(tuán)是rna堿基時(shí),所述反應(yīng)體系中還包含核糖核酸內(nèi)切酶,所述核糖核酸內(nèi)切酶是能夠識(shí)別核糖核苷酸位點(diǎn)并切除磷酸二酯鍵的內(nèi)切酶;優(yōu)選地,所述核糖核酸內(nèi)切酶是rnase?h2或rnase?h2的同源蛋白。
79、在一些實(shí)施方案中,所述可切割基團(tuán)位于所述第二寡核苷酸引物中的基因特異性引物的反向互補(bǔ)序列和/或測(cè)序引物的反向互補(bǔ)序列。
80、在一些實(shí)施方案中,所述步驟(3)是在核酸內(nèi)切酶或核酸外切酶作用下切割所述第二寡核苷酸引物中的所述基因特異性引物的反向互補(bǔ)序列上的可切割基團(tuán),例如在核糖核酸內(nèi)切酶的作用下識(shí)別并切割所述基因特異性引物的反向互補(bǔ)序列上的核糖核苷酸位點(diǎn)。
81、在一些實(shí)施方案中,所述第一寡核苷酸引物包含至少一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
82、在一些實(shí)施方案中,每一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區(qū)別在于標(biāo)簽序列不相同。
83、在一些實(shí)施方案中,所述第二寡核苷酸引物包含至少一對(duì)所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
84、在一些實(shí)施方案中,每一對(duì)所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區(qū)別在于基因特異性引物序列不相同。
85、在一些實(shí)施方案中,所述反應(yīng)體系中還包括dna聚合酶。
86、在一些實(shí)施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶。
87、在一些實(shí)施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶和一種常溫dna聚合酶。
88、在一些實(shí)施方案中,所述耐熱聚合酶是熱啟動(dòng)的聚合酶,例如抗體封閉的聚合酶或配體封閉的聚合酶。
89、在一些實(shí)施方案中,所述dna聚合酶至少包含一種非熱啟動(dòng)的聚合酶和一種熱啟動(dòng)的聚合酶。
90、在一些實(shí)施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、ventdna聚合酶、deep?vent?dna聚合酶或kod?dna聚合酶。
91、在一些實(shí)施方案中,所述常溫dna聚合酶是klenow?dna聚合酶、bst?dna聚合酶或phi?29dna聚合酶。
92、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)是在非熱啟動(dòng)的聚合酶作用下進(jìn)行;所述步驟(4)的反應(yīng)是在熱啟動(dòng)的聚合酶作用下進(jìn)行。
93、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)是在常溫聚合酶作用下進(jìn)行;所述步驟(4)的反應(yīng)是在耐熱聚合酶作用下進(jìn)行。
94、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)溫度是20-50℃,優(yōu)選25-40℃,例如25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃或40℃。
95、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)時(shí)間是5-40分鐘,優(yōu)選10-30分鐘,例如10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、15分鐘、16分鐘、17分鐘、18分鐘、19分鐘、20分鐘、21分鐘、22分鐘、23分鐘、24分鐘、25分鐘、26分鐘、27分鐘、28分鐘、29分鐘或30分鐘。
96、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)條件是25-40℃孵育10-30分鐘、25-40℃孵育10-25分鐘、25-40℃孵育10-20分鐘或30℃孵育10-20分鐘,包括但不限于前述步驟(2)的反應(yīng)溫度和步驟(2)的反應(yīng)時(shí)間的任意組合。
97、在一些實(shí)施方案中,所述步驟(3)的反應(yīng)溫度是40-80℃,優(yōu)選60-80℃,例如60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃或80℃。
98、在一些實(shí)施方案中,所述步驟(3)的反應(yīng)時(shí)間是5-30分鐘,優(yōu)選5-20分鐘,例如5分鐘、6分鐘、7分鐘、8分鐘、9分鐘、10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、5分鐘、16分鐘、17分鐘、18分鐘、19分鐘或20分鐘。
99、在一些實(shí)施方案中,所述步驟(3)的反應(yīng)條件是60-80℃孵育10-20分鐘、65-80℃孵育10-20分鐘、70-80℃孵育10-20分鐘、70-80℃孵育10-15分鐘、70-75℃孵育10-15分鐘、72℃孵育10-15分鐘或72℃孵育10分鐘,包括但不限于前述步驟(3)的反應(yīng)溫度和步驟(3)的反應(yīng)時(shí)間的任意組合。
100、在一些實(shí)施方案中,所述步驟(2)反應(yīng)過程中,第一寡核苷酸引物和第二寡核苷酸引物在dna聚合酶作用下互補(bǔ)延伸產(chǎn)生的延伸產(chǎn)物是index-panel長(zhǎng)引物,所述index-panel長(zhǎng)引物從5’端至3’端依次包含測(cè)序接頭序列-標(biāo)簽序列-測(cè)序引物序列-基因特異性引物序列。
101、在一些實(shí)施方案中,所述反應(yīng)體系中還包括緩沖成分。在一些實(shí)施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優(yōu)選tris。
102、在一些實(shí)施方案中,所述反應(yīng)體系中還包括金屬鹽。在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,優(yōu)選mgcl2。在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
103、在一些實(shí)施方案中,所述反應(yīng)體系中還包含dntp。
104、在一些實(shí)施方案中,所述反應(yīng)體系中還包含本領(lǐng)域公知的其它能夠幫助dna聚合酶、核糖核酸內(nèi)切酶發(fā)揮作用的組分,例如甘油。
105、在一些實(shí)施方案中,所述反應(yīng)體系中還包含表面活性劑,例如陰離子表面活性劑、陽(yáng)離子表面活性劑和非離子表面活性劑中的一種或多種。
106、在一些實(shí)施方案中,所述步驟(4)的pcr擴(kuò)增包括一個(gè)或多個(gè)循環(huán)(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個(gè))的變性、退火和延伸;優(yōu)選地,所述pcr擴(kuò)增包括預(yù)變性以及多個(gè)循環(huán)(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個(gè))的變性、退火和延伸。
107、在一些實(shí)施方案中,所述變性是高溫變性,所述高溫變性是至少90℃高溫變性,例如90℃、91℃、92℃、93℃、94℃和95℃高溫變性。
108、在一些實(shí)施方案中,所述變性同時(shí)實(shí)現(xiàn):(1)使樣本dna由雙鏈變性為單鏈;(2)使rnase?h2蛋白失活。
109、在一些實(shí)施方案中,所述pcr擴(kuò)增是一輪pcr擴(kuò)增。
110、在一些實(shí)施方案中,所述pcr擴(kuò)增的條件可以是本領(lǐng)域一般技術(shù)人員已知的任意常規(guī)pcr擴(kuò)增條件。
111、在一些實(shí)施方案中,所述方法還包括步驟(5),對(duì)樣本核酸的擴(kuò)增產(chǎn)物進(jìn)行純化。
112、在一些實(shí)施方案中,所述純化采用磁珠法、高鹽沉淀法、離心柱法或酚氯仿抽提法,優(yōu)選磁珠法。
113、本發(fā)明的第四方面提供一種寡核苷酸引物,所述寡核苷酸從5’端至3’端依次包含測(cè)序接頭序列-標(biāo)簽序列-測(cè)序引物序列-基因特異性引物序列。
114、本發(fā)明的第五方面提供一種寡核苷酸組合,所述寡核苷酸組合包含第一寡核苷酸引物、第三寡核苷酸引物和橋式引物,所述第一寡核苷酸引物從5’端至3’端依次包含測(cè)序接頭序列、標(biāo)簽序列和測(cè)序引物序列,所述第三寡核苷酸引物從5’端至3’端依次包含通用序列和基因特異性引物序列,所述橋式引物從5’端至3’端依次包括通用序列的反向互補(bǔ)序列和測(cè)序引物的反向互補(bǔ)序列。
115、在一些實(shí)施方案中,所述標(biāo)簽序列是用于區(qū)分不同樣本的隨機(jī)序列。在一些實(shí)施方案中,所述標(biāo)簽序列為至少3個(gè)核苷酸,例如4-12個(gè)核苷酸,優(yōu)選6-8個(gè)寡核苷酸,例如8個(gè)核苷酸。
116、在一些實(shí)施方案中,所述基因特異性引物序列是根據(jù)待測(cè)dna樣本的目標(biāo)片段設(shè)計(jì)的特異性引物序列。例如,所述基因特異性引物序列包含至少3個(gè)核苷酸,例如3-50個(gè)核苷酸,例如3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、11個(gè)、12個(gè)、13個(gè)、14個(gè)、15個(gè)、18個(gè)、20個(gè)、22個(gè)、25個(gè)、26個(gè)、28個(gè)、30個(gè)、32個(gè)、35個(gè)、38個(gè)、40個(gè)、42個(gè)、45個(gè)、48個(gè)和50個(gè)核苷酸。
117、在一些實(shí)施方案中,所述通用序列的反向互補(bǔ)序列是指與通用序列部分或全部反向互補(bǔ)的序列,所述測(cè)序引物的反向互補(bǔ)序列是指與測(cè)序引物部分或全部反向互補(bǔ)的序列。
118、在一些實(shí)施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
119、在一些實(shí)施方案中,所述橋式引物的3’末端含有封閉修飾,其作用是阻止dntp添加至橋式引物的3’末端進(jìn)行延伸。在一些實(shí)施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優(yōu)選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
120、在一些實(shí)施方案中,所述通用序列是隨機(jī)序列,且所述通用序列不和所述測(cè)序接頭序列、所述標(biāo)簽序列和/或所述測(cè)序引物序列相同或互補(bǔ)配對(duì)。
121、在一些實(shí)施方案中,所述通用序列是固定序列,其作用在于通過和橋式引物互補(bǔ)使得第一寡核苷酸引物與第三寡核苷酸引物連接,且所述通用序列不和所述測(cè)序接頭序列、所述標(biāo)簽序列和/或所述測(cè)序引物序列相同或互補(bǔ)配對(duì)。
122、在一些實(shí)施方案中,所述通用序列不和目的基因序列相同或互補(bǔ)配對(duì)。
123、在一些實(shí)施方案中,所述通用序列的堿基組成平衡。
124、在一些實(shí)施方案中,所述通用序列的長(zhǎng)度為5-200bp,例如5bp、6bp、7bp、8bp、9bp、10bp、15bp、20bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、150bp、160bp、180bp和200bp。
125、在一些實(shí)施方案中,所述第一寡核苷酸引物包括至少一對(duì)上游第一寡核苷酸引物和下游第一寡核苷酸引物。
126、在一些實(shí)施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測(cè)序接頭序列、上游標(biāo)簽序列和上游測(cè)序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測(cè)序接頭序列、下游標(biāo)簽序列和下游測(cè)序引物序列。
127、在一些實(shí)施方案中,所述上游第一寡核苷酸引物不包含(上游)標(biāo)簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標(biāo)簽序列。
128、在一些實(shí)施方案中,所述測(cè)序接頭序列是當(dāng)前或?qū)頊y(cè)序平臺(tái)(包括但不限于iontorrent平臺(tái)、illumina平臺(tái)和華大平臺(tái)mgi)使用的測(cè)序基質(zhì)相關(guān)序列。
129、在一些實(shí)施方案中,所述測(cè)序接頭序列包括上游測(cè)序接頭序列和下游測(cè)序接頭序列。
130、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是illumina平臺(tái)的p5接頭序列,下游測(cè)序接頭序列illumina平臺(tái)的p7接頭序列;反之亦然。
131、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是iontorrent平臺(tái)的p1銜接頭序列,所述下游測(cè)序接頭序列是ion?torrent平臺(tái)的a銜接頭序列;反之亦然。
132、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。
133、在一些實(shí)施方案中,所述上游第一寡核苷酸引物是illumina平臺(tái)的i5引物,所述下游第一寡核苷酸引物是illumina平臺(tái)的i7引物;反之亦然。
134、在一些實(shí)施方案中,所述第三寡核苷酸引物包括至少一對(duì)上游第三寡核苷酸引物和下游第三寡核苷酸引物。
135、在一些實(shí)施方案中,所述上游第三寡核苷酸引物從5’端至3’端依次包含上游通用序列和基因特異性上游引物序列。
136、在一些實(shí)施方案中,所述下游第三寡核苷酸引物從5’端至3’端依次包含下游通用序列和基因特異性下游引物序列。
137、在一些實(shí)施方案中,所述橋式引物包括至少一對(duì)上游橋式引物和下游橋式引物。
138、在一些實(shí)施方案中,所述上游橋式引物從5’端至3’端依次包括上游通用序列的反向互補(bǔ)序列和上游測(cè)序引物的反向互補(bǔ)序列。
139、在一些實(shí)施方案中,所述下游橋式引物從5’端至3’端依次包括下游通用序列的反向互補(bǔ)序列和下游測(cè)序引物的反向互補(bǔ)序列。
140、在一些實(shí)施方案中,所述上游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
141、在一些實(shí)施方案中,所述上游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
142、在一些實(shí)施方案中,所述上游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
143、在一些實(shí)施方案中,所述上游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
144、本發(fā)明的第六方面提供一種組合物,所述組合物包含dna聚合酶、t4?dna連接酶、atp、dntp、緩沖成分、金屬鹽和引物組合;所述引物組合包含第五方面所述的第一寡核苷酸引物、第三寡核苷酸引物和橋式引物。
145、在一些實(shí)施方案中,所述第一寡核苷酸引物、所述第三寡核苷酸引物和所述橋式引物各自分別以單鏈形式存在于所述組合物中。在一些實(shí)施方案中,所述第一寡核苷酸引物和所述橋式引物通過所述測(cè)序引物序列互補(bǔ),且所述第三寡核苷酸引物和所述橋式引物通過所述通用引物序列互補(bǔ)形成三引物的雙鏈互補(bǔ)結(jié)構(gòu)的形式存在于所述組合物中。
146、在一些實(shí)施方案中,所述第一寡核苷酸引物包含至少一對(duì)第四方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
147、在一些實(shí)施方案中,每一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區(qū)別在于標(biāo)簽序列不相同。
148、在一些實(shí)施方案中,所述第三寡核苷酸引物包含至少一對(duì)第五方面所述的上游第三寡核苷酸引物和下游第三寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
149、在一些實(shí)施方案中,每一對(duì)所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物之間的區(qū)別在于基因特異性引物序列不相同。
150、在一些實(shí)施方案中,所述橋式引物包含至少一對(duì)第五方面所述的上游橋式引物和第四方面所述的下游橋式引物,例如至少1對(duì)或2對(duì)。
151、在一些實(shí)施方案中,每一對(duì)所述上游橋式引物和所述下游橋式引物的區(qū)別在于測(cè)序引物不同。
152、在一些實(shí)施方案中,所述組合物還包括dna樣本。
153、在一些實(shí)施方案中,所述dna樣本是gdna或cdna。
154、在一些實(shí)施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
155、在一些實(shí)施方案中,當(dāng)所述第三寡核苷酸引物的5’末端不含有磷酸化修飾時(shí),且所述組合物中還包括能夠使第三寡核苷酸引物的5’末端產(chǎn)生磷酸化修飾的物質(zhì),例如t4多核苷酸激酶(t4?polynucleotide?kinase,t4?pnk)。
156、在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第三寡核苷酸引物的質(zhì)量比或摩爾比是n:1,所述n是大于或等于1且小于或等于5的常數(shù),例如1、2、3、4和5。
157、在一些實(shí)施方案中,所述dna聚合酶是本領(lǐng)域已知的任意耐熱dna聚合酶。在一些實(shí)施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、vent?dna聚合酶、deepvent?dna聚合酶和kod?dna聚合酶中的一種或多種。
158、在一些實(shí)施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優(yōu)選tris。
159、在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,優(yōu)選mgcl2。
160、在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
161、在一些實(shí)施方案中,所述組合物中還包含其它能夠幫助組合物中的各組分例如酶發(fā)揮作用的物質(zhì),例如甘油。
162、在一些實(shí)施方案中,所述組合物中還包含表面活性劑,例如陰離子表面活性劑、陽(yáng)離子表面活性劑和非離子表面活性劑中的一種或多種。
163、本發(fā)明的第七方面提供一種多重?cái)U(kuò)增子建庫(kù)方法,所述方法包括如下步驟:
164、(1)配制包含至少一對(duì)第一寡核苷酸引物、至少一對(duì)第三寡核苷酸引物、至少一對(duì)橋式引物和樣本核酸的反應(yīng)體系;其中,所述第一寡核苷酸引物從5’端至3’端依次包含測(cè)序接頭序列、標(biāo)簽序列和測(cè)序引物序列,所述第三寡核苷酸引物從5’端至3’端依次包含通用序列和基因特異性引物序列,所述橋式引物從5’端至3’端依次包括通用序列的反向互補(bǔ)序列和測(cè)序引物的反向互補(bǔ)序列;
165、(2)使所述第一寡核苷酸引物的3’端和所述橋式引物的3’端反向互補(bǔ)配對(duì),使所述第三寡核苷酸引物的5’端和所述橋式引物的5’端反向互補(bǔ)配對(duì),連接所述第一寡核苷酸引物和所述第三寡核苷酸引物獲得連接產(chǎn)物;
166、(3)以步驟(2)所述的連接產(chǎn)物作為引物對(duì)所述樣本核酸進(jìn)行pcr擴(kuò)增。
167、在一些實(shí)施方案中,所述標(biāo)簽序列是用于區(qū)分不同樣本的隨機(jī)序列。在一些實(shí)施方案中,所述標(biāo)簽序列為至少3個(gè)核苷酸,例如4-12個(gè)核苷酸,優(yōu)選6-8個(gè)核苷酸,例如8個(gè)。
168、在一些實(shí)施方案中,所述基因特異性引物序列是根據(jù)待測(cè)dna樣本的目標(biāo)片段設(shè)計(jì)的特異性引物序列。例如,所述基因特異性引物序列包含至少3個(gè)核苷酸,例如3-50個(gè)核苷酸,例如3個(gè)、5個(gè)、6個(gè)、7個(gè)、8個(gè)、9個(gè)、10個(gè)、11個(gè)、12個(gè)、13個(gè)、14個(gè)、15個(gè)、18個(gè)、20個(gè)、22個(gè)、25個(gè)、26個(gè)、28個(gè)、30個(gè)、32個(gè)、35個(gè)、38個(gè)、40個(gè)、42個(gè)、45個(gè)、48個(gè)和50個(gè)核苷酸。
169、在一些實(shí)施方案中,所述通用序列的反向互補(bǔ)序列是指與通用序列部分或全部反向互補(bǔ)的序列,所述測(cè)序引物的反向互補(bǔ)序列是指與測(cè)序引物部分或全部反向互補(bǔ)的序列。
170、在一些實(shí)施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
171、在一些實(shí)施方案中,所述橋式引物的3’末端含有封閉修飾,其作用是阻止dntp添加至橋式引物的3’末端進(jìn)行延伸。在一些實(shí)施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優(yōu)選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
172、在一些實(shí)施方案中,所述通用序列是隨機(jī)序列,且所述通用序列不和所述測(cè)序接頭序列、所述標(biāo)簽序列和/或所述測(cè)序引物序列相同或互補(bǔ)配對(duì)。
173、在一些實(shí)施方案中,所述通用序列是固定序列,其作用在于通過和橋式引物互補(bǔ)使得第一寡核苷酸引物與第三寡核苷酸引物連接,且所述通用序列不和所述測(cè)序接頭序列、所述標(biāo)簽序列和/或所述測(cè)序引物序列相同或互補(bǔ)配對(duì)。
174、在一些實(shí)施方案中,所述通用序列不和目的基因序列相同或互補(bǔ)配對(duì)。
175、在一些實(shí)施方案中,所述通用序列的堿基組成平衡。
176、在一些實(shí)施方案中,所述通用序列的長(zhǎng)度為10-200bp,例如10bp、15bp、20bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、150bp、160bp、180bp和200bp。
177、在一些實(shí)施方案中,所述至少一對(duì)第一寡核苷酸引物包括至少一對(duì)上游第一寡核苷酸引物和下游第一寡核苷酸引物。
178、在一些實(shí)施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測(cè)序接頭序列、上游標(biāo)簽序列和上游測(cè)序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測(cè)序接頭序列、下游標(biāo)簽序列和下游測(cè)序引物序列。
179、在一些實(shí)施方案中,所述上游第一寡核苷酸引物不包含(上游)標(biāo)簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標(biāo)簽序列。
180、在一些實(shí)施方案中,所述測(cè)序接頭序列是當(dāng)前或?qū)頊y(cè)序平臺(tái)(包括但不限于iontorrent平臺(tái)、illumina平臺(tái)和華大平臺(tái)mgi)使用的測(cè)序基質(zhì)相關(guān)序列。
181、在一些實(shí)施方案中,所述至少一對(duì)測(cè)序接頭序列包括至少一對(duì)上游測(cè)序接頭序列和下游測(cè)序接頭序列。
182、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是illumina平臺(tái)的p5接頭序列,下游測(cè)序接頭序列illumina平臺(tái)的p7接頭序列;反之亦然。
183、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是iontorrent平臺(tái)的p1銜接頭序列,所述下游測(cè)序接頭序列是ion?torrent平臺(tái)的a銜接頭序列;反之亦然。
184、在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的單端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。在一些實(shí)施方案中,所述上游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)上游夾板序列,所述下游測(cè)序接頭序列是mgi平臺(tái)的雙端標(biāo)簽建庫(kù)下游夾板序列;反之亦然。
185、在一些實(shí)施方案中,所述上游第一寡核苷酸引物是illumina平臺(tái)的i5引物,所述下游第一寡核苷酸引物是illumina平臺(tái)的i7引物;反之亦然。
186、在一些實(shí)施方案中,所述第三寡核苷酸引物包括至少一對(duì)上游第三寡核苷酸引物和下游第三寡核苷酸引物。
187、在一些實(shí)施方案中,所述上游第三寡核苷酸引物從5’端至3’端依次包含上游通用序列和基因特異性上游引物序列。
188、在一些實(shí)施方案中,所述下游第三寡核苷酸引物從5’端至3’端依次包含下游通用序列和基因特異性下游引物序列。
189、在一些實(shí)施方案中,所述至少一對(duì)橋式引物包括至少一對(duì)上游橋式引物和下游橋式引物。
190、在一些實(shí)施方案中,所述上游橋式引物從5’端至3’端依次包括上游通用序列的反向互補(bǔ)序列和上游測(cè)序引物的反向互補(bǔ)序列。
191、在一些實(shí)施方案中,所述下游橋式引物從5’端至3’端依次包括下游通用序列的反向互補(bǔ)序列和下游測(cè)序引物的反向互補(bǔ)序列。
192、在一些實(shí)施方案中,所述上游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
193、在一些實(shí)施方案中,所述上游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
194、在一些實(shí)施方案中,所述上游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
195、在一些實(shí)施方案中,所述上游測(cè)序引物是nextera文庫(kù)結(jié)構(gòu)的測(cè)序引物1,所述下游測(cè)序引物是truseq文庫(kù)結(jié)構(gòu)的測(cè)序引物2;反之亦然。
196、在一些實(shí)施方案中,所述至少一對(duì)第一寡核苷酸引物包含至少一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
197、在一些實(shí)施方案中,每一對(duì)所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區(qū)別在于標(biāo)簽序列不相同。
198、在一些實(shí)施方案中,所述至少一對(duì)第三寡核苷酸引物包含至少一對(duì)所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物,例如至少1對(duì)、5對(duì)、10對(duì)、20對(duì)、50對(duì)、100對(duì)、200對(duì)、300對(duì)和500對(duì),包括但不限于1-1000之間的任意自然數(shù)。
199、在一些實(shí)施方案中,每一對(duì)所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物之間的區(qū)別在于基因特異性引物序列不相同。
200、在一些實(shí)施方案中,所述至少一對(duì)橋式引物包含至少一對(duì)所述上游橋式引物和所述下游橋式引物,例如至少1對(duì)或2對(duì)。
201、在一些實(shí)施方案中,每一對(duì)所述上游橋式引物和所述下游橋式引物的區(qū)別在于測(cè)序引物不同。
202、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)溫度是20-50℃,優(yōu)選25-45℃,例如25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃或45℃。
203、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)時(shí)間是1-60分鐘,優(yōu)選5-40分鐘,例如5分鐘、6分鐘、7分鐘、8分鐘、9分鐘、10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、15分鐘、16分鐘、17分鐘、18分鐘、19分鐘、20分鐘、21分鐘、22分鐘、23分鐘、24分鐘、25分鐘、26分鐘、27分鐘、28分鐘、29分鐘、30分鐘、31分鐘、32分鐘、33分鐘、34分鐘、35分鐘、36分鐘、37分鐘、38分鐘、39分鐘或40分鐘。
204、在一些實(shí)施方案中,所述步驟(2)的反應(yīng)條件是20-50℃孵育1-60分鐘、20-50℃孵育5-40分鐘、25-45℃孵育5-40分鐘、25-40℃孵育5-40分鐘、25-40℃孵育5-35分鐘、25-35℃孵育5-35分鐘、25-35℃孵育5-30分鐘或37℃孵育5-30分鐘,包括但不限于前述孵育溫度和孵育時(shí)間的任意組合。
205、在一些實(shí)施方案中,所述反應(yīng)體系中還包括dna連接酶,優(yōu)選t4?dna連接酶。在一些實(shí)施方案中,所述步驟(2)的孵育過程中,所述第一寡核苷酸引物和所述第三寡核苷酸引物在橋式引物和t4?dna連接酶的作用下產(chǎn)生的連接產(chǎn)物是index-t4-panel長(zhǎng)引物,所述index-t4-panel長(zhǎng)引物從5’端至3’端依次包括接頭序列-標(biāo)簽序列-測(cè)序引物序列-通用序列-基因特異性引物序列。
206、在一些實(shí)施方案中,所述樣本核酸是dna,例如,所述dna是gdna或cdna。
207、在一些實(shí)施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
208、在一些實(shí)施方案中,當(dāng)所述第三寡核苷酸引物的5’末端不含有磷酸化修飾時(shí),所述組合物中還包括能夠使第三寡核苷酸引物的5’末端產(chǎn)生磷酸化修飾的物質(zhì),例如t4多核苷酸激酶(t4?polynucleotide?kinase,t4?pnk)。
209、在一些實(shí)施方案中,所述第一寡核苷酸引物和所述第三寡核苷酸引物的質(zhì)量比或摩爾比是n:1,所述n是大于或等于1且小于或等于5的常數(shù),例如1、2、3、4和5。
210、在一些實(shí)施方案中,所述反應(yīng)體系中還包括dna聚合酶。在一些實(shí)施方案中,所述dna聚合酶是本領(lǐng)域已知的任意耐熱dna聚合酶。在一些實(shí)施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、vent?dna聚合酶、deep?vent?dna聚合酶和kod?dna聚合酶中的一種或多種。
211、在一些實(shí)施方案中,所述反應(yīng)體系中還包括緩沖成分。在一些實(shí)施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優(yōu)選tris。
212、在一些實(shí)施方案中,所述反應(yīng)體系中還包括金屬鹽。在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,優(yōu)選mgcl2。在一些實(shí)施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
213、在一些實(shí)施方案中,所述反應(yīng)體系中還包含dntp。
214、在一些實(shí)施方案中,所述反應(yīng)體系中還包含本領(lǐng)域公知的其它能夠幫助dna聚合酶、核糖核酸內(nèi)切酶發(fā)揮作用的組分,例如甘油。
215、在一些實(shí)施方案中,所述反應(yīng)體系中還包含表面活性劑,例如陰離子表面活性劑、陽(yáng)離子表面活性劑和非離子表面活性劑中的一種或多種。
216、在一些實(shí)施方案中,所述pcr擴(kuò)增包括一個(gè)或多個(gè)(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個(gè)循環(huán)的變性、退火和延伸;優(yōu)選地,所述pcr擴(kuò)增包括預(yù)變性以及多個(gè)循環(huán)(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個(gè))的變性、退火和延伸。
217、在一些實(shí)施方案中,所述pcr擴(kuò)增是一輪pcr擴(kuò)增。
218、在一些實(shí)施方案中,所述pcr擴(kuò)增的條件可以是本領(lǐng)域一般技術(shù)人員已知的任意常規(guī)pcr擴(kuò)增條件。
219、在一些實(shí)施方案中,所述方法還包括步驟(4),對(duì)樣本核酸的擴(kuò)增產(chǎn)物進(jìn)行純化。
220、在一些實(shí)施方案中,所述純化采用磁珠法、高鹽沉淀法、離心柱法或酚氯仿抽提法,優(yōu)選磁珠法。
221、本發(fā)明的第八方面提供一種寡核苷酸引物,所述寡核苷酸引物從5’端至3’端依次包括接頭序列-標(biāo)簽序列-測(cè)序引物序列-通用序列-基因特異性引物序列。
222、本發(fā)明的第九方面提供第三方面或第七方面的方法在多重?cái)U(kuò)增子建庫(kù)中的應(yīng)用。
223、在本發(fā)明中,序列及其反向互補(bǔ)序列之間可以是完全互補(bǔ),也可以是部分互補(bǔ),只要能夠?qū)崿F(xiàn)其后續(xù)的延伸和擴(kuò)增即可。
224、“完全互補(bǔ)”是指該序列的全部核苷酸堿基能夠與相應(yīng)的反向互補(bǔ)序列的全部核苷酸堿基配對(duì)。
225、“部分互補(bǔ)”是指該序列的連續(xù)序列中至少30%(例如40%、50%、60%、70%、80%、90%、95%或99%),但不是全部的堿基與相應(yīng)的反向互補(bǔ)序列的全部連續(xù)序列中相同數(shù)目的堿基雜交。
226、本發(fā)明的組合物用于多重?cái)U(kuò)增體系。