国产真实乱全部视频,黄色片视频在线免费观看,密臀av一区二区三区,av黄色一级,中文字幕.com,日本a级网站,在线视频观看91

同時分析遺傳信息和表觀遺傳信息的方法與流程

文檔序號:42310038發(fā)布日期:2025-07-01 19:27閱讀:12來源:國知局

本發(fā)明涉及一種制備雙鏈核酸分子的方法,一種制備dna文庫的方法,以及一種分析表觀遺傳信息和/或遺傳信息的方法。此外,本發(fā)明還涉及由所述方法分別制備的雙鏈核酸分子和dna文庫。


背景技術(shù):

1、基因突變是指dna序列發(fā)生變化,包括點(diǎn)突變、插入、缺失等?;蛲蛔兪且环N重要的遺傳變異形式,對于生物體的生長、發(fā)育和疾病發(fā)生等方面都具有重要的作用?;蛲蛔儥z測對于研究疾病發(fā)生機(jī)理、診斷疾病、制定個體化治療方案等方面具有重要的意義。例如,在腫瘤研究中,基因突變檢測可以用于篩選腫瘤相關(guān)基因的突變,評估腫瘤的發(fā)生和發(fā)展過程,并針對不同的突變類型制定個體化治療方案。在遺傳病研究中,基因突變檢測可以用于確定遺傳病的致病基因和突變類型,為家族遺傳性疾病的預(yù)防和治療提供重要的依據(jù)?,F(xiàn)代基因突變檢測技術(shù)包括sanger測序、pcr擴(kuò)增測序、next-generation?sequencing(ngs)等方法,這些技術(shù)具有高度的靈敏度和特異性,可以同時檢測多個基因的突變,并且可以快速、準(zhǔn)確地診斷疾病。

2、基因甲基化是一種表觀遺傳學(xué)修飾,是指dna分子上的甲基基團(tuán)(ch3)與胞嘧啶環(huán)上的5位碳原子發(fā)生共價鍵結(jié)合的過程?;蚣谆诨虮磉_(dá)、細(xì)胞分化、發(fā)育和疾病等方面都具有重要的作用。尤其對于了解基因調(diào)控機(jī)制、研究疾病發(fā)生機(jī)理、評估疾病風(fēng)險和制定個體化治療方案等方面具有重要的意義。

3、目前基因突變和基因甲基化檢測廣泛應(yīng)用于腫瘤早期診斷、腫瘤分型、預(yù)后評估和治療效果監(jiān)測等方面并帶來顯著的臨床增益。基因甲基化因其良好的診斷性能和組織溯源性能得到越來越多的重視。但是當(dāng)前市場上檢測產(chǎn)品主要分為兩大類,一類是基于qpcr、sanger與ngs的技術(shù)檢測基因突變信息,一類是基于以上技術(shù)檢測基因甲基化信息,鮮少有基于熒光定量pcr方法學(xué)的產(chǎn)品能同時進(jìn)行基因突變和基因甲基化檢測分析。導(dǎo)致以上問題的主要原因是現(xiàn)有的檢測技術(shù)無法實(shí)現(xiàn)一份樣本同時檢測基因突變和基因甲基化。目前比較常規(guī)的做法是基因突變和甲基化分管進(jìn)行檢測,該過程會消耗大量的模板dna,同時操作復(fù)雜性和檢測成本顯著增加,在臨床上往往難以應(yīng)用推廣。

4、目前,同時進(jìn)行基因甲基化和基因突變檢測需要分別構(gòu)建甲基化和突變文庫,需要使用更多原始投入的dna樣本,同時需要甲基化文庫構(gòu)建和突變文庫構(gòu)建兩個濕實(shí)驗(yàn)流程。但是血漿游離dna、ffpe小樣本dna、單細(xì)胞dna等特殊應(yīng)用場景中,樣本來源的dna往往非常有限,無法滿足分別建庫的需求。

5、因此,提供一種能夠通過一份樣本/一個流程,實(shí)現(xiàn)同時檢測遺傳信息和表觀遺傳信息的方法,將具有廣泛的應(yīng)用前景。


技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)的發(fā)明人經(jīng)過大量的研究,獲得了能夠利用同一靶核酸同時收集遺傳信息和表觀遺傳信息的方法,進(jìn)一步的還獲得了利用同一靶核酸同時進(jìn)行基因組測序和甲基化組測序的方法。該方法能夠顯著的降低基因組測序結(jié)果中出現(xiàn)的假陽性事件概率,大大提高測序的準(zhǔn)確性。具體來說,將基因組c>t突變事件的錯誤率降低了至少兩個數(shù)量級,umi拆分正確率也獲得了顯著提升。進(jìn)一步的,本技術(shù)還對方法中使用的單鏈接頭/雙鏈接頭,以及測序接頭,進(jìn)行了設(shè)計改進(jìn),從而進(jìn)一步提升了方法的準(zhǔn)確性。

2、制備雙鏈核酸分子的方法

3、因此,在第一方面,本技術(shù)提供了一種制備雙鏈核酸分子的方法,所述方法包括:

4、(a-1)提供至少一種單鏈靶核酸,以及包含腺嘌呤(a)、胞嘧啶(c)、鳥嘌呤(g)和胸腺嘧啶(t)的核苷酸混合物,其中,所述胞嘧啶包含或由丙炔基修飾的胞嘧啶組成;

5、(b-1)在允許合成所述單鏈靶核酸的互補(bǔ)鏈的條件下,使所述單鏈靶核酸與所述核苷酸混合物接觸。

6、在本發(fā)明的方法中,在允許合成所述單鏈靶核酸的互補(bǔ)鏈的條件下,單鏈靶核酸與所述核苷酸混合物接觸后,將以單鏈靶核酸(即,第一鏈)為模板,合成單鏈靶核酸的互補(bǔ)鏈(即,第二鏈)。進(jìn)一步,由于核苷酸混合物中的胞嘧啶包含或由丙炔基修飾的胞嘧啶組成,所以單鏈靶核酸的互補(bǔ)鏈(即,第二鏈)中包含丙炔基修飾的胞嘧啶。而所述單鏈靶核酸(即,第一鏈)中包含的胞嘧啶是不帶有修飾的胞嘧啶。因此,在某些實(shí)施方案中,所述核酸分子的互補(bǔ)鏈(即,第二鏈)的部分或全部胞嘧啶對胞嘧啶轉(zhuǎn)化具有抗性。即,在胞嘧啶轉(zhuǎn)化過程中,核酸分子的互補(bǔ)鏈(即,第二鏈)中的丙炔基修飾的胞嘧啶不會發(fā)生改變。

7、如本文中所使用的,表述“允許合成所述單鏈靶核酸的互補(bǔ)鏈的條件”具有本領(lǐng)域技術(shù)人員通常理解的含義,其是指,允許核酸聚合酶(例如dna聚合酶)以一條核酸鏈(即,所述單鏈靶核酸)為模板合成另一條核酸鏈,并形成雙鏈體的條件。此類條件是本領(lǐng)域技術(shù)人員熟知的,并且可涉及下列因素:溫度,雜交緩沖液的ph值、成分、濃度和離子強(qiáng)度等??赏ㄟ^常規(guī)方法來確定合適的條件(參見例如joseph?sambrook,et?al.,molecular?cloning,alaboratory?manual,cold?spring?harbor?laboratory?press,cold?spring?harbor,n.y.(2001))。在本發(fā)明的方法中,“允許合成所述單鏈靶核酸的互補(bǔ)鏈的條件”優(yōu)選地為核酸聚合酶(例如dna聚合酶)的工作條件。

8、在某些實(shí)施方案中,所述胞嘧啶還包含其他(例如,甲基,羥甲基,羧基,鹵代)修飾的胞嘧啶,和/或無修飾的胞嘧啶。

9、在某些實(shí)施方案中,所述丙炔基修飾的胞嘧啶還具有一種或多種其他(例如,甲基,羥甲基,羧基,鹵代)修飾。

10、在某些實(shí)施方案中,所述其他修飾的胞嘧啶選自5-甲基胞嘧啶、5-羥甲基胞嘧啶、5-羧基嘧啶、5-羥基胞嘧啶、5-氟胞嘧啶、5-氯胞嘧啶、5-溴胞嘧啶、5-碘胞嘧啶,或其任意組合。

11、在某些實(shí)施方案中,所述胞嘧啶包含或由5-丙炔基胞嘧啶組成。

12、在某些實(shí)施方案中,所述胞嘧啶包含或由修飾的胞嘧啶組成,其中,所述修飾的胞嘧啶中包含至少10%(例如,至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,至少99%)的5-丙炔基胞嘧啶。

13、在某些實(shí)施方案中,所述修飾的胞嘧啶中包含至少50%,60%,70%,80%,90%,95%或99%的5-丙炔基胞嘧啶。

14、在某些實(shí)施方案中,所述胞嘧啶包含或由5-丙炔基胞嘧啶和5-羥甲基胞嘧啶組成。

15、在某些實(shí)施方案中,所述腺嘌呤包含修飾的腺嘌呤和/或無修飾的腺嘌呤。

16、在某些實(shí)施方案中,所述胸腺嘧啶包含修飾的胸腺嘧啶和/或無修飾的胸腺嘧啶。

17、在某些實(shí)施方案中,所述鳥嘌呤包含修飾的鳥嘌呤和/或無修飾的鳥嘌呤。

18、靶核酸

19、在某些實(shí)施方案中,所述靶核酸是dna(例如,基因組dna,cfdna)和/或rna。

20、在某些實(shí)施方案中,所述單鏈靶核酸是天然存在的單鏈核酸,或者源自雙鏈核酸中的一條核酸鏈。

21、在某些實(shí)施方案中,所述方法還包括:從樣品中獲得單鏈靶核酸,或從樣品中獲得雙鏈靶核酸,并將其制備成單鏈靶核酸。

22、從細(xì)胞或從由細(xì)胞構(gòu)成的生物組織中提取和/或純化核酸(例如,基因組dna)的方法是本領(lǐng)域公知的,技術(shù)人員能夠根據(jù)生物組織來選用合適的方法或商業(yè)試劑盒。

23、在一些實(shí)施方案中,從組織中提取核酸(例如,基因組dna)需要進(jìn)行細(xì)胞破碎或細(xì)胞裂解。在此類實(shí)施方案中,可以通過化學(xué)和物理方法,例如混合、研磨或超聲處理組織樣品;也可以通過添加用于細(xì)胞裂解的洗滌劑或表面活性劑去除膜脂質(zhì),例如通過添加蛋白酶去除蛋白質(zhì);例如通過添加rnase,去除rna。核酸(例如,基因組dna)純化可以通過采用乙醇或異丙醇的沉淀進(jìn)行,或者通過苯酚-氯仿萃取進(jìn)行。

24、樣品

25、在某些實(shí)施方案中,所述樣品或靶核酸獲自原核生物,真核生物(例如原生動物,寄生蟲,真菌,酵母,植物,動物包括哺乳動物和人類)或病毒(例如herpes病毒,hiv,流感病毒,eb病毒,肝炎病毒,脊髓灰質(zhì)炎病毒等)或類病毒。

26、在某些實(shí)施方案中,所述樣品為包含細(xì)胞和/或組織的樣品。

27、在某些實(shí)施方案中,所述樣品選自全血,血清,血漿,腦脊液,痰,糞便,尿液,唾液,汗液,淚液,耳流出物,淋巴液,灌洗液,骨髓懸液,陰道流出物,經(jīng)宮頸灌洗液,腹水,乳液,呼吸道,腸道和泌尿生殖道的分泌物,羊水,或其任意組合。

28、在某些實(shí)施方案中,樣品是通過非侵入性方法可容易獲得的樣品,例如全血、血漿、血清、汗液、淚液、痰、尿液、耳流出物、唾液或排泄物。在某些實(shí)施方案中,樣品是外周血樣品、或外周血樣品的血漿和/或血清級分。在某些實(shí)施方案中,樣品是拭子或涂片、活檢樣本或細(xì)胞培養(yǎng)物。在某些實(shí)施方案中,樣品是兩種或更多種樣品的混合物,例如樣品可以包含生物流體樣品、組織樣品和細(xì)胞培養(yǎng)物樣品中的兩種或更多種。如本文所用,術(shù)語“全血”、“血漿”和“血清”明確涵蓋其級分或經(jīng)處理的部分。類似地,在樣品取自活檢、拭子、涂片等的情況下,“樣品”明確涵蓋來源于活檢、拭子、涂片等的經(jīng)處理的級分或部分。

29、雖然樣品通常取自受試者(例如,患者),但也可以獲自任何哺乳動物(包括但不限于犬、貓、馬、山羊、綿羊、牛、豬等),以及混合群體(如來自野外的微生物群體或來自患者的病毒群體)的樣品。

30、樣品可以從生物來源獲得后直接使用,或者經(jīng)過預(yù)處理以改變樣品的特性后使用。例如,此類預(yù)處理可以包括血液制備血漿、稀釋粘性流體等。預(yù)處理的方法還可以包括但不限于過濾、沉淀、稀釋、蒸餾、混合、離心、冷凍、凍干、濃縮、擴(kuò)增、核酸片段化、干擾組分的滅活、試劑的添加、裂解等。如果對于樣品采用此類預(yù)處理方法,則此類預(yù)處理方法通常使得靶核酸保留在測試樣品中。

31、在某些實(shí)施方案中,所述方法在步驟(b-1)之前還包括:(a-2)提供一種或多種接頭以及連接酶,在允許核酸連接的條件下,使所述單鏈靶核酸與所述接頭和連接酶接觸。

32、在本發(fā)明的方法中,在允許核酸連接的條件下,使所述單鏈靶核酸與所述接頭和連接酶接觸,從而將所述接頭將連接至所述單鏈靶核酸。

33、如本文中所使用的,“允許核酸連接的條件”具有本領(lǐng)域技術(shù)人員通常理解的含義,并且可通過常規(guī)的方法來確定。此類連接條件可涉及下列因素:溫度,雜交緩沖液的ph值、成分和離子強(qiáng)度等。

34、在某些實(shí)施方案中,所述連接酶選自t4?dna連接酶,t3?dna連接酶,t7?dna連接酶,大腸桿菌dna連接酶,hifi?taq?dna連接酶,t4?rna連接酶,rtcb連接酶,環(huán)連接酶,熱穩(wěn)定的dna連接酶,或其任意組合。

35、單鏈靶核酸的接頭

36、在某些實(shí)施方案中,所述接頭選自單鏈接頭,雙鏈接頭,或其任意組合。

37、在某些實(shí)施方案中,所述接頭的3'-末端是封閉的;例如,通過在單鏈接頭的最后一個核苷酸的3'-oh上添加化學(xué)部分(例如,生物素或烷基),通過將探針的最后一個核苷酸的3'-oh去除,或者將所述最后一個核苷酸替換為雙脫氧核苷酸,從而封閉接頭的3'-末端。

38、單鏈接頭

39、在某些實(shí)施方案中,所述單鏈接頭包含:第一互補(bǔ)序列,以及與所述第一互補(bǔ)序列部分或全部互補(bǔ)的第二互補(bǔ)序列。

40、在某些實(shí)施方案中,所述接頭還包含:連接所述第一互補(bǔ)序列和第二互補(bǔ)序列的連接序列。

41、在某些實(shí)施方案中,所述連接序列位于所述第一互補(bǔ)序列的下游。

42、在某些實(shí)施方案中,所述第二互補(bǔ)序列位于所述連接序列的下游。

43、在某些實(shí)施方案中,在允許核酸雜交或退火的條件下,所述接頭呈莖環(huán)狀。

44、在某些實(shí)施方案中,所述接頭含有1個或多個(例如,2個,3個,4個,5個)spacer。

45、在某些實(shí)施方案中,所述1個或多個spacer位于接頭的連接序列中。

46、在某些實(shí)施方案中,所述spacer選自spacer?c3、spacer?c6、spacer?c12、spacer9、spacer?18、無堿基連接子(dspacer)、pc?linker,或其任意組合。

47、在某些實(shí)施方案中,所述單鏈接頭還包含1個或多個(例如,2個,3個,4個,5個)可切割部分。

48、如本文所用的,術(shù)語“可切割部分”是指核酸中包含的任何可切割或可切除的部分。例如,可切割部分可以包含尿嘧啶、核糖核苷酸或其他可以使用核酸切割劑(例如,udg、rna酶、內(nèi)切核酸酶等)切除或切割的修飾的核苷酸。

49、在某些實(shí)施方案中,所述核酸切割劑能夠?qū)宇^中的可切割部分進(jìn)行切割。

50、在某些實(shí)施方案中,所述核酸切割劑選自尿嘧啶dna糖基化酶(udg)、無嘧啶/無嘌呤核酸內(nèi)切酶(ape)、核酸內(nèi)切酶(例如,核酸內(nèi)切酶viii(endoviii)或v(endov))、尿嘧啶特異性切除試劑(user)酶、甲酰胺嘧啶dna糖基化酶(fpg)、8-氧代鳥嘌呤糖基化酶(ogg1)、rna酶,或其任意組合。

51、可以理解,當(dāng)所述接頭中包含不同的可切割部分,可以選取多對應(yīng)的核酸切割劑進(jìn)行相應(yīng)切割。

52、在某些實(shí)施方案中,當(dāng)所述可切割部分包含核糖核苷酸(例如,胸腺嘧啶核糖核酸),所述核酸切割劑包含rna酶(例如,核糖核酸酶h(rnase?h))。

53、在某些實(shí)施方案中,當(dāng)所述可切割部分包含尿嘧啶脫氧核糖核酸,所述核酸切割劑包含udg或user酶。

54、在某些實(shí)施方案中,所述第二互補(bǔ)序列中包含至少1個可切割部分,或者,第二互補(bǔ)序列的3’端與至少1個可切割部分連接。

55、在某些實(shí)施方案中,所述第二互補(bǔ)序列的3’端與尿嘧啶脫氧核糖核酸或核糖核苷酸相連。

56、在某些實(shí)施方案中,所述連接序列中還包含1個或多個(例如,2個,3個,4個,5個)可切割部分。

57、在某些實(shí)施方案中,所述連接序列中的多個可切割部分位于所述spacer的兩側(cè)。

58、在某些實(shí)施方案中,所述連接序列中包含2個可切割部分,所述2個可切割部分分別鄰接于spacer的兩側(cè)。

59、在某些實(shí)施方案中,所述單鏈接頭還包含:獨(dú)特分子標(biāo)識符(umi)。

60、如本文所用的,術(shù)語“umi”或“獨(dú)特分子標(biāo)識符”是指可以用于識別一個或多個特定核酸的一個或多個核苷酸序列,其可用于將不同的核苷酸序列彼此區(qū)分開來。使用umi來識別或區(qū)分核苷酸序列的方法,可以參見例如,kivioja,nature?methods?9,72-74(2012)。

61、在某些實(shí)施方案中,所述umi選自隨機(jī)umi,非隨機(jī)umi,或其任意組合。

62、在某些實(shí)施方案中,所述隨機(jī)umi包含4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的n堿基,其中,n為a,t,c,g中的任意一個。

63、在某些實(shí)施方案中,所述非隨機(jī)umi包含多種(例如,4,8,16,32,64,96,或更多種)4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的特定序列。

64、在某些實(shí)施方案中,每個非隨機(jī)umi與其它非隨機(jī)umi在其相應(yīng)序列位置上相差至少1個(例如,1個,2個,3個,4個)核苷酸。

65、在某些實(shí)施方案中,所述單鏈接頭包含4-10bp(例如,4bp,5bp,6bp,7bp,8bp,9bp,10bp)的隨機(jī)umi。

66、在某些實(shí)施方案中,所述隨機(jī)umi位于所述第二互補(bǔ)序列的下游。

67、在某些實(shí)施方案中,所述隨機(jī)umi與所述第二互補(bǔ)序列之間包含可切割部分。

68、在某些實(shí)施方案中,所述單鏈接頭從5’至3’方向依次包含:第一互補(bǔ)序列,連接序列,第二互補(bǔ)序列,可切割部分和umi。

69、其中,所述連接序列中包含或不包含可切割部分。

70、在某些實(shí)施方案中,所述連接序列中不包含可切割部分。在某些實(shí)施方案中,所述單鏈接頭具有如seq?id?no:1或seq?id?no:8所示的序列。

71、在某些實(shí)施方案中,所述連接序列中包含可切割部分。在某些實(shí)施方案中,所述單鏈接頭具有如seq?id?no:7所示的序列。

72、雙鏈接頭

73、在某些實(shí)施方案中,所述雙鏈接頭包含:第一寡核苷酸鏈,和第二寡核苷酸鏈;其中,所述第一寡核苷酸鏈包含第一雜交序列,以及第一模板序列;第二寡核苷酸鏈包含第二雜交序列,以及第二模板序列;其中,所述第二雜交序列與所述第一雜交序列部分或全部互補(bǔ);所述第二模板序列與所述第一模板序列部分或全部不互補(bǔ)。

74、在某些實(shí)施方案中,第一寡核苷酸鏈中,所述第一模板序列位于所述第一雜交序列的下游;優(yōu)選地,所述第一模板序列為游離的3’單鏈臂。

75、在某些實(shí)施方案中,所述3’單鏈臂的末端是封閉的;例如,通過在單鏈接頭的最后一個核苷酸的3'-oh上添加化學(xué)部分(例如,生物素或烷基),通過將探針的最后一個核苷酸的3'-oh去除,或者將所述最后一個核苷酸替換為雙脫氧核苷酸,從而封閉接頭的3'-末端。

76、在某些實(shí)施方案中,第二寡核苷酸鏈中,所述第二雜交序列位于所述第二模板序列的下游。在某些實(shí)施方案中,所述第二模板序列為游離的5’單鏈臂。

77、在某些實(shí)施方案中,所述5’單鏈臂的末端是封閉的;例如,通過在單鏈接頭的最后一個核苷酸的3'-oh上添加化學(xué)部分(例如,生物素或烷基),通過將探針的最后一個核苷酸的3'-oh去除,或者將所述最后一個核苷酸替換為雙脫氧核苷酸,從而封閉接頭的3'-末端。

78、在某些實(shí)施方案中,所述雙鏈接頭還包含如前所述的可切割部分。

79、在某些實(shí)施方案中,所述雙鏈接頭還包含如前所述的umi。

80、在某些實(shí)施方案中,所述雙鏈接頭的第一寡核苷酸鏈從5’至3’方向依次包含:第一雜交序列,第一模板序列,其中,所述第一模板序列為游離的3’單鏈臂。

81、在某些實(shí)施方案中,所述雙鏈接頭的第二寡核苷酸鏈從5’至3’方向依次包含:第二模板序列,第二雜交序列,可切割部分,umi,其中,所述第二模板序列為游離的5’單鏈臂。

82、在某些實(shí)施方案中,所述第二寡核苷酸鏈的3’末端是封閉的;例如,通過在單鏈接頭的最后一個核苷酸的3'-oh上添加化學(xué)部分(例如,生物素或烷基),通過將探針的最后一個核苷酸的3'-oh去除,或者將所述最后一個核苷酸替換為雙脫氧核苷酸,從而封閉接頭的3'-末端。

83、在某些實(shí)施方案中,所述雙鏈接頭具有如seq?id?no:9和10所示的序列。

84、因此,在某些實(shí)施方案中,所述方法還包括:(a-3)提供核酸切割劑,使所述核酸切割劑與(a-2)的產(chǎn)物接觸。

85、在某些實(shí)施方案中,將所述核酸切割劑與(a-2)的產(chǎn)物接觸后,所述核酸切割劑能夠?qū)宇^中的可切割部分進(jìn)行切割。

86、在本發(fā)明的方法中,所述核酸切割劑對接頭中的可切割部分進(jìn)行切割后,接頭在可切割部分將產(chǎn)生斷裂的核苷酸鏈,由此,可切割部分下游的umi以及封閉的3’末端將隨之從接頭的核苷酸鏈上脫落。

87、在此類實(shí)施方案中,切割后,接頭的斷裂處由于不存在封閉的3’末端,在與核苷酸混合物接觸后,將以單鏈靶核酸(即,第一鏈)為模板,在斷裂處向下合成單鏈靶核酸的互補(bǔ)鏈(即,第二鏈)。

88、在某些實(shí)施方案中,所述方法是通過下述步驟(1)至步驟(4)實(shí)現(xiàn)的:

89、(1)提供單鏈靶核酸;任選地,所述單鏈靶核酸的5'端不具有游離的磷酸基團(tuán);

90、(2)提供一種或多種所述接頭以及連接酶,在允許核酸連接的條件下,使所述單鏈靶核酸與所述接頭和連接酶接觸;

91、(3)提供所述核酸切割劑,在允許核酸切割劑切割核酸的條件下,使步驟(2)的產(chǎn)物與所述核酸切割劑接觸;

92、(4)提供所述核苷酸混合物,在允許合成所述單鏈靶核酸的互補(bǔ)鏈的條件下,使所述單鏈靶核酸與所述核苷酸混合物接觸。

93、在某些實(shí)施方案中,在步驟(1)中,通過堿性磷酸酶與所述單鏈靶核酸接觸,以使所述單鏈靶核酸的5'端不具有游離的磷酸基團(tuán)。

94、核酸分子或其擴(kuò)增產(chǎn)物

95、在第二方面,本技術(shù)提供了一種核酸分子或其擴(kuò)增產(chǎn)物,其由第一方面所述的方法制備。

96、在某些實(shí)施方案中,所述擴(kuò)增產(chǎn)物是核酸分子的第一鏈的擴(kuò)增產(chǎn)物,所述第一鏈具有與單鏈靶核酸序列相同的序列。

97、在某些實(shí)施方案中,所述擴(kuò)增產(chǎn)物是核酸分子的第二鏈的擴(kuò)增產(chǎn)物,所述第二鏈具有與單鏈靶核酸序列互補(bǔ)的序列。

98、在某些實(shí)施方案中,所述擴(kuò)增產(chǎn)物是核酸分子的第一鏈與第二鏈的擴(kuò)增產(chǎn)物,其中,所述第一鏈具有與所述單鏈靶核酸序列相同的序列,所述第二鏈具有與所述單鏈靶核酸序列互補(bǔ)的序列。

99、核酸分子或其擴(kuò)增產(chǎn)物的用途

100、在第三方面,本技術(shù)提供了第二方面所述的核酸分子或其擴(kuò)增產(chǎn)物用于胞嘧啶轉(zhuǎn)化。

101、在某些實(shí)施方案中,第二方面所述的核酸分子或其擴(kuò)增產(chǎn)物用于表觀遺傳信息(例如,dna甲基化,dna突變)分析。

102、在某些實(shí)施方案中,第二方面所述的核酸分子或其擴(kuò)增產(chǎn)物用于遺傳信息(例如,基因組)分析。

103、制備dna文庫的方法

104、在第四方面,本技術(shù)提供了一種制備dna文庫的方法,所述方法包括:

105、(i)提供第三方面所述的核酸分子或其擴(kuò)增產(chǎn)物;

106、(ii)在允許無修飾的胞嘧啶轉(zhuǎn)化成尿嘧啶的條件下,對所述核酸分子或其擴(kuò)增產(chǎn)物進(jìn)行胞嘧啶轉(zhuǎn)化處理。

107、在某些實(shí)施方案中,所述dna文庫選自基因組文庫,甲基化組文庫,或其任意組合。

108、在某些實(shí)施方案中,所述方法用于同時分別制備基因組文庫和甲基化組文庫。

109、在一些實(shí)施方案中,上述方法還包括:將核酸分子或其擴(kuò)增產(chǎn)物片段化。本領(lǐng)域技術(shù)人員能夠選取合適的dna片段化方法,以使dna文庫適用于測序(包括但不限于新一代測序)。在某些實(shí)施方案中,通過物理片段化、酶促片段化和化學(xué)剪切的方法將dna片段化,以生成對于dna文庫而言合適的和/或足夠的長度的片段。

110、在本文中,可以使用標(biāo)準(zhǔn)實(shí)驗(yàn)流程或市售試劑盒進(jìn)行胞嘧啶轉(zhuǎn)化。在某些實(shí)施方案中,使用naoh使核酸分子或其擴(kuò)增產(chǎn)物變性。在核酸分子或其擴(kuò)增產(chǎn)物變性后,可以用亞硫酸氫鈉或偏亞硫酸氫鈉以例如2m的最終濃度(ph在約5和6之間)在55℃處理4-16小時。所述步驟用亞硫酸鹽共價修飾不具有修飾的胞嘧啶。轉(zhuǎn)化后,將核酸分子或其擴(kuò)增產(chǎn)物脫鹽,然后通過在堿性ph和室溫下培養(yǎng)核酸分子或其擴(kuò)增產(chǎn)物進(jìn)行脫磺酸作用,其導(dǎo)致脫氨基-并轉(zhuǎn)化為尿嘧啶。在一個實(shí)施例中,市售試劑盒如ez?dna?methylation-gold、ez?dnamethylation-direct或ez?dna?methylation-lightning試劑盒(購自zymo?research?corp(爾灣,加州))用于亞硫酸氫鹽轉(zhuǎn)化。

111、在某些實(shí)施方案中,還可以通過不使用亞硫酸氫根離子的方法將胞嘧啶轉(zhuǎn)化為尿嘧啶。例如,利用胞苷脫氨酶分別催化胞苷和脫氧胞苷為尿苷和脫氧尿苷的不可逆水解脫氨作用。在一些實(shí)施例中,不帶有修飾的胞嘧啶轉(zhuǎn)化為尿嘧啶是通過酶促反應(yīng)完成。在一些實(shí)施例中,將核酸分子與胞苷脫氨酶一起培育。在一些實(shí)施例中,胞苷脫氨酶包括活化誘導(dǎo)的胞苷脫氨酶(aid)和載脂蛋白b?mrna編輯酶、催化多肽樣蛋白(apobec)。在一些實(shí)施例中,apobec酶選自人類apobec家族,其由以下群組所組成:apobec-1(apo1)、apobec-2(apo2)、aid、apobec-3a、-3b、-3c、-3de、-3f、-3g、-3h及apobec-4(apo4)。在一些實(shí)施例中,酶是apobec的變體(us20130244237)。在一些實(shí)施例中,轉(zhuǎn)化使用市售試劑盒。在一個實(shí)例中,使用諸如apobec-seq(nebiolabs;us20130244237)的試劑盒。

112、因此,在某些實(shí)施方案中,在步驟(ii)中,提供亞硫酸氫鹽,使其與所述核酸分子或其擴(kuò)增產(chǎn)物接觸;任選地,還提供胞苷脫氨酶和/或tet,使其與所述核酸分子或其擴(kuò)增產(chǎn)物接觸。

113、在某些實(shí)施方案中,在步驟(ii)之后,富集核酸分子或其擴(kuò)增產(chǎn)物的第一鏈。

114、在某些實(shí)施方案中,在步驟(ii)之后,富集核酸分子或其擴(kuò)增產(chǎn)物的第二鏈。

115、在某些實(shí)施方案中,在步驟(ii)之后,分離核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈與第二鏈。

116、在某些實(shí)施方案中,所述第一鏈用于構(gòu)建甲基化組文庫。

117、在某些實(shí)施方案中,所述第二鏈用于構(gòu)建基因組文庫。

118、測序引物

119、在某些實(shí)施方案中,所述方法還包括:提供測序引物,在允許核酸連接的條件下,使其與步驟(ii)的產(chǎn)物接觸。

120、在某些實(shí)施方案中,所述測序引物包含第一寡核苷酸鏈,和第二寡核苷酸鏈;其中,所述第一寡核苷酸鏈包含第一雜交序列,以及第一模板序列;第二寡核苷酸鏈包含第二雜交序列,以及第二模板序列;其中,所述第二雜交序列與所述第一雜交序列部分或全部互補(bǔ);所述第二模板序列與所述第一模板序列部分或全部不互補(bǔ)。

121、在某些實(shí)施方案中,第一寡核苷酸鏈中,所述第一模板序列位于所述第一雜交序列的上游。在某些實(shí)施方案中,所述第一模板序列為游離的5’單鏈臂;在某些實(shí)施方案中,所述第一寡核苷酸鏈的雜交序列與核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈相連接。

122、在某些實(shí)施方案中,第二寡核苷酸鏈中,所述第二雜交序列位于所述第二模板序列的上游。在某些實(shí)施方案中,所述第二模板序列為游離的3’單鏈臂;在某些實(shí)施方案中,所述第二寡核苷酸鏈的雜交序列與核酸分子或其擴(kuò)增產(chǎn)物中的第二鏈相連接。

123、在某些實(shí)施方案中,所述測序引物中的胞嘧啶包含或由修飾的胞嘧啶組成。在某些實(shí)施方案中,所述修飾的胞嘧啶選自5-丙炔基胞嘧啶、5-甲基胞嘧啶、5-羥甲基胞嘧啶、5-羧基嘧啶、5-羥基胞嘧啶、5-氟胞嘧啶、5-氯胞嘧啶、5-溴胞嘧啶、5-碘胞嘧啶,或其任意組合。

124、在某些實(shí)施方案中,所述測序引物中的胞嘧啶包含或由5-丙炔基胞嘧啶組成。

125、在某些實(shí)施方案中,所述測序引物的具體序列根據(jù)測序平臺(例如,bgi,illumina)而調(diào)整。

126、在某些實(shí)施方案中,所述測序引物具有如seq?id?no:11和12所示的序列。

127、在某些實(shí)施方案中,所述測序引物的第一寡核苷酸鏈和/或第二寡核苷酸鏈中還包含獨(dú)特分子標(biāo)識符(umi)。

128、在某些實(shí)施方案中,所述umi第一寡核苷酸鏈和/或第二寡核苷酸鏈的雜交序列中,或者,所述umi位于第一寡核苷酸鏈和/或第二寡核苷酸鏈的雜交序列的末端。

129、在某些實(shí)施方案中,所述umi位于第一雜交序列的3’端。在某些實(shí)施方案中,所述第一寡核苷酸鏈的umi與核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈相連接。

130、在某些實(shí)施方案中,所述umi位于第二雜交序列的5’端。在某些實(shí)施方案中,所述第二寡核苷酸鏈的umi與核酸分子或其擴(kuò)增產(chǎn)物中的第二鏈相連接。

131、在某些實(shí)施方案中,所述umi選自隨機(jī)umi,非隨機(jī)umi,或其任意組合。

132、在某些實(shí)施方案中,所述隨機(jī)umi包含4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的n堿基,其中,n為a,t,c,g中的任何一個。

133、在某些實(shí)施方案中,所述隨機(jī)umi包含10-16bp(例如,10bp,11bp,12bp,13bp,14bp,15bp,16bp)的n堿基,其中,n為a,t,c,g中的任何一個。

134、在某些實(shí)施方案中,所述非隨機(jī)umi包含多種(例如,2-4條,4-8條,8-16條,16-32條,32-64條,64-96條,或更多種)4-28bp(例如,4-10bp,10-16bp,16-22bp,22-28bp)的特定序列。

135、在某些實(shí)施方案中,所述非隨機(jī)umi包含2-8條(例如,2條,3條,4條,5條,6條,7條,8條)4-10bp(例如,4bp,5bp,6bp,7bp,8bp,9bp,10bp)的特定序列。

136、在某些實(shí)施方案中,非隨機(jī)umi中包含的多種特定序列中,每個特定序列與其它特定序列在其相應(yīng)核苷酸位置上具有至少1個(例如,1個,2個,3個,4個,5個,6個,7個,8個,9個,10個)核苷酸的差異。

137、在某些實(shí)施方案中,所述非隨機(jī)umi的特定序列如seq?id?no:13-16任一項(xiàng)所示。

138、在某些實(shí)施方案中,所述測序引物的第一寡核苷酸鏈和/或第二寡核苷酸鏈中還包含定位標(biāo)簽,其中,所述定位標(biāo)簽包含至少1種(例如,1種,2種,3種,4種,5種,6種,7種,8種)特定序列,所述特定序列由3-8個(例如,3個,4個,5個,6個,7個,8個)堿基組成。

139、在某些實(shí)施方案中,所述堿基選自a,t,c,g。

140、在某些實(shí)施方案中,所述特定序列由3-8個相同或不同的堿基組成。

141、在某些實(shí)施方案中,所述定位標(biāo)簽包含4種特定序列,所述4種特定序列均由相同或不同的堿基組成。在某些實(shí)施方案中,所述4種特定序列彼此之間的長度不相同(例如,相差1個堿基,相差2個堿基,相差3個堿基)。

142、在某些實(shí)施方案中,所述定位標(biāo)簽包含由3個相同或不同的堿基組成的第一特定序列、由4個相同或不同的堿基組成的第二特定序列、由5個相同或不同的堿基組成的第三特定序列,以及由6個相同或不同的堿基組成的第四特定序列。

143、在某些實(shí)施方案中,所述第一特定序列具有如seq?id?no:17所示的序列。在某些實(shí)施方案中,所述第二特定序列具有如seq?id?no:18所示的序列。在某些實(shí)施方案中,所述第三特定序列具有如seq?id?no:19所示的序列。在某些實(shí)施方案中,所述第四特定序列具有如seq?id?no:20所示的序列。

144、在某些實(shí)施方案中,所述定位標(biāo)簽在特定序列的5’端還包含至少1個堿基g。

145、在某些實(shí)施方案中,所述定位標(biāo)簽包含如seq?id?no:21所示的序列。在某些實(shí)施方案中,所述定位標(biāo)簽包含如seq?id?no:4所示的序列。在某些實(shí)施方案中,所述定位標(biāo)簽包含如seq?id?no:5所示的序列。在某些實(shí)施方案中,所述定位標(biāo)簽包含如seq?id?no:6所示的序列。

146、在某些實(shí)施方案中,所述定位標(biāo)簽位于第一寡核苷酸鏈和/或第二寡核苷酸鏈的雜交序列中,或者,所述定位標(biāo)簽位于第一寡核苷酸鏈和/或第二寡核苷酸鏈的雜交序列的末端。

147、在某些實(shí)施方案中,所述定位標(biāo)簽位于第一雜交序列的3’端。在某些實(shí)施方案中,所述第一寡核苷酸鏈的定位標(biāo)簽與核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈相連接。

148、在某些實(shí)施方案中,所述定位標(biāo)簽位于第二雜交序列的5’端。在某些實(shí)施方案中,所述第二寡核苷酸鏈的定位標(biāo)簽與核酸分子或其擴(kuò)增產(chǎn)物中的第二鏈相連接。

149、dna文庫

150、在另一方面,本技術(shù)提供一種dna文庫,其由權(quán)利要求如前所述的方法構(gòu)建而成。

151、在某些實(shí)施方案中,所述dna文庫選自基因組文庫,甲基化組文庫,或其任意組合。

152、在某些實(shí)施方案中,由如前所述的方法同時分別制備基因組文庫和甲基化組文庫。

153、在某些實(shí)施方案中,所述基因組文庫包含或由核酸分子或其擴(kuò)增產(chǎn)物中的第二鏈組成。

154、在某些實(shí)施方案中,所述甲基化組文庫包含或由核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈組成。

155、分析表觀遺傳信息和/或遺傳信息的方法

156、在另一方面,本技術(shù)提供一種分析表觀遺傳信息和/或遺傳信息的方法,所述方法包括:對如前所述的核酸分子或其擴(kuò)增產(chǎn)物進(jìn)行檢測和/或分析,或者,對如前所述的dna文庫進(jìn)行檢測和/或分析。

157、在某些實(shí)施方案中,對所述核酸分子或其擴(kuò)增產(chǎn)物中的第一鏈和第二鏈分別進(jìn)行檢測和/或分析。

158、在某些實(shí)施方案中,對所述基因組文庫和甲基化組文庫分別進(jìn)行檢測和/或分析。

159、在某些實(shí)施方案中,所述檢測為測序。在某些實(shí)施方案中,所述測序選自下一代測序,大量并行測序,焦磷酸測序,合成測序,單分子實(shí)時測序,polony測序,dna納米球測序,日光鏡單分子測序,納米孔測序,sanger測序,shotgun測序,gilbert測序分析,或其任意組合。

160、在某些實(shí)施方案中,所述檢測選自微陣列,定量pcr(qpcr),數(shù)字微滴pcr(ddpcr),分子倒置探針,或其任意組合。

161、在某些實(shí)施方案中,所述分析為生物信息學(xué)分析。在某些實(shí)施方案中,生物信息學(xué)分析包括但不限于:生物信息學(xué)分析選自序列比對,基因組分析,轉(zhuǎn)錄組分析,單核苷酸變異(snv)分析,基因拷貝數(shù)變異(cnv)分析,測量染色體拷貝數(shù),檢測遺傳病變。

162、在某些實(shí)施方案中,生物信息學(xué)分析可用于量化dna文庫(例如,cfdna)中分析的基因組當(dāng)量數(shù)目,或者用于檢測靶基因座的遺傳狀態(tài),或者用于檢測靶基因座中的遺傳病變,或者用于測量靶基因座內(nèi)的拷貝數(shù)波動。

163、在某些實(shí)施方案中,可以將測序獲得的序列讀段(reads)與一種或多種參考dna序列(例如,人基因組序列)之間進(jìn)行序列比對。在具體實(shí)施方案中,測序比對可用于檢測靶基因座中的遺傳病變,包括但不限于檢測核苷酸轉(zhuǎn)換或顛換、核苷酸插入或缺失、基因組重排、拷貝數(shù)變化或基因融合。在某些實(shí)施方案中,所述表觀遺傳信息為dna甲基化信息。

164、在某些實(shí)施方案中,所述遺傳信息為全基因組信息和/或突變信息。

165、區(qū)分第一鏈(甲基化信息)/第二鏈(基因組信息)的方法

166、在某些實(shí)施方案中,對所述核酸分子或其擴(kuò)增產(chǎn)物進(jìn)行測序,并獲得包含第一鏈和第二鏈的測序數(shù)據(jù),或者分別獲得第一鏈和第二鏈的測序數(shù)據(jù)。

167、在某些實(shí)施方案中,當(dāng)測序引物的第一寡核苷酸鏈中包含umi,第二寡核苷酸鏈中不包含umi,則通過鑒定核酸分子或其擴(kuò)增產(chǎn)物的測序數(shù)據(jù)中是否存在umi序列,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

168、在某些實(shí)施方案中,鑒定到umi的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,未鑒定到umi的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

169、在某些實(shí)施方案中,當(dāng)測序引物的第二寡核苷酸鏈中包含umi,第一寡核苷酸鏈中不包含umi,則通過鑒定測序數(shù)據(jù)中是否存在umi序列,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

170、在某些實(shí)施方案中,鑒定到umi的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,未鑒定到umi的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。

171、在某些實(shí)施方案中,當(dāng)測序引物的第一寡核苷酸鏈中包含umi,第二寡核苷酸鏈中也包含umi,則通過鑒定測序數(shù)據(jù)中umi更靠近于測序引物的5’單鏈臂還是3’單鏈臂,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

172、在某些實(shí)施方案中,鑒定到umi更靠近5’單鏈臂的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,鑒定到umi更靠近3’單鏈臂的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

173、在某些實(shí)施方案中,通過分別鑒定第一寡核苷酸鏈和第二寡核苷酸鏈中umi的胞嘧啶是否發(fā)生胞嘧啶轉(zhuǎn)化,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

174、在某些實(shí)施方案中,umi中的胞嘧啶經(jīng)過了轉(zhuǎn)化(例如,轉(zhuǎn)化為尿嘧啶)的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。

175、在某些實(shí)施方案中,umi中的胞嘧啶未經(jīng)過胞嘧啶轉(zhuǎn)化(例如,保持為胞嘧啶)的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

176、在某些實(shí)施方案中,當(dāng)測序引物的第一寡核苷酸鏈中包含定位標(biāo)簽,第二寡核苷酸鏈中不包含定位標(biāo)簽,則通過鑒定核酸分子或其擴(kuò)增產(chǎn)物的測序數(shù)據(jù)中是否存在定位標(biāo)簽的序列,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

177、在某些實(shí)施方案中,鑒定到定位標(biāo)簽的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,未鑒定到定位標(biāo)簽的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

178、在某些實(shí)施方案中,當(dāng)測序引物的第二寡核苷酸鏈中包含定位標(biāo)簽,第一寡核苷酸鏈中不包含定位標(biāo)簽,則通過鑒定測序數(shù)據(jù)中是否存在定位標(biāo)簽序列,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

179、在某些實(shí)施方案中,鑒定到定位標(biāo)簽的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,未鑒定到定位標(biāo)簽的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。

180、在某些實(shí)施方案中,當(dāng)測序引物的第一寡核苷酸鏈中包含定位標(biāo)簽,第二寡核苷酸鏈中也包含定位標(biāo)簽,則通過鑒定測序數(shù)據(jù)中定位標(biāo)簽更靠近于測序引物的5’單鏈臂還是3’單鏈臂,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

181、在某些實(shí)施方案中,,鑒定到定位標(biāo)簽更靠近5’單鏈臂的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。在某些實(shí)施方案中,鑒定到定位標(biāo)簽更靠近3’單鏈臂的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

182、在某些實(shí)施方案中,通過分別鑒定第一寡核苷酸鏈和第二寡核苷酸鏈中定位標(biāo)簽的序列是否發(fā)生變化,以區(qū)分第一鏈和第二鏈的測序數(shù)據(jù)。

183、在某些實(shí)施方案中,定位標(biāo)簽中的鳥嘌呤(g)轉(zhuǎn)化成腺嘌呤(a)的測序數(shù)據(jù)為第一鏈的測序數(shù)據(jù)。

184、在某些實(shí)施方案中,定位標(biāo)簽中的鳥嘌呤(g)未經(jīng)過轉(zhuǎn)化的測序數(shù)據(jù)為第二鏈的測序數(shù)據(jù)。

185、在某些實(shí)施方案中,所述第一鏈的測序數(shù)據(jù)用于靶核酸的甲基化信息的分析。

186、在某些實(shí)施方案中,所述第二鏈的測序數(shù)據(jù)用于靶核酸的基因組信息的分析。

187、dna文庫的用途

188、在另一方面,本技術(shù)提供了如前所述的dna文庫用于分析表觀遺傳信息和/或遺傳信息。

189、在某些實(shí)施方案中,所述dna文庫選自基因組文庫,甲基化組文庫,或其任意組合。

190、在某些實(shí)施方案中,所述表觀遺傳信息為dna甲基化信息。

191、在某些實(shí)施方案中,所述遺傳信息為全基因組信息和/或突變信息。

192、試劑盒的用途

193、在另一方面,本技術(shù)提供了如前所述的核酸分子或其擴(kuò)增產(chǎn)物,或如前所述的dna文庫在制備試劑盒中的用途,所述試劑盒用于檢測受試者是否患有疾病。

194、在某些實(shí)施方案中,所述疾病導(dǎo)致受試者的表觀遺傳信息和/或遺傳信息發(fā)生變化(例如,核苷酸轉(zhuǎn)換或顛換、核苷酸插入或缺失、基因組重排、拷貝數(shù)變化或基因融合)。

195、在某些實(shí)施方案中,所述疾病是癌癥。在某些實(shí)施方案中,所述疾病是遺傳疾病。

196、在某些實(shí)施方案中,所述試劑盒用于:

197、(1)檢測受試者是否患有癌癥;

198、(2)檢測受試者是否癌癥復(fù)發(fā);

199、(3)檢測患有疾病的受試者對所接受的針對所述疾病的療法和/或藥物的響應(yīng)性;

200、(4)檢測受試者是否患有遺傳疾病。

201、因此,在某些實(shí)施例中,所述試劑盒的檢測對象可以是接受了化學(xué)療法、放射療法或免疫療法的受試者。在某些實(shí)施例中,所述試劑盒的檢測對象可以是進(jìn)行過癌癥治療的失敗或成功后的癌癥復(fù)發(fā)的受試者。

202、在某些實(shí)施方案中,所述癌癥選自肝癌、肝細(xì)胞癌、黑素瘤、胰腺癌、肺癌、腎癌、胃癌、食道癌、結(jié)腸癌、乳腺癌、卵巢癌、子宮頸癌、睪丸癌、前列腺癌、淋巴瘤、b細(xì)胞淋巴瘤、擴(kuò)散性大b細(xì)胞淋巴瘤、濾泡性淋巴瘤、被套區(qū)細(xì)胞淋巴瘤、小淋巴細(xì)胞淋巴瘤、脾邊緣區(qū)b細(xì)胞淋巴瘤、結(jié)外邊緣區(qū)粘膜相關(guān)淋巴組織b細(xì)胞淋巴瘤,淋巴結(jié)邊緣區(qū)b細(xì)胞淋巴瘤、淋巴漿細(xì)胞淋巴瘤、原發(fā)性積液淋巴瘤、伯基特淋巴瘤/伯基特細(xì)胞白血病、t細(xì)胞淋巴瘤、間變性大細(xì)胞淋巴瘤(原發(fā)性皮膚型)、間變性大細(xì)胞淋巴瘤、(全身型)、外周t細(xì)胞淋巴瘤、血管免疫母細(xì)胞性t細(xì)胞淋巴瘤、成人t細(xì)胞淋巴瘤/白血病(人類t細(xì)胞淋巴細(xì)胞病毒i型陽性)、結(jié)外nk/t細(xì)胞淋巴瘤(鼻型),腸病相關(guān)t細(xì)胞淋巴瘤、ga?mma/delta肝脾t細(xì)胞淋巴瘤、皮下脂膜炎樣t細(xì)胞淋巴瘤、多發(fā)性骨髓瘤、蕈狀肉芽腫。

203、在某些實(shí)施方案中,所述遺傳疾病選自阿爾茨海默病(apoe1)、腓骨肌萎縮癥、leber遺傳性視神經(jīng)病變(lhon)、angelman綜合征(ube3a,泛素-蛋白連接酶e3a)、prader-willi綜合征(15號染色體中的區(qū)域)、β-地中海貧血(hbb,β-球蛋白)、戈謝病(i型)(gba,葡糖腦苷脂酶)、囊性纖維化(cftr上皮氯通道)、鐮狀細(xì)胞病(hbb,β-球蛋白)、苯丙酮尿癥(pah,苯丙氨酸水解酶)、家族性高膽固醇血癥(ldlr,低密度脂蛋白受體)、亨廷頓病(hdd,亨廷頓蛋白)、i型神經(jīng)纖維瘤病(nf1,nf1腫瘤抑制基因)、肌強(qiáng)直性營養(yǎng)不良(dm,薏仁米)、結(jié)節(jié)性硬化癥(tsc1,馬鈴薯球蛋白)、軟骨發(fā)育不全(fgfr3,成纖維細(xì)胞生長因子受體)、脆性x綜合征(fmr1,rna結(jié)合蛋白)、杜氏肌肉營養(yǎng)不良(dmd,肌萎縮蛋白)、a型血友病(f8c,凝血因子viii)、lesch-nyhan綜合征(hprt1,次黃嘌呤鳥嘌呤核糖基轉(zhuǎn)移酶1)和腎上腺腦白質(zhì)營養(yǎng)不良(abcd1)。

204、試劑盒

205、在另一方面,本技術(shù)提供了一種試劑盒,所述試劑盒包含:

206、(1)丙炔基修飾的胞嘧啶;(2)胞嘧啶轉(zhuǎn)化試劑(例如,亞硫酸氫鹽,胞苷脫氨酶和/或tet);和(3)如前所述的單鏈接頭和/或雙鏈接頭。

207、在某些實(shí)施方案中,所述試劑盒還包含:(4)用于建庫的試劑。

208、在某些實(shí)施方案中,所述用于建庫的試劑選自酶,用于dna末端修復(fù)的試劑,rnase-free水,或其任意組合。

209、在某些實(shí)施方案中,所述酶選自t4?dna連接酶,t3?dna連接酶,t7dna連接酶,大腸桿菌dna連接酶,hifi?taq?dna連接酶,t4?rna連接酶,rtcb連接酶,環(huán)連接酶,熱穩(wěn)定的dna連接酶,或其任意組合。

210、術(shù)語定義

211、在本發(fā)明中,除非另有說明,否則本文中使用的科學(xué)和技術(shù)名詞具有本領(lǐng)域技術(shù)人員所通常理解的含義。并且,本文中所用的病毒學(xué)、生物化學(xué)、免疫學(xué)實(shí)驗(yàn)室操作步驟均為相應(yīng)領(lǐng)域內(nèi)廣泛使用的常規(guī)步驟。同時,為了更好地理解本發(fā)明,下面提供相關(guān)術(shù)語的定義和解釋。

212、當(dāng)本文使用術(shù)語“例如”、“如”、“諸如”、“包括”、“包含”或其變體時,這些術(shù)語將不被認(rèn)為是限制性術(shù)語,而將被解釋為表示“但不限于”或“不限于”。

213、除非本文另外指明或根據(jù)上下文明顯矛盾,否則術(shù)語“一個”和“一種”以及“該”和類似指稱物在描述本發(fā)明的上下文中(尤其在以下權(quán)利要求的上下文中)應(yīng)被解釋成覆蓋單數(shù)和復(fù)數(shù)。

214、如本文中所使用的,術(shù)語“多核苷酸”、“核酸序列”、“核酸片段”、“寡核苷酸”、“核酸”和“核酸分子”是指任何長度的核苷酸的聚合物形式,諸如脫氧核糖核苷酸(dntp)或核糖核苷酸(rntp)或其類似物,并且可以互換使用。寡核苷酸通常由四種核苷酸堿基的特定序列構(gòu)成:腺嘌呤(a);胞嘧啶(c);鳥嘌呤(g);和胸腺嘧啶(t)(當(dāng)多核苷酸是rna時,胸腺嘧啶(t)為尿嘧啶(u))。核酸的非限制性實(shí)例包括dna、rna、基因組dna(例如,gdna,諸如剪切g(shù)dna)、無細(xì)胞dna(例如,cfdna)、合成dna/rna、基因或基因片段的編碼或非編碼區(qū)、根據(jù)連鎖分析定義的基因座、外顯子、內(nèi)含子、信使rna(mrna)、轉(zhuǎn)移rna、核糖體rna、短干擾rna(sirna)、短發(fā)夾rna(shrna)、微rna(mirna)、核酶、互補(bǔ)dna(cdna)、重組核酸、分支核酸、質(zhì)粒、載體、任何序列的分離dna、任何序列的分離rna、核酸探針和引物。核酸可以包含一個或多個具有修飾的核苷酸,諸如甲基化核苷酸和核苷酸類似物。

215、如本文所用的,術(shù)語“擴(kuò)增”一般是指產(chǎn)生核酸分子的一個或多個拷貝或者延伸產(chǎn)物(例如,核酸分子上的引物延伸反應(yīng)的產(chǎn)物)。核酸分子的擴(kuò)增可以產(chǎn)生與核酸分子雜交的單鏈或者核酸分子或其互補(bǔ)序列的多個拷貝。擴(kuò)增產(chǎn)物可以是通過擴(kuò)增程序從起始模板核酸分子生成的單鏈或雙鏈核酸分子?!皵U(kuò)增產(chǎn)物”可以包含其中至少一部分可能與起始模板的至少一部分基本上相同或基本上互補(bǔ)的核酸鏈。在起始模板是雙鏈核酸分子的情況下,擴(kuò)增產(chǎn)物可以包含與一條鏈的至少一部分基本上相同并且與任一條鏈的至少一部分基本上互補(bǔ)的核酸鏈。在某些實(shí)施方案中,擴(kuò)增產(chǎn)物可以是單鏈的或雙鏈的。擴(kuò)增反應(yīng)可以是例如聚合酶鏈反應(yīng)(pcr),諸如乳液聚合酶鏈反應(yīng)(epcr;例如,在微反應(yīng)器諸如孔或液滴內(nèi)進(jìn)行的pcr)。

216、如本文中所使用的,術(shù)語“互補(bǔ)”意指,兩條核酸序列能夠根據(jù)堿基配對原則(waston-crick原則)在彼此之間形成氫鍵,并由此形成雙鏈體。在本技術(shù)中,術(shù)語“互補(bǔ)”包括“實(shí)質(zhì)上互補(bǔ)”和“完全互補(bǔ)”。如本文中所使用的,術(shù)語“完全互補(bǔ)”意指,一條核酸序列中的每一個堿基都能夠與另一條核酸鏈中的堿基配對,而不存在錯配或缺口。如本文中所使用的,術(shù)語“實(shí)質(zhì)上互補(bǔ)”意指,一條核酸序列中的大部分堿基都能夠與另一條核酸鏈中的堿基配對,其允許存在錯配或缺口(例如,一個或數(shù)個核苷酸的錯配或缺口)。通常,在允許核酸雜交、退火或擴(kuò)增的條件下,“互補(bǔ)”(例如實(shí)質(zhì)上互補(bǔ)或完全互補(bǔ))的兩條核酸序列將選擇性地/特異性地發(fā)生雜交或退火,并形成雙鏈體。相應(yīng)地,術(shù)語“不互補(bǔ)”意指,兩條核酸序列在允許核酸雜交、退火或擴(kuò)增的條件下不能發(fā)生雜交或退火,無法形成雙鏈體。如本文中所使用的,術(shù)語“不完全互補(bǔ)”意指,一條核酸序列中的堿基不能夠與另一條核酸鏈中的堿基完全配對,至少存在一個錯配或缺口。

217、如本文所用的,術(shù)語“無修飾的核苷酸”包括天然存在的核苷酸,諸如包含腺嘌呤(a)、胸腺嘧啶(t)、胞嘧啶(c)、尿嘧啶(u)或鳥嘌呤(g)的核苷酸。

218、如本文所用的,術(shù)語“修飾的核苷酸”包括但不限于衍生自天然存在的核苷酸的類似物,或與天然存在的核苷酸的結(jié)構(gòu)具有相似性但包含一個或多個差異的核苷酸。在某些實(shí)施方案中,修飾的核苷酸包括肌苷、二氨基嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黃嘌呤、黃嘌呤、脫氮黃嘌呤、脫氮鳥嘌呤、異胞嘧啶、異鳥嘌呤、4-乙?;奏ぁ?-(羧基羥甲基)尿嘧啶、5-羧基甲基氨基甲基-2-硫代尿苷、5-羧基甲基氨基甲基尿嘧啶、二氫尿嘧啶、β-d-半乳糖基q核苷(galactosylqueosine)、n6-異戊烯基腺嘌呤、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、n6-腺嘌呤、7-甲基鳥嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫代尿嘧啶、β-d-甘露糖基q核苷(mannosylqueosine)、5”-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲基硫代-d46-異戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、懷丁苷(wybutoxosine)、假尿嘧啶、q核苷(queosine)、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫代尿嘧啶、3-(3-氨基-3-n-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤、乙炔基核苷酸堿基、1-丙炔基核苷酸堿基、疊氮基核苷酸堿基、硒代磷酸酯核酸及其修飾型式(例如,通過氧化、還原、和/或添加取代基,諸如烷基、羥烷基、羥基或鹵素部分)。

219、如本文所用的,術(shù)語“測序引物”一般是指通過與靶核酸相互作用以促進(jìn)測序(例如,下一代測序(ngs))的分子(例如,多核苷酸)。在測序引物的存在下,靶核酸能夠通過測序儀完成測序。在某些實(shí)施方案中,測序引物可以包含與捕獲靶核酸雜交或結(jié)合的核苷酸序列,捕獲靶核酸連接至測序系統(tǒng)的固體支撐物,諸如珠子或流動池。在某些實(shí)施方案中,測序引物可以包含與靶核酸雜交或結(jié)合以生成發(fā)夾環(huán)的核苷酸序列,從而允許靶核酸通過測序系統(tǒng)進(jìn)行測序。在某些實(shí)施方案中,測序引物可以包含測序儀基序,其可以是與另一分子(例如,多核苷酸)的流動池序列互補(bǔ)的核苷酸序列并且可由測序系統(tǒng)用來對靶核酸進(jìn)行測序。

220、如本文中所使用的,術(shù)語“下一代測序(ngs)”是指允許克隆擴(kuò)增的分子和單個核酸分子大量并行測序的測序方法。ngs的非限制性例子包括使用可逆染料終止子的合成測序和連接測序。

221、如本文中所使用的,術(shù)語“spacer”是指間臂類修飾。將spacer引入到寡核苷酸中,通常是為了在寡核苷酸之間或寡核苷酸與其他官能團(tuán)之間建立一段距離,以起到避免空間位阻、減少基團(tuán)之間不利的相互作用、增加柔性等作用?;蛘撸诓恍枰押塑账嶙鲅由斓那闆r中,spacer可以作為封閉基團(tuán)使用。不同spacer的原子數(shù)量不同,可以通過調(diào)節(jié)所插入spacer的數(shù)量與種類達(dá)到需要的空間距離。spacer的種類包括但不限于,有疏水性的spacer?c3、c6、c12,親水性的spacer?9、spacer?18、dspacer、pc?linker。

222、如本文所用的,術(shù)語“umi”或“獨(dú)特分子標(biāo)識符”是指可以用于識別一個或多個特定核酸的一個或多個核苷酸序列,其可用于將不同的核苷酸序列彼此區(qū)分開來。使用umi來識別核苷酸序列的方法,可以參見例如,kivioja,nature?methods?9,72-74(2012)。umi可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個核苷酸(例如,連續(xù)核苷酸)。使用下一代測序技術(shù)對多個樣品進(jìn)行高通量分析中,使用umi可以對樣品進(jìn)行區(qū)分。在某些實(shí)施方案中,umi可以隨機(jī)生成(即,隨機(jī)umi)或非隨機(jī)生成(即,非隨機(jī)umi)。

223、如本文所用的,術(shù)語“可切割部分”是指核酸中包含的任何可切割或可切除的部分。例如,可切割部分可以包含尿嘧啶、核糖核苷酸或其他可以使用酶(例如,udg、rna酶、內(nèi)切核酸酶等)切除或切割的修飾的核苷酸。可切割部分可以包含間隔區(qū),例如c3間隔區(qū)、己二醇、三乙二醇間隔區(qū)(例如,間隔區(qū)9)、六乙二醇間隔區(qū)(例如,間隔區(qū)18)或其組合或類似物。可切割部分可以包含修飾的核苷酸,例如甲基化核苷酸。修飾的核苷酸可以被酶特異性識別(例如,甲基化核苷酸可以被mspji識別)。可切割部分可以被酶促切割(例如,使用諸如udg、rna酶、ape1、mspji等的酶)??汕懈畈糠挚梢允褂么碳砬懈?,例如光刺激、化學(xué)刺激、熱刺激等。

224、應(yīng)當(dāng)理解,可切割部分可以連接到核酸分子的任何位置中。例如,在圖1中,第二互補(bǔ)序列與umi之間連接有可切割部分(例如,尿嘧啶脫氧核糖核酸)。因此,可切割部分(例如,尿嘧啶、核糖核苷酸、間隔區(qū)、無堿基位點(diǎn)、酶特異性修飾的核苷酸,諸如甲基化核苷酸等)及其任何組合,可以連接于核酸分子的任何片段的5'末端或3'末端處。相似地,在核酸分子是雙鏈的情況下,可切割部分可以設(shè)置在不同的鏈上。例如,一條鏈可以在5'末端連接有可切割部分,并且另一條鏈可以在3'末端連接有可切割部分。

225、如本文所用的,術(shù)語“樣品”是指來源于細(xì)胞、組織、器官或生物體的樣品,其包含疑似具有表觀遺傳信息變異(例如,甲基化修飾)和/或遺傳信息變異(例如但不限于單核苷酸多態(tài)性、插入、缺失和結(jié)構(gòu)變異)的至少一種核酸序列的核酸或核酸的混合物。在某些實(shí)施方案中,樣品包含至少一種靶核酸,所述靶核酸的表觀遺傳信息和/或遺傳疑似經(jīng)歷了變異。

226、發(fā)明的有益效果

227、本技術(shù)的發(fā)明人經(jīng)過大量的研究,獲得了能夠利用同一靶核酸同時收集遺傳信息和表觀遺傳信息的方法,進(jìn)一步的還獲得了利用同一靶核酸同時進(jìn)行基因組測序和甲基化組測序的方法。該方法能夠顯著的降低基因組測序結(jié)果中出現(xiàn)的假陽性事件概率,大大提高測序的準(zhǔn)確性。具體來說,將基因組c>t突變事件的錯誤率降低了至少兩個數(shù)量級,umi拆分正確率也獲得了顯著提升。進(jìn)一步的,本技術(shù)還對方法中使用的單鏈接頭/雙鏈接頭,以及測序接頭,進(jìn)行了設(shè)計改進(jìn),從而進(jìn)一步提升了方法的準(zhǔn)確性。

228、下面將結(jié)合附圖和實(shí)施例對本發(fā)明的實(shí)施方案進(jìn)行詳細(xì)描述,但是本領(lǐng)域技術(shù)人員將理解,下列附圖和實(shí)施例僅用于說明本發(fā)明,而不是對本發(fā)明的范圍的限定。根據(jù)附圖和優(yōu)選實(shí)施方案的下列詳細(xì)描述,本發(fā)明的各種目的和有利方面對于本領(lǐng)域技術(shù)人員來說將變得顯然。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1