
-
生物通官微
陪你抓住生命科技
跳動的脈搏
三代測序時(shí)代即將來臨:PacBio首次確認(rèn)一種疾病大片段缺失突變
【字體: 大 中 小 】 時(shí)間:2016年12月09日 來源:生物通
編輯推薦:
二代測序?yàn)樯茖W(xué)研究帶來了翻天覆地的變化,但是越來越多研究表明這種短讀長測序SRS對大片段結(jié)構(gòu)變異的檢測能力非常有限。近期生物學(xué)預(yù)印網(wǎng)站BioRxiv公布了一項(xiàng)斯坦福大學(xué)的最新成果,發(fā)布了第一例發(fā)表的PacBio在致病突變確診當(dāng)中的應(yīng)用。同時(shí)納米孔測序儀MinION也宣布首次完成了多個(gè)人類基因組的測序。
二代測序?yàn)樯茖W(xué)研究帶來了翻天覆地的變化,但是越來越多研究表明這種短讀長測序 (short-read sequencing, SRS)雖然高通量,成本低,然而對于串聯(lián)重復(fù)序列、高GC/AT序列、高度多態(tài)性區(qū)域、高度同源區(qū)域以及大片段結(jié)構(gòu)變異的檢測能力非常有限,難以全方位的捕捉基因組的變化。據(jù)估計(jì),使用100bp的測序讀長,有5% 的測序片段無法定位到唯一的基因組區(qū)域。
第三代測序的出現(xiàn)為解決這一難題帶來了希望,比如PacBio屬于長讀長測序(long-readsequencing,LRS),可以有效的彌補(bǔ)SRS的不足之處。PacBio在臨床基因組學(xué)中的應(yīng)用,讓我們有機(jī)會了解以往常被忽視的遺傳變異。此外牛津納米孔公司MinIONs測序也逐漸在基因組測序領(lǐng)域煥發(fā)出光彩。
比如近期生物學(xué)預(yù)印網(wǎng)站BioRxiv公布了一項(xiàng)斯坦福大學(xué)的最新成果:Long-read whole genome sequencing identifies causal structural variation in a Mendelian disease,這是第一例發(fā)表的PacBio在致病突變確診當(dāng)中的應(yīng)用,證明了第三代測序技術(shù)在疾病相關(guān)的結(jié)構(gòu)變異中有巨大的潛力。
Carney綜合征(Carneycomplex, CNC)是一種罕見的常染色體顯性遺傳疾病,多發(fā)心臟和皮膚黏液瘤,常伴有皮膚色素沉著與內(nèi)分泌過度等癥狀。位于17號染色體的抑癌基因PRKAR1A與CNC發(fā)病有關(guān),因此又稱為CNC1基因,該基因的突變可引起腫瘤發(fā)生。
本文的患者個(gè)體為Carney綜合征的疑似病例。患者出生時(shí)表現(xiàn)出了一定的呼吸問題,7歲時(shí)首次發(fā)現(xiàn)心臟黏液瘤,隨后予以切除,10歲時(shí)發(fā)現(xiàn)有睪丸腫塊,13歲時(shí)發(fā)現(xiàn)有垂體瘤,18歲時(shí)再次切除了復(fù)發(fā)的心臟粘液瘤。此時(shí),患者被懷疑患有Carney綜合征,但臨床PRKAR1A基因突變檢測顯示為陰性。2016年,患者在準(zhǔn)備進(jìn)行心臟移植時(shí),醫(yī)生團(tuán)隊(duì)第二次進(jìn)行了全基因組測序分子診斷。此次檢測使用Illumina HiSeq 2500平臺完成,平均測序深度36×,數(shù)據(jù)分析由斯坦福大學(xué)(Stanford Medicine Clinical Genomics Service)完成,但此次分析沒有檢測出任何可以解釋患者臨床表征的遺傳變異。
為了評估基因組結(jié)構(gòu)變異,發(fā)現(xiàn)潛在的致病原因,研究人員在PacBio Sequel系統(tǒng)上進(jìn)行了全基因組測序,測序文庫為10kb DNA文庫,共使用10個(gè)SMRT cell芯片,測序獲得26.7Gb數(shù)據(jù)(約8.6×),測序讀長N50為9612 bp。經(jīng)生物信息分析,共發(fā)現(xiàn)了大于50bp的6971個(gè)缺失和6821個(gè)插入變異。通過與陰性對照對比,并側(cè)重分析疾病相關(guān)基因的外顯子區(qū)域,共鑒定出重要的3個(gè)插入和3個(gè)缺失變異,其中就包含PRKAR1A。分析結(jié)果顯示,在PRKAR1A基因第一個(gè)外顯子中包含2184 bp的雜合性缺失突變。 Sanger測序結(jié)果也發(fā)現(xiàn)此缺失突變的存在,并且證實(shí)了PacBio可以精確檢測出缺失斷裂點(diǎn)。

PacBio測序鑒定出的PRKAR1A基因1號外顯子處2184bp雜合性缺失。
文章指出,人類基因組中存在著許多低復(fù)雜度的區(qū)域,如重復(fù)序列和高多態(tài)性的區(qū)域、HLA區(qū)域等,這些區(qū)域的存在對短讀長和基于參考的基因組組裝是非常大挑戰(zhàn)。雖然目前的SRS已經(jīng)在單核苷酸和小插入/缺失變異的遺傳發(fā)現(xiàn)中非常成功,但最近的研究表明我們大大低估了基因組中結(jié)構(gòu)變異的復(fù)雜性,另外,許多疾病正是由超出SRS分辨率范圍的序列重復(fù)引起的。
更多詳情,請咨詢中國地區(qū)PacBio獨(dú)家代理商基因有限公司
同時(shí),12月初,牛津大學(xué)人類遺傳學(xué)威康信托中心(WTCHG)聯(lián)合基因組分析公司Genomicsplc宣布,他們利用牛津納米孔公司MinIONs測序儀首次完成了多個(gè)人類基因組的測序。
2012年,Oxford Nanopore公司在AGBT(基因組生物學(xué)技術(shù)進(jìn)展年會)上發(fā)布了自己的納米孔測序系統(tǒng)——MinION。MinION測序儀是一種手持式設(shè)備,通過USB設(shè)備與電腦相連,加上耗材試劑,它的售價(jià)僅為1000美元。
今年年初Nature雜志發(fā)表的一項(xiàng)研究展示了這種便攜式基因組測序儀在這次疫情中起到的重要作用。研究人員用這些測序儀在幾內(nèi)亞建立了基因組測序?qū)嶒?yàn)室,對埃博拉患者的樣本進(jìn)行實(shí)時(shí)測序,嚴(yán)密監(jiān)控了埃博拉疫情的發(fā)展。
國立首爾大學(xué)醫(yī)學(xué)院的研究人員和10xGenomics公司也利用去年新發(fā)售的GemCodeTM測序平臺以及第三代測序PacBio單分子實(shí)時(shí)測序平臺,對一名韓國人的基因組(AK1)進(jìn)行從頭組裝和單倍體型定相信息分析。這是迄今為止發(fā)表的最為連續(xù)的人類基因組組裝,填補(bǔ)了特異人群參考基因組的空白,并確定了結(jié)構(gòu)變異。相關(guān)結(jié)論發(fā)表在Nature雜志上。
(生物通綜合)
原文摘要:
Long-read whole genome sequencing identifies causal structural variation in a Mendelian disease
Current clinical genomics assays primarily utilize short-read sequencing (SRS), which offers high throughput, high base accuracy, and low cost per base. SRS has, however, limited ability to evaluate tandem repeats, regions with high [GC] or [AT] content, highly polymorphic regions, highly paralogous regions, and large-scale structural variants. Long-read sequencing (LRS) has complementary strengths and offers a means to discover overlooked genetic variation in patients undiagnosed by SRS. To evaluate LRS, we selected a patient who presented with multiple neoplasia and cardiac myxomata suggestive of Carney complex for whom targeted clinical gene testing and whole genome SRS were negative. Low coverage whole genome LRS was performed on the PacBio Sequel system and structural variants were called, yielding 6,971 deletions and 6,821 insertions > 50bp. Filtering for variants that are absent in an unrelated control and that overlap a coding exon of a disease gene identified three deletions and three insertions. One of these, a heterozygous 2,184 bp deletion, overlaps the first coding exon of PRKAR1A, which is implicated in autosomal dominant Carney complex. This variant was confirmed by Sanger sequencing and was classified as pathogenic using standard criteria for the interpretation of sequence variants. This first successful application of whole genome LRS to identify a pathogenic variant suggests that LRS has significant potential to identify disease-causing structural variation. We recommend larger studies to evaluate the diagnostic yield of LRS, and the development of a comprehensive catalog of common human structural variation to support future studies.
生物通微信公眾號
知名企業(yè)招聘