<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        訪談:深入3000bp測序平均讀長的單分子實時測序[新品推薦]

        【字體: 時間:2011年12月01日 來源:生物通

        編輯推薦:

          全球首個第三代測序平臺——PacBio RS單分子實時測序系統(tǒng)自今年4月推出以來,受到了很多研究者的關注。據(jù)悉,Pacific將會在明年初發(fā)布新版本C2試劑,屆時該系統(tǒng)的平均讀長將提升至2500-3000 bp!大家除了被其長讀長所吸引之外,也非常關心PacBio RS的準確性、速度、可擴展性和費用,以及它會在目前呈三國鼎立之勢的測序市場中扮演什么樣的角色。為此,生物通特邀了PacBio RS中國代理——基因有限公司專門負責PacBio的技術專家,就大家普遍關心的這些問題進行了比較深入的探討。

        前言

        測序技術已成為當今生命科學研究中發(fā)展最快的領域之一,其技術更新速度之快,用“日新月異”一詞來形容也不為過。全球首個第三代測序平臺——PacBio RS單分子實時測序系統(tǒng)自今年4月底推出,受到了很多研究者的關注。Pacific Biosciences預計將在明年一季度正式發(fā)布PacBio RS的新版本C2試劑,屆時該系統(tǒng)的平均讀長將從現(xiàn)在的1300 bp驟然提升至2500-3000 bp!最長讀長可超過10000bp。令人驚嘆的數(shù)字!經(jīng)典的Sanger測序長度也就是1200bp左右,已難以匹敵,新一代測序(NGS,即二代測序)就更是望塵莫及啦。

        短讀長之困

        風起云涌的新一代測序(NGS)市場三國鼎立,三大平臺你追我趕,在測序速度和單次運行能獲取的數(shù)據(jù)量上不斷刷新記錄,精彩紛呈,但其共同的短板也非常明顯——序列讀長太短——僅100-200bp的讀長相比龐大的基因組,使得完成拼接工作變得無比艱巨,不少用戶雖然獲得了大量的測序數(shù)據(jù),測序覆蓋深度達到了幾十倍甚至上百倍,但仍然沒法完成基因組的拼接。對于新物種來說,往往還需要傳統(tǒng)的Sanger測序先做scaffold。

        今年羅氏454平臺通過升級達到平均讀長500bp以上,最長可達到1000bp,因此一些頂級研究院在做de novo測序時更傾向于用454做scaffold,再配合其他速度更快的NGS平臺完成后續(xù)的測序工作,以求提高數(shù)據(jù)處理速度。

        關于單分子實時測序的各種疑問

        第三代單分子實時測序技術自問世以來就備受關注,有關其工作原理,生物通早在去年的ebiotech期刊新一代測序?qū)]嬛幸延形恼陆榻B過( 縱觀第三代測序之Pacific Biosciences http://m.lsnkyy.cc/newsf/2010-10/20101014173036143.htm)。C2試劑對平均讀長大幅提升則在“第三代測序PacBioRS升級(http://m.lsnkyy.cc/newsf/2011-10/20111018165836418.htm )”一文著重介紹。

        但是許多疑問依然存在,比如
        1)最受大家關注的,是PacBio RS的準確性究竟如何?有用戶反饋,PacBio單分子測序準確度大概只有85%,這么低的準確度怎么能保證結(jié)果的準確性?
        2)PacBio RS的長讀長,對數(shù)據(jù)分析而言到底有什么優(yōu)勢?
        3)PacBio RS單分子測序無需PCR擴增,有何優(yōu)勢和劣勢?
        4)單分子測序獲得結(jié)果的速度會更快嗎?運行通量有多大?一次運行需要多長時間?能獲得多少可定位數(shù)據(jù)?
        5)除了速度,讀長,通量,精確性,PacBio未來的可擴展性如何?
        6)PacBio的運行費用如何?
        7)已成三國鼎立之勢的測序市場,PacBio RS加入戰(zhàn)局究竟會扮演什么樣的角色?會不會秒殺NGS出局呢?

        為此,生物通特邀了PacBio RS中國代理——基因有限公司專門負責PacBio的技術專家,就大家普遍關心的這些問題進行了比較深入的探討,希望能使廣大讀者對這一最新的測序技術了解更多。

        關于讀長

        Q:長讀長是PacBio RS最引人注目的特點之一,長讀長對測序來說到底有什么優(yōu)勢?

        A:長讀長在序列拼接、定位以及需要跨越重復區(qū)域的應用中有著極大優(yōu)勢。
        例如在De Novo Assembly時,目前遇到的主要困難在于如何跨越那些重復區(qū)域以及高/低GC含量的區(qū)域,從而完成整個基因組的拼接。

        如果把拼接工作看作是在做拼圖游戲。NGS獲得的讀長都很短,就好象把一幅圖打成非常小的碎片,然后做拼圖。由于碎片太小,因此許多碎片看起來都差不多,這樣要拼出一副完整的圖難度很大。PacBio RS目前可以獲得1300bp的平均讀長,明年初隨著試劑升級,平均讀長可提升至2500-3000bp,這就相當于同樣的一幅圖,用大的碎片來做拼圖,由于大碎片比小碎片的識別度要高,因此完成拼圖的難度就可以大幅降低。

        同NGS通常100-150bp的讀長相比,PacBio RS的平均讀長提高了近20倍。試想一下,同樣大小的一幅拼圖,10,000片的還是500片的更好拼?

        另外,隨著讀長的增加,拼接過程中所需要測序覆蓋深度也會隨之下降。

        對變異檢測來說,我們首先需要的是準確定位,如果無法準確定位,那無論原始或者一致性準確度有多高都是沒有意義的。而長讀長可以幫助研究者進行更準確的定位。

        Q:C2試劑據(jù)說能將讀長提高到2500-3000bp,這是PacBio實驗室得出的數(shù)據(jù),還是用戶數(shù)據(jù)?

        A:目前PacBio公布出來的C2試劑的參數(shù)是,在Long模式下,平均讀長可達到2500bp,95%ile讀長可達到6500bp,在X-Long模式下,平均讀長可達到3000bp,95%ile讀長可達到8500bp。C2試劑明年Q1將實現(xiàn)大規(guī)模的商品化供應,目前部分實驗室已經(jīng)率先在使用。例如:

        C2試劑第一次被使用是在德國大腸桿菌疫情研究中,研究人員通過將不同測序模式混合使用,最終獲得了2900bp的平均讀長以及99.998%的一致性準確度。這項研究的結(jié)果今年七月底已經(jīng)發(fā)表在新英格蘭醫(yī)學雜志上,題為“Origins of the E. coli Strain Causing an Outbreak of Hemolytic–Uremic Syndrome in Germany”。在這項研究中,研究人員在PacBio RS平臺上通過全球合作幾天內(nèi)就完成了對從疫情中獲得的大腸桿菌樣品以及近似菌株的測序和數(shù)據(jù)分析。PacBio RS的長讀長優(yōu)勢使得只使用PacBio RS數(shù)據(jù)完成致病大腸桿菌的De Novo Assembly成為可能,而PacBio相對NGS平臺可更快獲得結(jié)果這點這對鑒定新的病原體來說也是一個極大優(yōu)勢。

        另外美國著名基因組技術服務商Expression Analysis(EA)負責研發(fā)的Pat Hurban在今年9月底一次網(wǎng)絡會議中展示了其最新獲得的PacBio數(shù)據(jù):他們將大腸桿菌基因組DNA分別處理成2kb和6kb的片段,其中2kb的模板只用C1試劑進行了測序,6kb的模板則分別用C1和C2試劑進行了測序。Hurban發(fā)現(xiàn)使用C2試劑后,獲得了2715bp的平均讀長,最長的讀長甚至達到了13091bp(可能有用戶會問,插入片段大小只有6kb,怎么會產(chǎn)生將近13kb的讀長?這是由于在PacBio平臺上,樣本制備完成后會形成環(huán)形的而非線性的模板結(jié)構,因此如果影片持續(xù)拍攝,當完成插入片段從一端到另一端的讀取后,會跨過接頭,繼續(xù)讀取其反義鏈的序列,因此這里最長讀長超過了插入片段的長度),EA對使用C2試劑獲得的結(jié)果非常滿意。

        關于準確性

        Q:PacBio RS的準確性究竟如何?PacBio 工作原理和C2試劑的技術文章在生物通發(fā)布后,多位讀者在評語、留言和郵件中都不約而同的提到了一篇留美中國學者的博文,提及在今年4月他個人在美國實驗室試用PacBio樣機的感受,原文這么說“首先,Library 和SMRTBell的準備快速而簡單(生物通注:SMRTBell is the name of the prepared template DNA. SMRTBell的制備實際就是PacBio文庫制備過程的一部分)。測序時間確實很短。其次,合成的DNA鏈長度可以達到3kb,確實比目前所有的高通測序儀都高。最致命的是誤差問題。結(jié)論是單次測序錯誤率15%, 循環(huán)測序誤差8%左右,儀器目前的性能很令人失望。我自己寫了個程序來做序列對比,能把誤差降到3%左右,相比起其454來,還是有很大的差距。PacBio目前還不足以投放市場。他們的軟件部分實在是需要改進。”您會怎么回應?

        A:首先,在PacBio RS之前,沒有任何一臺測序儀能夠提供單分子的準確度數(shù)據(jù)。在NGS平臺上,由于硬件的限制,其所檢測到的信號是基于成百上千甚至更多分子,無法檢測到單分子的信號。NGS平臺給出的準確度是將這成百上千甚至更多分子獲得的信號的平均值同reference sequence比對后獲得的結(jié)果,也即一致性準確度。PacBio RS在測序歷史上第一次給出了“單分子的測序準確度”數(shù)據(jù),這是把單個模板分子的原始測序結(jié)果(標準測序模式)同reference sequence比對獲得的數(shù)據(jù),目前單分子的原始測序準確度在85~92%,平均值為87%。由于PacBio的單分子測序反應是在ZMW中進行,而每個SMRT cell含有15W個ZMW,因此當我們把N個ZMW中的單分子測序數(shù)據(jù)也做個平均,之后再同reference sequence比較,則PacBio的準確率也會大幅上升。另外,在NGS平臺上,文庫制備時必須要先進行PCR擴增,PCR過程中的bias或者mismatch等將無法在測序時修正,也就意味著這些錯誤會變成系統(tǒng)誤差,且無法通過增加測序覆蓋深度來消除。PacBio平臺上,文庫制備時無需PCR擴增,因此避免了PCR產(chǎn)生的bias等。由于PacBio上產(chǎn)生的錯誤是隨機錯誤,且錯誤率并不隨著讀長增加而升高。因此其一致性準確度可隨著測序覆蓋深度的增加而提高。當測序覆蓋深度達到30×時,PacBio的一致性準確度可以達到99.999%。

        其次,PacBio的環(huán)形比對測序模式(CCS)可以幫助用戶獲得高準確度的單分子測序數(shù)據(jù),由于我們可以對每一個單分子模板都進行評估,且無需通過PCR擴增,這對于突變檢測(例如稀有SNP的檢測)來說非常重要。已有實驗數(shù)據(jù)表明PacBio可檢測到低至1/100的突變。在突變檢測中,現(xiàn)階段我們建議的插入片段大小在250-500bp,以500bp的插入片段為例,當使用環(huán)形比對測序模式,單分子的測序準確度可以達到99%@ 5×CCS。C2試劑已經(jīng)可以使平均讀長提高到2500bp,最長的讀長甚至可超過10,000bp。考慮到后續(xù)PacBio還將通過對試劑的持續(xù)優(yōu)化,不斷提高其讀長。因此對突變檢測來說,未來可研究的插入片段長度將越來越長。

        Q:單分子單次測序產(chǎn)生錯誤的原理是什么?是長讀長的錯誤累計結(jié)果還是機器原因?87%這個單分子原始測序平均準確度數(shù)字,在將來序列讀長再次翻番時是否也會隨之降低?那怎么辦?再次提高測序覆蓋深度嗎?

        A:PacBio平臺上目前的錯誤主要是插入和缺失,只有大概1%是substitution。缺失錯誤源自于有時候堿基摻入速度過快,超過了PacBio相機的拍攝幀數(shù)。插入錯誤源自于有的時候酶隨機的選擇一些堿基,但并未將這些堿基真的摻入合成鏈中。由于這些錯誤是隨機的,因而可以隨著測序覆蓋深度的增加而消除。因此,盡管PacBio的單分子單次讀取的原始準確度并不非常高,但隨著測序覆蓋深度的增加,它可以獲得比NGS平臺更高的一致性準確度。

        PacBio的錯誤是隨機錯誤,并不會隨著讀長的增加而提高,因此,當讀長翻番時,錯誤率并不會隨之提高。未來隨著試劑的不斷優(yōu)化,單分子測序的原始準確度也會逐步提高,且每個SMRT cell可獲得的數(shù)據(jù)量也會進一步提高。

        關于速度和運行通量

        Q:PacBio RS的測序速度有多快?樣品制備需要多久?一次測序運行需要多長時間?一次運行最多能得到多少Gb可定位數(shù)據(jù)?運行通量能有多大?

        A:目前PacBio上所使用的DNA聚合酶的合成速度大概是1-3個堿基/秒,由于在該平臺上,聚合酶合成的過程就是序列解讀的過程,這意味著測序速度每分鐘可超過100個堿基。

        從樣品制備到獲得堿基序列的全部流程可在1天內(nèi)完成。

        如果使用C2試劑,每個SMRT cell可以獲得90M 的可定位數(shù)據(jù)(mappable data)。現(xiàn)階段每天最多可運行12個SMRT cell,因此每天可獲得的數(shù)據(jù)是12×90=1080Mb mappable data。

        Q:PacBio平臺每天可獲得的數(shù)據(jù)量目前來看與大型NGS平臺(例如HiSeq2000每天可獲得55Gb數(shù)據(jù))相比還小得多,PacBio“每天最多運行12個SMRT cell”這個界限幾時能翻番?每個SMRT cell最大讀取數(shù)還能繼續(xù)提高嗎?平臺未來的擴展性如何?有的NGS平臺強調(diào)只需升級試劑部分即可實現(xiàn)讀長翻番或者測序通量翻番,PacBio未來將從哪些方面擴展其性能呢?

        A:現(xiàn)階段PacBio平臺和NGS平臺更多的是一種互為補充的關系,NGS可以獲得更多的數(shù)據(jù)量,而PacBio可以獲得更多的信息量。接下來的發(fā)展計劃中,PacBio將通過對試劑以及軟件的持續(xù)開發(fā)和優(yōu)化,進一步提升讀長,增加每個SMRT cell的數(shù)據(jù)產(chǎn)出量,并且會對DNA堿基修飾(例如DNA甲基化等)分析以及RNA直接測序等提供更多的支持(例如提供配套試劑盒和相應分析軟件等)。

        關于價格和市場

        Q: 這是個敏感問題!精明的用戶肯定會關心性價比。特別是后續(xù)運行費用,往往是決定采購的一個關鍵因素。PacBio RS每次運行費用大概多少?

        A: PacBio的后續(xù)消耗品主要包含試劑和耗材兩部分。試劑有3種:模板制備試劑盒,結(jié)合試劑盒以及測序試劑盒,耗材就是SMRT cell。具體的費用取決于樣本數(shù)、所要研究的基因片段的大小、測序方案的選擇、測序模式等,很難一概而論。詳細情況可以聯(lián)系基因有限公司咨詢。

        你說的性價比,研究者更加關注的是從樣品開始到可發(fā)表的最終結(jié)果——你不能只看單價,或者單次運行的成本——因為不是運行結(jié)束,軟件自動出來的結(jié)果就可以打印發(fā)表。如果考慮到長讀取的優(yōu)勢和在數(shù)據(jù)拼接上能節(jié)省的時間和費用,就這一點而言,PacBio RS有其他方法不可比擬的優(yōu)勢。關鍵是它是否能滿足你的需要,幫助你快人一步達到目標。

        Q:已成三國鼎立之勢的測序市場,PacBio RS加入戰(zhàn)局究竟會扮演什么樣的角色?能否秒殺NGS出局呢?

        A:這取決用戶的具體應用。以基因組拼接為例,對于基因組較大的物種,例如植物,現(xiàn)階段PacBio平臺和NGS平臺是一種互為補充的關系,NGS可以獲得更多的數(shù)據(jù)量,而PacBio可以獲得更多的信息量(例如NGS平臺很難獲得的高GC含量區(qū)域的信息等)。通過PacBio RS的配套分析軟件,我們可以實現(xiàn)同NGS數(shù)據(jù)(兼容三大NGS平臺)的混合拼接,從而大幅提高Genome Finishing的速度。對于基因組較小的物種,例如微生物和病毒等,則可以僅通過PacBio RS,獨立完成De Novo Assembly。

        Q:PacBio RS除了在De Novo Assembly、突變檢測等領域有優(yōu)勢,還在其他哪些方面有更多應用?

        A: PacBio RS可以對高GC含量區(qū)域測序,例如美國UC Davis醫(yī)學院利用單分子實時測序技術,對脆性X染色體綜合征的關鍵基因FMR1中的CGG三核苷酸重復區(qū)域進行了測序,并在第15屆脆性X和早發(fā)性認知缺損國際研討會上公布研究成果。在所有人的X染色體上都有一段CGG三核苷酸重復序列,正常人的CGG重復次數(shù)為5-44次。過長的重復次數(shù)會對FRM1基因轉(zhuǎn)錄或翻譯出FRM1蛋白不利,當重復次數(shù)超過200次時,就會導致脆性X綜合征。所以檢測CGG的重復次數(shù)非常有意義。一般CGG重復在200次以上,被認為是具有臨床意義的,但這個長度不管對于Sanger法測序或者新一代測序來說,都是很困難的,而PacBio則很好的解決了這個問題,利用環(huán)形比對測序模式,UC Davis醫(yī)學院獲得了超過10kb的原始讀長,覆蓋了CGG重復超過750次的三核苷酸重復區(qū)域。

        另外一個例子。甲基化研究如今開展得如火如荼。除了人們熟知的5-mC,另一種修飾方式——5-mC的羥基化形式5-hmC也引起人們注意。但現(xiàn)有的測序方法如亞硫酸氫鹽測序,無法區(qū)分5-mC和5-hmC。若想深入了解5-hmC的生物學功能,必須開發(fā)出一種靈敏的測序方法,以揭示它在基因組中的位置。美國芝加哥大學利用第三代單分子SMRT測序技術和5-hmC的選擇性化學標記方法來高通量檢測5-hmC。通過聚合酶動力學帶來的寶貴信息,研究人員可直接檢測DNA甲基化,包括N6-甲基腺嘌呤、5-mC和5-hmC。(詳細閱讀:單分子測序靈敏檢測5-hmC, http://m.lsnkyy.cc/newsf/2011-11/20111123171704271.htm

        PacBio RS還可對連續(xù)的A或者T區(qū)域測序,有研究者曾成功的對含有poly A的序列(含111個連續(xù)的A)測序。PacBio可以獲得動力學信息,因此可以用于研究DNA甲基化等DNA堿基修飾情況。

        另外,由于PacBio從樣本制備到獲得序列信息所需時間非常短(<1天),在具有時效性的病原微生物鑒定中(例如生物反恐、流行病爆發(fā)監(jiān)控等)也非常有優(yōu)勢。(詳細閱讀:利用基因組學來對付疾病爆發(fā) http://m.lsnkyy.cc/newsf/2011-11/20111123170930924.htm

        其他的應用文獻,歡迎聯(lián)系PacBio獨家代理商基因有限公司索取。點擊索取資料

        至此,我們對PacBio第三代單分子測序技術有了更深入的了解。令人期待的技術,更令人期待的是PacBio能更快的升級,盡快將測序成本降低——如他們自己所預測的:到2013年,個人基因組的測序能在15分鐘內(nèi)完成,費用低于1000美元,人人都可以消費得起。。。。。。(訪問結(jié)束,感謝基因有限公司提供的協(xié)助)

        后繼:另外一個感受,今后的科學研究,除了依靠思維創(chuàng)新,某種程度上拼的就是裝備了。。。裝備好,用得好(這個還得靠研究人的想法啦),出成果快,文章多,影響力大——面包(經(jīng)費)就會有的,一切都會有的。。。(循環(huán)N次放大,一如PCR)。

        訂閱生物通快訊

        訂閱快訊:

        最新文章

        限時促銷

        會展信息

        關注訂閱號/掌握最新資訊

        今日動態(tài) | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

        版權所有 生物通

        Copyright© eBiotrade.com, All Rights Reserved

        聯(lián)系信箱:

        粵ICP備09063491號