- 首頁(yè) 今日動(dòng)態(tài) 人才市場(chǎng) 新技術(shù)專欄 中國(guó)科學(xué)人 云展臺(tái) 云講堂直播 會(huì)展中心 特價(jià)專欄 技術(shù)快訊 免費(fèi)試用

-
生物通官微
陪你抓住生命科技
跳動(dòng)的脈搏
讓代謝組學(xué)的數(shù)據(jù)分析不再抓狂
【字體: 大 中 小 】 時(shí)間:2014年07月14日 來(lái)源:生物通
編輯推薦:
與其他的組學(xué)學(xué)科相似,代謝組學(xué)的數(shù)據(jù)收集是個(gè)問(wèn)題,但肯定不是研究人員面對(duì)的最大問(wèn)題。大多數(shù)人都同意,更大的問(wèn)題是弄清楚代謝組學(xué)數(shù)據(jù)集到底意味著什么。幸運(yùn)的是,不斷出現(xiàn)的分析工具正在幫助打破這個(gè)瓶頸。
研究人員逐漸懂得,如果你真的想要了解細(xì)胞行為,你需要研究代謝物。基因編碼蛋白質(zhì),而蛋白質(zhì)作用于小分子。這些分子的存在和豐度,被統(tǒng)稱為代謝組(metabolome),反映和影響了健康、營(yíng)養(yǎng)、免疫系統(tǒng)等。
與其他的組學(xué)學(xué)科相似,代謝組學(xué)的數(shù)據(jù)收集是個(gè)問(wèn)題,但肯定不是研究人員面對(duì)的最大問(wèn)題。大多數(shù)人都同意,更大的問(wèn)題是弄清楚代謝組學(xué)數(shù)據(jù)集到底意味著什么。“數(shù)據(jù)分析仍是個(gè)巨大的瓶頸,”賽默飛世爾代謝組學(xué)的市場(chǎng)部經(jīng)理Yingying Huang說(shuō)。
幸運(yùn)的是,不斷出現(xiàn)的分析工具正在幫助打破這個(gè)瓶頸。
光譜圖庫(kù)
代謝組學(xué)的數(shù)據(jù)分析主要分為兩個(gè)部分:峰值檢出(peak picking)和峰值鑒定(peak identification)。峰值檢出是利用代表不同條件(如健康和患病)的多個(gè)數(shù)據(jù)庫(kù)進(jìn)行篩選的過(guò)程,并鑒定出它們之間不同的光譜特征。在這些峰被發(fā)現(xiàn)之后,它們所代表的化合物必須被鑒定。
多個(gè)軟件包可處理第一個(gè)問(wèn)題,包括商業(yè)化工具(如安捷倫的MassHunter Profinder,布魯克的ProfileAnalysis,賽默飛世爾的SIEVE™和Waters的Progenesis QI)以及免費(fèi)工具(MZmine和XCMS Online)。而一些圖庫(kù)正在開(kāi)發(fā)或已被開(kāi)發(fā)出,以解決第二個(gè)問(wèn)題。
斯克里普斯研究所(Scripps Research Institute)代謝組學(xué)和質(zhì)譜中心的主任Gary Siuzdak談到,他的METLIN數(shù)據(jù)庫(kù)目前列出了240,000種化合物,其中11,600種有MS/MS光譜數(shù)據(jù)。而人類代謝組數(shù)據(jù)庫(kù)(HMDB)有近42,000種化合物,其中1,164種有MS和MS/MS數(shù)據(jù)。此外還有其他選擇,包括ChemSpider和MassBank。
當(dāng)然,我們不可能收集每個(gè)代謝產(chǎn)物的實(shí)驗(yàn)數(shù)據(jù),加州大學(xué)戴維斯分校的Oliver Fiehn認(rèn)為。目前有太多的代謝產(chǎn)物,而并非全部都有純化形式作為標(biāo)準(zhǔn)品。“在某些時(shí)候,你必須預(yù)測(cè)MS/MS圖譜會(huì)怎么樣,”他說(shuō)。
Fiehn解決這個(gè)問(wèn)題的工具是LipidBlast,它包含200,000個(gè)預(yù)測(cè)的脂類光譜。“這很難[做到],”Fiehn承認(rèn),因?yàn)榕c肽段不同,代謝物有各種形狀、形式和大小。有了LipidBlast,用戶能夠?qū)⑺鼈兾粗膱D譜與圖庫(kù)進(jìn)行比較,看看是否有hit,就像DNA研究人員利用BLAST將基因序列與GenBank比較。賽默飛世爾也有個(gè)類似的工具,叫LipidSearch™。
阿爾伯塔大學(xué)(University of Alberta)的化學(xué)教授Liang Li最近推出了一個(gè)類似的項(xiàng)目,MyCompoundID.org,以擴(kuò)展HMDB的用途。MyCompoundID的建立是從HMDB中抽取8,000種代謝物,并計(jì)算它們的質(zhì)量以及經(jīng)歷76種可能的生物轉(zhuǎn)化(如磷酸化、甲基化或D-核糖基化)后的預(yù)測(cè)光譜特征。這些結(jié)果將幫助研究人員縮小未知光譜特征的可能身份。
SWATH采集
代謝組學(xué)研究可能是靶向,也可能是非靶向的。對(duì)于前者,研究人員設(shè)定他們的儀器(通常是三重四級(jí)桿質(zhì)譜儀)來(lái)掃描特定的代謝物。而對(duì)于后者,儀器掃描特定質(zhì)量范圍內(nèi)的一切,但只收集高豐度離子的MS/MS碎片數(shù)據(jù)。
這種所謂的數(shù)據(jù)依賴的流程是為方便起見(jiàn)而設(shè)計(jì)的。不過(guò)Fiehn認(rèn)為,它不盡如人意,有時(shí)研究人員發(fā)現(xiàn)樣品之間的特定離子變化明顯,但沒(méi)有被碎裂,因?yàn)樗堑拓S度的。
最近,蘇黎世聯(lián)邦理工學(xué)院的Ruedi Aebersold介紹了這個(gè)問(wèn)題的解決方案1,它已被AB SCIEX商業(yè)化。這種被稱為SWATH™ MS的策略避開(kāi)了數(shù)據(jù)依賴處理,而支持?jǐn)?shù)據(jù)非依賴的處理,即所有進(jìn)入質(zhì)譜儀的離子都被碎裂和分析。它逐步分析用戶定義的分離窗口,重復(fù),并通過(guò)計(jì)算整理出產(chǎn)生的碎片,從而覆蓋很寬的質(zhì)量范圍。
2013年,華盛頓大學(xué)的化學(xué)家Gary Patti利用安捷倫的6520 Q-TOF質(zhì)譜儀和定制的R package,在代謝物上應(yīng)用了一種類似的方法2。據(jù)AB SCIEX的高級(jí)營(yíng)銷經(jīng)理Fadi Abdi介紹,AB SCIEX如今正將SWATH技術(shù)應(yīng)用在蛋白質(zhì)組學(xué)上。
用戶在TripleTOF®質(zhì)譜儀上收集高速的光譜數(shù)據(jù),并利用MS/MS光譜圖庫(kù)來(lái)解釋它,這與蛋白質(zhì)組學(xué)的方法相似。“在數(shù)據(jù)依賴的分析中,如果您沒(méi)有觸發(fā)您的分子,則無(wú)法識(shí)別它,”Abdi談道。“SWATH允許您收集樣品中所有可檢測(cè)種類的數(shù)據(jù),帶來(lái)更為全面的定量覆蓋。”
通路分析
在研究人員鑒定出有趣的代謝物后,他們需要找出它們?cè)谏锵到y(tǒng)中的作用。這時(shí)就需要通路分析的工具。通路分析讓研究人員能夠?qū)⒋x物定位到已知的生化通路上,為可能的遺傳角色及其他代謝物提供線索。
Fiehn的實(shí)驗(yàn)室寫(xiě)了一個(gè)通路分析的工具,名為MetaMapp,而大部分商業(yè)化的代謝組學(xué)數(shù)據(jù)分析包也包含通路分析。賽默飛世爾的SIEVE數(shù)據(jù)分析包中就有這樣的模塊,它關(guān)聯(lián)到KEGG通路數(shù)據(jù)庫(kù),而B(niǎo)ruker Daltonics也即將推出它的Compass PathwayScreener工具。
不過(guò),Metabolon(北卡羅來(lái)納州的一家代謝組學(xué)服務(wù)供應(yīng)商)的首席科學(xué)家Mike Milburn認(rèn)為,僅僅將代謝物定位到已知的通路商,還不足以看清整幅圖像。Metabolon已經(jīng)完成了約3000項(xiàng)代謝組學(xué)研究,每年開(kāi)展600-700項(xiàng),半數(shù)是科研客戶。這些經(jīng)驗(yàn)使得他們能夠看到其他研究人員難以獲得的代謝鳥(niǎo)瞰圖。
對(duì)許多研究人員而言,開(kāi)始代謝組學(xué)流程所需的技能、專長(zhǎng)和費(fèi)用使得外包給Metabolon這樣的公司更為常見(jiàn)。但是那些愿意自己承擔(dān)重任的研究人員也會(huì)發(fā)現(xiàn),他們并不缺少計(jì)算上的工具。
無(wú)論采用哪種方式,Bruker Daltonics代謝組學(xué)的市場(chǎng)部經(jīng)理Aiko Barsch說(shuō),“我會(huì)鼓勵(lì)新客戶進(jìn)入代謝組學(xué),因?yàn)槟莾喊四敲炊嗟男畔ⅰS心敲炊嘈聳|西有待發(fā)現(xiàn)。”
(作者:Jeffrey M. Perkel/生物通編譯)
參考文獻(xiàn)
[1] Gillet, LC, et al., “Targeted data extraction of the MS/MS spectra generated by data independent acquisition: A new concept for consistent and accurate proteome analysis,” Mol Cell Proteomics, 11:O111.016717, 2012. [PubMed ID: 22261725]
[2] Nikolskiy, I, et al., “An untargeted metabolomics workflow to improve structural characterization of metabolites,” Anal Chem, 85:7713-9, 2013. [PubMed ID: 23829391]
今日動(dòng)態(tài) | 人才市場(chǎng) | 新技術(shù)專欄 | 中國(guó)科學(xué)人 | 云展臺(tái) | BioHot | 云講堂直播 | 會(huì)展中心 | 特價(jià)專欄 | 技術(shù)快訊 | 免費(fèi)試用
版權(quán)所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯(lián)系信箱:
粵ICP備09063491號(hào)