
-
生物通官微
陪你抓住生命科技
跳動的脈搏
暨南大學張弓教授:制定蛋白質組“開放式搜索”質控標準
【字體: 大 中 小 】 時間:2018年10月22日 來源:生物通
編輯推薦:
生物質譜具有高通量、高靈敏度的分析特點,是蛋白質組學研究的核心技術之一。基于數據庫搜索的肽段質譜圖譜鑒定方法是目前最有效和最廣泛使用的蛋白質鑒定方法,然而僅有25%的圖譜能被該方法識別。
生物通報道:生物質譜具有高通量、高靈敏度的分析特點,是蛋白質組學研究的核心技術之一。基于數據庫搜索的肽段質譜圖譜鑒定方法是目前最有效和最廣泛使用的蛋白質鑒定方法,然而僅有25%的圖譜能被該方法識別。這些被丟棄的圖譜中除低質量圖譜外,還包含了大量因翻譯后修飾和單氨基酸突變(Single Amino acid Variations,SAV)導致的質量偏移圖譜,這不但嚴重影響數據整體解析率還丟失了許多重要蛋白質信息。為此,人們采用非限制性搜庫策略的開放式搜索方法(Open search),在母離子質量高容差設定下鑒定常規方法難以發現的修飾和SAV事件,圖譜利用率能達到50%以上,超過一般搜庫方法的兩倍有余。
雖然目前已有大量開放性搜索工具被開發,但開放式搜索卻并沒有得到廣泛使用。其中一個非常重要的原因是沒有一個準確的FDR評價體系對開放式搜索進行有效評估,導致開放式搜索出來的結果不知道是否可信。由于開放式搜索中的修飾和SAV事件是不可預知的,因此傳統的FDR評估方法失效。蛋白質組學界一直沒能拿出一個有效的FDR評估方法,開放式搜索也就沒多少人敢用。
暨南大學張弓課題組利用其在翻譯組方面的絕對優勢一舉解決了這個困擾學界多年的問題。在穩態細胞中,翻譯組測序(RNC-seq)可以測定所有正在翻譯的mRNA,RNC-seq數據因與蛋白質組數據具有良好的對應關系,可作為蛋白質組的獨立參考數據集,被人類蛋白質組組織(Human Proteome Organization,HUPO)認定為人類蛋白質組計劃(Human Proteome Project,HPP)的核心支柱之一。運用翻譯組數據對蛋白組數據進行質控最先應用在該研究團隊2017年的多算法結果整合策略中,可在提高蛋白質的檢測數目的同時保證鑒定可靠度。(零成本大幅提高蛋白質組鑒定能力?暨大研發另類質譜鑒定算法策略)
在本研究中,作者使用穩態細胞翻譯組數據作為“標準答案”來評價開放式搜索蛋白質鑒定結果,質譜搜庫結果中沒有翻譯證據的蛋白被認為是假陽性蛋白,屬于“可疑鑒定”(Suspicious Identifications,SI),而利用SI和有翻譯證據的蛋白質(Translation-supported Identifications,TI)則可計算可疑鑒定率(Suspicious Discovery Rate,SDR),以此來反映蛋白質的潛在錯誤鑒定率。
研究者發現,開放式搜索結果的SDR可達限制性搜索的兩倍甚至更多,強調開放性搜索若不進行有效質量控制難以保證鑒定結果可靠性,而將肽段FDR嚴格控制在0.001以下,則可控制SDR與限制性搜庫一樣水平。對比開放式搜索不同參數設置下的結果,發現FDR控制是開放式搜索質控最重要的影響因素,而質量容差值、可變修飾、酶切方式和色譜分離條件并不是影響SDR的主要因素。
有了質控標準,開放式搜索的結果可靠性就有了保證,就可以在在蛋白質修飾和SAV檢測中展現獨特優勢。測試結果表明,開放式搜索即便在未預設修飾類型下亦可在磷酸化質譜數據中集鑒定大量磷酸化修飾肽段和蛋白質。不僅如此,使用開放式搜索策略分析兩株肝癌細胞質譜數據,鑒定到27個COSMIC未收錄的SAV,其中的兩個SAV被認為可能會引起與癌癥相關的蛋白質結構和功能的改變。這些結果均預示著開放式搜索在鑒定未知修飾和SAV的巨大潛力。
該研究首次將翻譯組數據應用于開放式搜索策略的質控評估中,有效挖掘質譜數據中的“暗物質”,為蛋白質組開放式搜索策略制定了簡便易行的質控標準。
作者簡介:

暨南大學翻譯組學實驗室的負責人張弓教授,翻譯組學領域的建立者,其成果被選入國家統編教材。目前,張弓教授是中國生化與分子生物學學會蛋白質組學專業委員會(CNHUPO)理事,中國分子系統生物學專業委員會委員,國家優秀青年基金獲得者,國家863青年科學家,國家****“青年拔尖人才”,深圳市龍華區第一屆政協常委。
原文標題:
Li D, Lu S, Liu W, Zhao X, Mai Z, Zhang G *.
Optimal settings of mass spectrometry open search strategy for higher confidence
Journal of Proteome Research (2018) in press.