《Communications Medicine》:Metabolomic sweet spot clock predicts mortality and age-related diseases in the Canadian Longitudinal Study on Aging
編輯推薦:
本研究針對傳統生物年齡標志物線性假設強、可解釋性差等局限,開發了基于代謝物最優水平("甜點")的非線性代謝組學時鐘。通過對加拿大老齡化縱向研究(CLSA)隊列的178種健康相關代謝物進行分析,發現基于偏離最優值的距離轉換能顯著提升死亡率預測效能(HR=1.08, p=5.8×10-12),并在85歲以上高齡隊列中得到驗證,為理解衰老異質性提供了可解釋的生物標志物。
當我們談論年齡時,通常指的是從出生開始計算的時間跨度——也就是 chronological age(時序年齡)。但生活中我們常會遇到這樣的現象:兩位相同時序年齡的老年人,一位可能精神矍鑠、行動自如,另一位卻可能多種慢性病纏身,健康狀況截然不同。這種個體在衰老過程中表現出的巨大差異,被稱為 aging heterogeneity(衰老異質性)。時序年齡無法準確反映個體真實的生理功能狀態和健康程度,這促使科學家們尋找能夠更準確衡量人體生物學衰老程度的指標——biological age(生物年齡)。
近年來,隨著各種組學技術的發展,表觀遺傳時鐘、蛋白質組時鐘、代謝組時鐘等多種生物年齡預測模型相繼出現。其中,metabolomics(代謝組學)因其能夠反映機體實時代謝狀態,整合遺傳、環境、生活方式等多種因素影響,而顯示出獨特優勢。代謝物作為生命活動的終末產物,如同身體生理狀態的"實時快照",理論上應該能提供關于生物年齡的靈敏指標。
然而,現有的代謝組學生物標志物面臨幾個關鍵挑戰。許多模型假設代謝物水平與年齡或健康結局之間存在簡單的線性關系,但越來越多的證據表明,許多生物標志物與健康的關系可能是非線性的,存在optimal levels(最優水平)或"sweet spots(甜點)"。例如,某種代謝物過高或過低都可能預示著健康問題。此外,傳統模型通常使用原始代謝物水平,且往往包含大量與健康關聯不明確的代謝物,導致模型可解釋性差,也限制了其臨床轉化潛力。
為了解決這些問題,由Olga Vishnyakova、Joosung Min、Stephen Leach等研究人員組成的團隊在《Communications Medicine》上發表了他們的最新研究成果。他們利用Canadian Longitudinal Study on Aging(CLSA,加拿大老齡化縱向研究)隊列的大規模untargeted metabolomic profiling(非靶向代謝組學分析)數據,開發了一種名為"Sweet Spot Clock(甜點時鐘)"的新型代謝組學生物年齡標志物。該研究的創新之處在于:首先通過variance heterogeneity(方差異質性)分析篩選與健康相關的代謝物;然后利用piecewise regression(分段回歸)識別代謝物的最優水平;最后基于偏離這些最優值的距離構建預測模型。
研究人員采用了幾項關鍵技術方法:從CLSA隊列的9,061名45-85歲參與者中獲取血漿樣本進行非靶向代謝組學分析;通過方差異質性檢驗(Brown-Forsythe檢驗)篩選健康相關代謝物;使用分段回歸確定代謝物最優水平;構建以Frailty Index(衰弱指數)為訓練目標的ElasticNet回歸模型;并在Super Seniors Study(超級老年人研究)隊列中進行獨立驗證。
健康相關代謝物的識別與特征分析
研究團隊首先使用五種健康評估工具對參與者健康狀態進行量化,包括Frailty Index(FI,衰弱指數)、五種主要疾病(癌癥、心血管疾病、慢性肺病、癡呆和糖尿病)數量、其他慢性病數量、認知功能和身體功能。基于"最健康個體代謝物水平方差較低"的假設,他們通過方差異質性分析發現,在888種內源性代謝物中,有178種(20%)至少在一種健康工具和性別中顯示出顯著的方差差異。
這些健康相關代謝物中,氨基酸、碳水化合物和脂質超通路包含最多顯著異方差的代謝物。其中,N6,N6,N6-三甲基賴氨酸(TML)、葡萄糖和1-硬脂酰-2-亞油酰-GPI(18:0/18:2)分別代表了各超通路中方差差異最顯著的標志物。通路富集分析顯示,雄激素類固醇亞通路具有最顯著富集(FDR調整p值=6.8×10-7)。
代謝物最優水平的確定與特征
研究人員采用分段回歸分析,在178種健康相關代謝物中成功為74種(42%)確定了最優水平(甜點)。這些最優水平在男女性別間存在差異,僅12種代謝物的95%置信區間在性別間重疊。重要的是,55%的代謝物最優水平置信區間不包含零(即偏離群體均值),表明普通老年人群的平均代謝物水平并非最優狀態。
例如,在女性中,古洛糖酸酯(gulonate)顯示出最顯著的效果變化(斷點估計=-0.02,斜率=[-0.01,0.04],p=1.7×10-34);而在男性中,N6,N6,N6-三甲基賴氨酸的變化最為顯著(斷點估計=-0.31,斜率=[-0.11,0.01],p=1.7×10-34)。相關性分析發現,羥基天冬酰胺(hydroxyasparagine)和硫酸脫氫表雄酮(DHEA-S)與年齡的相關性最強。
甜點時鐘的構建與性能驗證
研究團隊構建了四種不同的代謝組學時鐘進行比較:Sweet Spot Clock(以FI為目標,使用甜點距離轉換)、Baseline模型(以年齡為目標,使用原始代謝物水平)、ControlAge(以年齡為目標,使用甜點距離轉換)和ControlMb(以FI為目標,使用原始代謝物水平)。
在測試集中,Sweet Spot Clock顯示出與全因死亡率的最強關聯(HR=1.08,p=5.8×10-12,C-index=0.841),性能優于其他模型。進一步分析表明,以FI為訓練目標和使用甜點距離轉換均對性能提升有貢獻。該生物標志物還與多種年齡相關疾病的發病風險顯著相關,包括糖尿病(HR=1.05,p=8.9×10-14)、慢性阻塞性肺疾病(HR=1.05,p=3.1×10-7)、卒中(HR=1.07,p=2.1×10-4)和腎臟疾病(HR=1.05,p=0.02)。
代謝組年齡偏差的關聯分析
全基因組關聯分析(GWAS)發現,代謝組年齡偏差(MAD)的SNP遺傳力為0.23(SE=0.01),并在1號染色體1p36.32區域發現一個顯著位點(rs11809159)。關聯分析顯示,MAD與多種炎癥標志物(如高敏C反應蛋白、腫瘤壞死因子-α、白細胞介素-6)、心理困擾、BMI、糖化血紅蛋白等顯著相關。社會經濟變量方面,較低的家庭收入和教育程度與較高的MAD相關。
與現有表觀遺傳時鐘的比較發現,MAD與DNAm GrimAge時鐘呈中等相關(r2=0.38),而與Hannum時鐘、Horvath泛組織時鐘和DNAm PhenoAge的相關性較弱。在同時包含代謝組和表觀遺傳數據的子集中,結合MAD和GrimAge v2的多組學模型顯示出最高的預測性能(C-index=0.806)。
獨立隊列驗證與泛化性評估
在Super Seniors Study獨立隊列(667名85歲以上參與者)中,Sweet Spot Clock無需重新訓練即顯示出良好的泛化能力。超級老年人(無重大慢性病史)的MAD顯著低于年齡匹配的對照組(-0.4歲 vs 1.1歲)。MAD與超級老年人表型(OR=1.16,p=2.8×10-6)和死亡率(HR=1.08,p=3.3×10-5)均顯著相關。
然而,在CLSA的亞洲和黑人 ancestry(祖源)亞組中,由于樣本量較小和死亡事件稀少,未能驗證MAD與死亡率的顯著關聯,提示未來需要在更多樣化人群中進一步驗證。
研究結論與意義
該研究開發的Sweet Spot Clock通過聚焦健康相關代謝物并明確建模非線性關系,克服了現有代謝組學生物標志物的多個局限性。與訓練于時序年齡或死亡終點的傳統模型不同,該研究選擇Frailty Index這一反映多系統功能下降的中間表型作為訓練目標,更能捕捉衰老異質性的生物學本質。
研究表明,許多代謝物存在與健康相關的最優水平,且這些水平往往偏離人群平均值,提示普通人群的平均代謝狀態并非最優。通過將代謝物水平轉換為偏離最優值的距離,顯著提升了生物年齡預測的準確性。該標志物在獨立高齡隊列中的驗證成功,證明了其穩健性和泛化能力。
盡管該研究主要基于歐洲祖源人群,且采用相對定量的代謝組學數據,但提出的"甜點"概念和建模框架為生物年齡研究提供了新范式。未來研究需要在更多樣化人群和絕對定量平臺上驗證這些發現,并探索這些代謝物最優水平隨年齡動態變化的規律。
Sweet Spot Clock不僅為衰老生物學研究提供了新工具,也為未來開發針對代謝穩態的干預措施提供了潛在靶點。通過識別偏離最優代謝狀態的個體,可能為早期健康風險預警和個性化健康管理提供新策略。