《Advanced Biology》:Proteomic Signatures Over Age Reveal Significant Changes From Infancy Till Late Adulthood
ABSTRACT
生物標志物在藥物開發和診斷中具有重要作用,有助于患者選擇和疾病監測。缺乏年齡特異性蛋白質參考使得追蹤與慢性疾病或治療相關的模式變得復雜。這項探索性概念驗證研究探討了整個人類生命周期中血清蛋白質組與年齡相關的變化。使用鄰近延伸分析法,我們測量了264名健康個體的血清免疫腫瘤面板,另外109名亞組測量了另一個面板,所有個體在采血時均無重大疾病,年齡從0天到88歲不等。免疫腫瘤面板的聚類分析顯示兩個簇:簇1包括≤11天兒童的樣本,簇2包括從2個月到88歲年齡范圍的樣本。加權相關網絡分析確定了五個蛋白質模塊,其中四個顯示特定通路的富集。器官損傷面板顯示類似的與年齡相關的蛋白質變異。最后,我們確定了四種隨年齡變化的蛋白質模式:恒定、增加、減少或U形,并定義了年齡特異性正常表達范圍。總之,我們的研究結果表明,整個生命周期的健康衰老涉及蛋白質表達的改變,新生兒、兒童、成人和老年人存在不同的蛋白質譜。我們為整個生命周期中觀察到的不同蛋白質模式提供了有價值的參考數據。
1 引言
免疫系統在整個生命過程中經歷持續發育和分化,導致免疫相關蛋白水平的變化。了解衰老對免疫蛋白質組的影響對于預防疾病發病率和死亡率至關重要。值得注意的是,兒童的免疫反應與成人不同,生命早期嚴重依賴先天免疫反應。衰老過程中,通常在對病原體和共生微生物群暴露時產生穩健的免疫反應,從而降低感染易感性。然而,隨著年齡增長,免疫系統發生實質性改變,導致不同的免疫細胞亞群變化以及分泌蛋白水平變化,表明存在嚴重功能改變。這導致在最近SARS-CoV-2大流行期間,兒童更可能經歷無癥狀感染,而老年人更易發生嚴重感染。研究衰老過程中的免疫細胞及其與疾病的聯系是免疫學的一個活躍研究領域。然而,關于循環血液中蛋白質水平的信息有限,特別是在新生兒中,通常使用臍帶血作為代表,但已證明與新生兒血液不同。
“正常”衰老的特征是系統性炎癥過程增加,伴隨細胞衰老、免疫衰老、器官功能障礙和年齡相關疾病。免疫介導炎癥疾病(IMIDs)可在所有年齡發生。然而,對于各種自身免疫疾病,已識別出疾病發病率最高的年齡窗口。例如,對于乳糜瀉、炎癥性腸病和血管炎,觀察到兩個疾病發病率高峰,即在兒童期或成年早期以及晚年。這些觀察結果表明年齡特異性變化增加了發生IMIDs的可能性。因此,了解健康個體衰老過程中生物標志物的“正常”水平對于識別增強臨床護理的生物標志物至關重要。
在這項探索性概念驗證研究中,我們通過使用Olink技術測量0天至88歲健康個體血清樣本中的178種蛋白質,表征了整個生命周期健康衰老的蛋白質組特征。我們的研究結果表明,在血清中測量的蛋白質中,健康個體在整個衰老過程中存在新穎且不同的蛋白質特征。
2 方法
2.1 健康個體樣本
我們從PIENTER研究獲得了110名健康個體的樣本,其方法和研究人群已被詳細描述。這些樣本在我們的研究中被稱為“全年齡段隊列”。根據以下標準隨機選擇2017年獲得的荷蘭居民樣本,年齡1-83歲:1)無任何醫療狀況;2)無任何處方藥。對于60歲以上參與者,我們額外允許使用抗炎藥或抗病毒/抗生素藥物(但采樣前至少停藥3個月)、使用胃保護劑/抗酸劑以及經歷任何過敏或花粉熱。為探索兒童期特異性特征,我們選擇了每5歲年齡組10個樣本。對于20歲及以上成年參與者,我們包括每10歲年齡組10個樣本。為補充全年齡段隊列中小樣本量,我們采用混合抽樣方法,包括烏得勒支大學醫學中心部門內進行的臨床研究中的健康個體。
從RESCEU項目(稱為新生兒、兒童和老年人)中,選擇了N=31名新生兒、N=21名兒童和N=12名老年人的血清樣本。RESCEU聯盟進行了兩項前瞻性隊列研究以確定嬰兒和老年人RSV感染發生率。如果新生兒在隨訪期間未經歷RSV感染,則選擇出生后11天內通過毛細血管采血獲得血清樣本的個體。包括1-11個月大接受與感染無關的小手術的兒童血清樣本。RESCEU研究期間未經歷感染的老年人被納入本研究。
兒童隊列包括N=28名1-14歲健康兒童,納入DIMER研究。DIMER研究是國家原發性免疫缺陷研究的一部分。健康個體是參與DIMER研究的患者的兄弟姐妹或在威廉敏娜兒童醫院接受小手術的患者,排除了多次感染或免疫相關疾病患者。
我們還從內部健康供者計劃獲得了34份血清樣本,年齡20-71歲,在稿件中稱為中年人,經UMCU倫理委員會批準。
中年人2隊列包括N=28份血清樣本,來自年齡范圍19-68歲的常見變異型免疫缺陷病隊列。健康個體從患者家庭成員中招募。所有參與者或參與兒童法定監護人簽署知情同意書。認為自己是健康個體且在采樣時未經歷顯著免疫介導炎癥反應的個體被納入為“健康個體”。每個隊列樣本數量和年齡分布概覽見圖S1。
2.2 Olink測量
使用基于鄰近延伸測定技術的Proseek多重面板測量蛋白質濃度,由烏得勒支UMC的Olink提供商執行。選擇這些面板是因為我們旨在研究衰老過程中的炎癥蛋白、免疫調節蛋白以及調節和信號相關蛋白。所有樣本使用IO面板測量,僅全年齡段隊列樣本使用OD面板測量。簡言之,在PEA期間,一對寡核苷酸標記的抗體探針與其各自蛋白質結合,允許分子報告基因雜交。隨后使用實時PCR定量擴增子。原始定量周期值被標準化并轉換為標準化蛋白質表達單位,以log2尺度表示,其中NPX值高一個單位代表測量蛋白質濃度加倍。每個板上使用Olink標準質量控制協議進行質量控制。由于測量在幾個月內進行,我們使用內部方法“BAMBOO”進行批次效應校正,該方法使用每個板上包含的12個橋接對照。低于檢測限的測量值被LOD替換用于下游分析。
2.3 統計分析
為降低維度改善可視化并最小化噪聲,從而促進主要簇識別,使用主成分分析后進行k均值聚類使用解釋數據90%變異的PC進行。使用輪廓標準確定最佳簇數。主要驅動因素基于前兩個PC的因子載荷定義。為驗證這些簇的穩健性并可視化樣本水平蛋白質關系,隨后使用Ward距離度量進行層次聚類并表示為熱圖。通過校正錯誤發現率后的T檢驗識別簇間差異表達蛋白質。調整p值<0.05的蛋白質被認為顯著不同。使用火山圖可視化簇間所有蛋白質比較結果,其中報告倍數變化和調整p值。倍數變化低于-1或高于1且調整p值<0.05的蛋白質在火山圖上以顏色報告。
為進一步表征整個生命周期蛋白質組特征變化,我們進行了加權相關網絡分析,這是轉錄組學中常用的共表達網絡方法。該方法使用蛋白質間相關性定義網絡,蛋白質被分組為可測試與年齡和性別等特定變量相關/關聯的模塊。簡言之,基于其Pearson相關值計算所有樣本中每對蛋白質的相似性矩陣。然后,相似性矩陣轉換為鄰接矩陣,并計算拓撲重疊矩陣和相應相異性值。最后,采用動態樹切割算法檢測蛋白質共表達模塊。模塊以0.25切割高度和最小模塊大小10個蛋白質構建。我們使用有符號相關矩陣和軟閾值4。使用String-db.org以及使用KEGG和GO術語的基因集富集分析研究通路富集。
為描述不同蛋白質隨年齡變化,對數據擬合二次多項式函數,并為每個蛋白質定義最佳擬合周圍的95%置信限。
兩個Olink面板之間有6種蛋白質重疊。除PTN和NOS3外,大多數蛋白質在兩個面板間相關性高。對于最后分析,定義整個生命周期軌跡,使用免疫腫瘤面板內獲得的NPX值。
所有分析使用R進行。
3 結果
3.1 人群特征
共納入來自5個獨立隊列的264份血清樣本。每個隊列人口統計學顯示在表S1中。總計約半數樣本來自女性,5個隊列中3個男女比例均衡。兩個隊列包含顯著更多女性參與者:中年和中年2隊列分別為86.7%和71.4%。總年齡范圍0至88歲,44%樣本來自18歲以下個體,來自3個不同隊列。五個健康隊列獲得的樣本顯示年齡分布重疊和性別平衡。圖1呈現不同隊列及其各自年齡范圍,以及測量的Olink面板和 resulting 數據上執行的分析。
3.2 免疫相關蛋白定義健康個體的兩個不同簇
我們首先使用無監督方法分析IO面板92種蛋白質的蛋白質譜。主成分分析后k均值聚類顯示2個簇,其中前兩個PC解釋數據約一半變異。簇1僅包含10個月大或更年輕個體,包括所有生命最初11天內采血個體,而簇2包含2個月至88歲個體。新生兒、兒童和老年人隊列分布在2個簇之間。
然而,我們注意到全年齡段隊列似乎與其他簇分離,盡管未定義單獨簇。這種偏離的主要驅動因素是Caspase 8,與其它隊列相比始終顯示高2倍NPX值。該標志物因此顯示該特定隊列的明顯批次效應,無法校正并在下一步分析中排除。PCA中另外兩個主要驅動因素是IL8和IL1α,呈現與Caspase 8不同的表達模式。IL8水平跨年齡和隊列變化很大,盡管具有相似年齡特征個體樣本中全年齡段隊列表達水平高于其他隊列。IL1α水平在新生兒中高,在所有老年個體樣本中較低。IL1α是將簇1與簇2拉開的主要驅動因素,其次是TNFRSF9、CD40L和TIE2的遞減效應。當從數據集中移除Caspase 8時,我們可以定義與之前相同的2個簇,且全年齡段隊列與簇2中其他隊列重疊。第一個PC現在解釋數據34.5%變異,而第二個PC解釋11.3%。此外,我們觀察到從簇1到簇2的年齡梯度,從圖2D右下角到左上角,表明蛋白質表達隨年齡變化。
總之,這些數據表明健康個體血清蛋白質水平隨年齡增長表達不同,新生兒與其他個體之間觀察到的差異最大。
3.3 層次聚類揭示跨衰老的不同免疫相關特征
由于PCA圖顯示從右下角到左上角的年齡梯度,我們執行層次聚類以驗證聚類結果并可視化跨樣本的單個蛋白質表達模式。再次,我們可以定義2個展示不同蛋白質譜的簇。新生兒樣本和6歲以下兒童樣本顯示與6歲以上個體樣本不同的特征。當我們按年齡類別對樣本排序并僅創建蛋白質樹狀圖時,這也清晰可見。當我們比較兩個簇的蛋白質表達時,發現73種蛋白質顯著不同,包括與簇2相比簇1中12種顯著較低和61種顯著較高。然而,我們未發現與這些蛋白質相關的通路富集。
總體而言,無監督方法揭示了健康個體免疫相關蛋白質的不同表達模式,幼兒與年長兒童和成人之間的差異最大。
3.4 相關網絡分析定義免疫相關蛋白的多個模塊
為進一步表征整個生命周期蛋白質組特征變化,我們進行了加權相關網絡分析,一種常用的共表達網絡方法。該方法使用相關性定義網絡,蛋白質被分組為模塊。
使用92種免疫相關蛋白質鑒定出五個模塊。每個模塊由特定通路定義。五個模塊中四個與年齡相關。有趣的是,藍色模塊與年齡負相關,富集于胎盤、胎兒、女性內生殖器官和先天免疫相關蛋白質。黃色模塊富集于炎癥蛋白質,也與年齡負相關,而灰色模塊富集于T細胞功能相關蛋白質,與年齡正相關。注意該模塊中蛋白質呈現低簇內相關性,可能不代表有凝聚力的功能模塊。青綠色模塊與年齡和性別相關,但未發現該模塊特異性蛋白質富集。僅棕色模塊富集于血管發育、內皮和血小板遷移相關蛋白質,與年齡不相關。
總之,我們表明測量的92種免疫相關蛋白質可分為5個模塊,其中4個與年齡相關,4個富集于健康個體特定免疫通路。
3.5 調節和信號相關蛋白也展現跨衰老的不同表達
對于全年齡段隊列,我們還測量了OD面板的92種蛋白質,包括參與應激反應、細胞增殖調節、細胞周期和細胞死亡等生物過程的蛋白質。層次聚類顯示3個具有不同蛋白質表達特征的簇。三個簇在性別分布上無差異,但簇1以年輕個體樣本為特征,而其他兩個包括老年個體樣本。相當數量蛋白質在3個簇間顯著不同。 notably,我們發現55種蛋白質在簇1和簇2間顯著不同,68種蛋白質在簇1和簇3間顯著不同。此外,47種蛋白質在簇2和簇3間顯著不同。我們未發現這些蛋白質的富集通路。
使用WGCNA,我們探索了衰老過程中調節和信號相關蛋白質的表達。我們可以定義四個蛋白質模塊。一個模塊富集于參與對刺激和應激反應的蛋白質,與年齡負相關,另一個模塊包括富集于信號受體結合的蛋白質,與年齡和性別負相關。最后兩個模塊未呈現任何特定通路富集,但均與年齡負相關。
總體而言,我們表明調節和信號相關蛋白質在健康個體中也呈現隨年齡的不同表達模式。
3.6 衰老過程中的蛋白質表達動力學
由于我們證明了健康個體不同年齡組血清蛋白質組特征的改變,我們下一個目標是識別經歷變化的特定蛋白質,量化這些變化程度,并建立從兒童早期到老年人年齡譜的蛋白質表達“正常范圍”。該分析涉及總共178種獨特蛋白質,包括兩個面板中發現的六種蛋白質。
我們觀察到描述特定蛋白質動力學的四種不同模式:隨年齡恒定、隨年齡減少、隨年齡增加和U形。大多數具有減少模式的蛋白質呈現非線性行為。一些在生命最初20年快速減少,然后隨年齡大多保持恒定,而其他呈指數減少。隨衰老線性減少的蛋白質主要來自OD面板。在隨衰老增加的蛋白質中,大多數線性增加,而7種蛋白質顯示非線性增加。此外,OD面板的一種蛋白質在男性和女性中顯示不同模式。雖然該蛋白質表達在男性中隨年齡相對恒定,但在女性中呈現U形。我們觀察到在最初20年減少,成年期相對恒定表達,60歲后輕微增加。
3.7 基準正常范圍
基于觀察到的模式,我們擬合二次多項式函數描述蛋白質表達隨年齡變化,并使用最佳擬合周圍95%置信限定義每個蛋白質隨年齡的“正常范圍”。每個蛋白質觀察到的曲線提供關于所有年齡蛋白質表達模式的信息。
4 討論
為有效利用蛋白質組學改善臨床護理并增強藥物開發和試驗設計,了解整個生命周期健康衰老過程中生物標志物表達模式至關重要。在這項探索性概念驗證研究中,我們分析了0天至88歲健康個體血清樣本中與免疫反應、免疫腫瘤疾病或調節和信號通路相關的178種獨特蛋白質。我們發現健康個體血清蛋白質水平隨年齡增長表達不同,新生兒與其他個體之間觀察到的差異最大。該結果通過k均值和層次聚類均發現。后者另外強調了每個年齡組不同的蛋白質,并發現與k均值聚類不同的簇,盡管清晰地將新生兒與其他年齡組分離。這種差異很可能是由于樣本分組方法本身造成的。我們還表明測量的92種免疫相關蛋白質可分為5個模塊,其中4個與年齡相關,4個富集于健康個體特定免疫通路。總體而言,我們表明調節和信號相關蛋白質在我們研究中的健康個體中也呈現隨年齡的不同表達模式。
值得注意的是,我們使用新生兒血清樣本而非臍帶血樣本,由于倫理和邏輯原因可用性不足,臍帶血通常用于代表新生兒血液。然而,臍帶血與新生兒血液不同。我們觀察到衰老過程中蛋白質表達的顯著差異,特別是在幼兒樣本與成人相比之間。盡管這些結果并不令人驚訝,因為衰老不可能沒有使新生兒和兒童成長為老年個體的發育過程。這些結果強調兒童在健康方面與成人不同,在成人中進行的觀察不能直接外推至兒童或新生兒。然而,我們的數據未提供關于疾病中發生的變化在兒童和成人之間是否相似的見解。
據我們所知,這是第一個調查包括新生兒、兒童、中年和老年人在內的整個生命周期健康衰老的探索性概念驗證研究。最近一項使用Olink技術的大型蛋白質組學研究調查了成年期健康衰老,包括40-70歲個體樣本。我們從0-88歲個體獲得的獨特數據集表明,在生命最初四十年已經可以觀察到不同的蛋白質動力學。有多項使用不同技術的蛋白質組學研究,但這些研究在調查年齡相關模式時也未包括新生兒和兒童。我們能夠建立從出生到成年的表達“正常范圍”。為應對Olink技術中潛在批次效應,我們開發了一個使用“橋接對照”的流程。
我們確定了整個生命周期四種不同的蛋白質表達模式;恒定、增加、減少和U形。不同模式可能代表健康個體整個生命周期中發生的生理過程所涉及的蛋白質。對于個體化醫療,識別蛋白質模式可能有助于未來發現損傷,并通過醫療治療,我們可以將這些變化重新安排回“正常軌道”。有趣的是,這里僅一種蛋白質在男性和女性之間顯示不同的年齡相關變化。使用SomaScan技術,Lehallier等人觀察到大多數眾所周知的性別相關激素在性別間不同。CALCA表達中的性別差異可能源于激素相關因素,因為已知女性晚年比男性更常發生骨質疏松癥。CALCA參與骨形成,并被批準用于治療佩吉特骨病、高鈣血癥和預防急性骨丟失。值得注意的是,編碼CALCA的基因具有性別特異性多態性,與涉及鈣的通路相關,如血管舒張、血壓和各種癌癥。
六種蛋白質存在于兩個面板中,其中兩種在面板間相關性不高。這些差異可能由于潛在技術問題或標志物豐度非常低,未在當前研究中進一步研究。最后,少數蛋白質基于來源隊列呈現一致差異,然而由于它不影響PCA中獲得的簇,因此在研究這些樣本中整個生命周期健康衰老時可忽略不計。Caspase 8在全年齡段隊列樣本中的表達水平持續比其他隊列高兩倍。目前,我們對此觀察結果沒有解釋。我們還觀察到全年齡段隊列中IL8表達水平的巨大變異。已知該蛋白質表達水平受不同處理方案影響。因此,重要的是意識到某些蛋白質水平比其他蛋白質更容易受處理方案影響,因此可能具有較低的成為生物標志物潛力。
這項研究有幾個局限性。首先,每個年齡組的個體數量有限,依賴20-90歲每10歲10個個體,生命最初20年每5歲10個個體。使用混合抽樣方法補充小樣本量,然而在增加每個年齡組內樣本數量方面能力有限。建議使用來自同一隊列的樣本以最小化隊列特異性變異。隨著每10歲年齡增長更多樣本,特別是老年人,將獲得更可靠的測量結果。其次,缺乏外部驗證隊列來驗證我們的發現。因此這些結果在沒有重復的情況下仍然是初步的。需要包括更多個體,特別是幼兒和老年人的驗證研究,以進一步研究幼兒、兒童和成人之間的差異。第三,我們僅使用血清樣本,已知潛在基質效應可能影響不同樣本類型的測量。因此,觀察到的整個生命周期健康衰老模式以及“正常范圍”僅適用于血清樣本。下一步是探索基質效應如何影響獲得的范圍,并在需要時開發一種使不同基質測量可比的方法。第四,蛋白質組覆蓋范圍適中,限于大多數樣本的92種蛋白質。未來研究可能側重于擴大蛋白質數量以研究健康個體衰老特征。第五,“健康個體”的定義有爭議。我們納入無慢性免疫介導炎癥疾病或免疫抑制劑/調節劑使用的個體,強調應考慮將用作“健康個體”的個體納入標準,記住年齡特異性和變化的研究目標。此外,對于生物標志物的預期使用,報告平均人群的參考值而不是明確選擇無任何疾病相關癥狀的“健康”人群可能更具信息性。
未來應用,如個體化醫療,可側重于識別IMIDs或其他疾病中差異表達的蛋白質,并將其與年齡匹配健康個體的正常范圍進行比較。利用整個生命周期中識別的蛋白質模式變化,可以開發靶向干預措施以將這些蛋白質的過表達或低表達恢復至正常水平。
此外,探索在“早衰”條件中是否觀察到整個生命周期的類似蛋白質模式將是有價值的。此外,驗證研究對于確認我們當前發現至關重要,同時縱向研究以驗證和進一步研究觀察到的蛋白質模式隨時間變化。
總之,這項探索性概念驗證研究描述了從新生兒到老年人血清樣本中178種獨特蛋白質的表達。非常年輕和老年人群之間表達的差異強調了兒童與成人的區別。基于網絡分析鑒定了免疫相關蛋白質模塊,一些與年齡和/或性別相關。我們還確定了衰老過程中四種不同的蛋白質表達模式。衰老過程中觀察到的蛋白質表達動力學可能為臨床護理、藥物開發和臨床試驗中的生物標志物發現提供關鍵信息。