《Nature Communications》:Fine-scale structure of a whole regional population through genetics and genealogies
編輯推薦:
為解決人群異質性會混淆遺傳關聯研究,且常規校正方法可能無法完全消除近期人口結構影響的問題,研究人員利用基因型數據與家譜記錄,對加拿大魁北克薩格奈-圣讓湖(SLSJ)這一近期奠基者人群開展了整合分析。研究揭示了基因與譜系親緣關系的高度一致性,并發現市級層面的精細遺傳結構(東西遺傳梯度),這挑戰了區域同質性的傳統假設,對基因組關聯研究(GWAS)和多基因風險評分(PRS)分析具有重要參考意義。
在探索人類復雜性狀與疾病的遺傳基礎時,科學家們常常依賴一項關鍵技術——全基因組關聯研究(Genome-Wide Association Study, GWAS)。通過比較大量個體的基因組,GWAS旨在發現與特定性狀或疾病風險相關的常見遺傳變異。然而,這項研究道路上的一個主要“絆腳石”是人群分層(Population Stratification)現象。簡單來說,當研究對象來自不同遺傳背景的亞群體,而這些亞群體間恰好存在表型(如患病率)差異時,就可能產生虛假的關聯信號,誤將那些僅僅標記了群體身份而非疾病因果的遺傳變異識別出來。
為了校正這種干擾,統計學家們開發了多種方法,最常見的是利用主成分分析(Principal Component Analysis, PCA)來識別和調整樣本中廣泛的群體結構。但這是否就萬事大吉了呢?越來越多的證據表明,即使在應用了這些常規校正之后,由更近期的人口歷史事件(如遷徙、瓶頸、奠基者效應)所塑造的、更精細尺度的人群結構,仍可能“潛伏”在數據中,持續對GWAS和多基因風險評分(Polygenic Risk Score, PRS)分析產生微妙的混雜影響。這種影響在多大程度上存在?我們又該如何精確地描繪它?這些問題對于確保遺傳研究的可靠性至關重要。
為了深入探究近期人口歷史如何塑造人群的精細遺傳結構,一支研究團隊將目光投向了一個理想的研究模型——加拿大魁北克省的薩格奈-圣讓湖(Saguenay–Lac-Saint-Jean, SLSJ)地區。這個地區因其相對隔離的歷史和已知的近期(約17世紀以來)奠基者事件,長期以來在遺傳流行病學中被視為一個相對同質化的人群。研究人員巧妙地將現代高通量基因分型數據與詳盡的歷史教區檔案(記載了出生、婚姻和死亡信息)相結合,展開了一項整合分析。他們的研究成果發表在《Nature Communications》上,清晰地揭示了這個所謂“同質”區域內部,實際上存在著清晰可辨的、與歷史和社會經濟因素交織在一起的精細遺傳結構。
為開展這項研究,研究人員主要運用了幾個關鍵技術方法。首先,他們構建了一個大規模的家譜數據庫,覆蓋了該地區的歷史人口。其次,他們對現代SLSJ隊列樣本進行了基因分型,獲取遺傳數據。最關鍵的是,他們開發了一種高效算法,能夠計算海量(數十億對)個體之間的譜系親緣系數,將遺傳親緣關系與基于家譜計算的期望親緣關系進行精確比對,從而驗證遺傳-譜系一致性并揭示精細結構。
遺傳與譜系親緣關系的高度一致性
研究人員首先比較了基于基因型數據計算的“實現”的親緣關系與基于詳細家譜記錄的“期望”親緣關系。結果顯示,兩者之間存在非常強的相關性。這一發現不僅驗證了歷史檔案的準確性,更重要的是,它證實了在這個相對近期形成的人群中,其當前的遺傳結構能夠被其已知的、較近期的(約12代以內)人口歷史所充分解釋。這為后續精細結構的探索奠定了堅實基礎。
市級層面的精細遺傳結構
利用他們開發的高效算法,研究團隊系統計算了所有在1931年至1960年間于該地區結婚的個體之間的成對親緣系數。通過分析這些親緣關系網絡,他們成功揭示了在市級行政單位尺度上的精細人群結構。最顯著的發現是一個清晰的“東西遺傳梯度”:位于區域西部的市鎮與東部的市鎮在遺傳上存在可度量的差異。這表明,即便在一個地理范圍不大、歷史相對短暫且被認為同源的區域內,遺傳異質性依然顯著存在。
精細結構的驅動因素
那么,是什么塑造了這種東西遺傳梯度呢?通過結合歷史人口學分析,研究人員指出了幾個關鍵因素:1. 奠基者貢獻的差異:不同市鎮的早期定居者(奠基者)來自不同的源人群,他們的遺傳背景有所差異,這種初始差異在后代中得以延續。2. 遷移模式:歷史上市鎮之間的人口流動并非完全隨機,存在一定的方向性,強化了遺傳結構。3. 社會經濟因素:職業、社會階層等社會經濟因素影響了通婚模式,進一步塑造和固化了遺傳邊界。這些因素的共同作用,使得本可能在幾百年內被完全混合所抹平的遺傳信號得以保留。
對遺傳關聯研究的啟示
該研究的發現對GWAS和PRS分析具有直接而重要的警示意義。標準的分層校正方法(如基于常見變異的主成分分析)主要針對古老、粗尺度的人群分化,可能無法有效捕捉和校正由近期歷史事件形成的精細結構。當這種精細結構中的等位基因頻率與所研究的表型變異相關時,就會導致殘留混雜,可能產生假陽性關聯或使PRS的跨群體移植性(portability)變差。SLSJ地區的案例強烈暗示,類似的近期精細結構很可能廣泛存在于世界各地的許多人群中,尤其是在那些有已知人口擴張或隔離歷史的人群中。
綜上所述,這項研究通過整合遺傳學與譜系學,以前所未有的精細尺度描繪了一個近期奠基者人群的遺傳結構。它有力挑戰了SLSJ地區人群同質性的傳統假設,證明即便在小地理范圍內,近期的人口歷史也能留下深刻的遺傳印記。研究揭示的東西遺傳梯度及其與奠基者歷史、遷移和社會經濟因素的關聯,為我們理解人群結構的形成提供了生動范例。更重要的是,它向遺傳學研究領域發出了明確提醒:在設計和分析GWAS及PRS時,必須充分考慮研究人群內部可能存在的、由近期歷史事件塑造的精細分層。忽視這種結構,可能會影響關聯發現的可靠性,并限制PRS在不同亞群或相關人群中的有效應用。未來的研究需要開發更靈敏的方法來檢測和校正這種精細結構,以提升人類遺傳學研究的精確性和普適性。