您現在的位置是:首頁 > 網頁遊戲首頁網頁遊戲

【重磅綜述】利用組學大資料評估人的生物學年齡

  • 由 澎湃新聞客戶端 發表于 網頁遊戲
  • 2023-01-11
簡介為了支援這一觀點,一項包含14個佇列的大型薈萃分析表明,在極端情況下,將甲基化時鐘的準確性提高到極高的水平實際上降低了其與死亡風險的相關性,似乎有可能“過度擬合”這些與衰老表型無關的分子衰老“噪聲”模型,這表明僅對實際年齡進行測試可能是一種

脫氫異雄酮高是什麼原因造成的

以下文章來源於老頑童說 ,作者老頑童說

老頑童說。

公眾號致力於傳播衰老相關的前沿科研進展和趣味科普,幫助大家更深入地瞭解衰老背後的科學故事~

【重磅綜述】利用組學大資料評估人的生物學年齡

關注我們,獲取更多相關資訊

翻譯 by 鄭子凱、車姍姍、平佳樂、孫國強

機器學習的興起為大資料時代掀起新的浪潮。機器學習是人工智慧的一個子集,透過泛型演算法從資料集中發現模式和相關性並建立邏輯,並根據資料分析結果做出最佳決策和預測。目前機器學習已大量應用於各行各業,助力各產業或科學研究的深度提升。美國加州斯坦福大學的Tony Wyss-Coray團隊於2022年6月在Nature Reviews Genetics上發表的一篇名為“Measuring biological age using omics data”的綜述,總結了透過利用各種組學資料,藉助機器學習構建衰老時鐘的方法、發展、比較和應用等,並闡述了機器學習在識別生物衰老新型生物標記物方面的能力,為推動衰老的預警與干預及精準醫療策略的發展提供了強大助力。

摘 要

衰老是引發老年人疾病和殘疾的關鍵風險因素。大量研究致力於衰老相關疾病及延長健康壽命,這些研究表明,靶向衰老過程本身可有助於“恢復”生理機能。然而,要實現這一目標,就需要在分子水平上測量生理年齡和衰老速度。在最新高通量組學技術的推動下,新一代生理衰老測量工具能夠在分子解析度上對衰老表徵進行量化。表觀基因組學、轉錄組學、蛋白質組學和代謝組學資料均可以透過機器學習來構建“衰老時鐘”,並能鑑定生理衰老的新型生物標記物。

正 文

在全球範圍內,人口正在迅速老齡化,但人們的健康壽命,即沒有疾病的生命時期並沒有增加。衰老會影響全身不同器官,進而引發疾病,是心臟病、神經退行性疾病和癌症的最大風險因素。而這些與年齡相關的疾病往往具有區別於衰老程序的獨特病理特徵。直到最近,科學家們才開始關注,衰老本身是否可以作為疾病的共同根源來處理。過去幾十年裡的幾項突破性研究首次提出了實現健康衰老和延長壽命的可能性。在動物模型和人類上的研究以及多種實驗正規化(如熱量限制、異體共生和部分表觀遺傳重程式設計)中發現多種可以調節壽命的基因,這表明操縱衰老生物學來“恢復”複雜模式生物的生理機能是可能的。然而,將上述干預措施應用於臨床需要測量個體的生理年齡和生物衰老速率。因此,需要一種反映細胞型別、組織、器官(如心臟或大腦)或整個生物體的生理年齡的分子生物標記物來開發針對衰老的藥物。

生物衰老是極其複雜的,並由失調的細胞穩態和生化過程的相互作用所驅動的。幾乎每一個生物過程都受到衰老的影響,研究人員已經提出了無數的生物標誌物來嘗試瞭解和測量這些過程(圖1)。這些標記物從明顯的外表特徵如變白的頭髮,擴充套件到分子變化如白細胞端粒長度。在過去的十年中,組學方法的出現使解析衰老生物學的分子複雜性成為可能(圖1)。高通量基因組學、蛋白質組學和代謝組學方法可以對成千上萬的表觀遺傳標記、轉錄本、蛋白質和代謝物進行表徵和定量,並可以在分子水平上揭示覆雜生物體隨年齡發生的整體變化。然而,大規模組學資料的可用性對分子衰老的分析和解釋提出了新的挑戰,該領域越來越多地轉向機器學習技術,將組學資料提煉成複合衰老生物標誌物,幫助解釋複雜的衰老生物學,並指導臨床決策(框1和圖2)。

【重磅綜述】利用組學大資料評估人的生物學年齡

【重磅綜述】利用組學大資料評估人的生物學年齡

圖1 衰老生物標誌物分類。衰老的明顯特徵(最上圖)如肌肉衰弱和頭髮花白,自古以來就被用來評估一個人的生理年齡。然而,隨著現代生物醫學的出現,利用器官功能的物理和分子讀數(從上第二圖),如血壓、炎症標誌物和代謝標誌物來診斷健康與疾病成為主要焦點。直到最近,人們才將注意力轉向利用細胞和分子生物學來評估生理年齡。衰老的標誌(從上到下第三圖),如端粒縮短和細胞衰老,成為理解衰老的現代科學框架,在分子水平上指導了衰老的研究。這在一定程度上引領了基於組學的衰老時鐘生物標記物(最下圖)的發展,它試圖將隨著衰老發生的整個分子變化整合到生理年齡的綜合測量中。

時序年齡預測器是在衰老背景下解釋組學資料的一種框架,該領域已將其通俗地稱為衰老時鐘,並顯示出相當大的前景。衰老時鐘是一種機器學習模型,可以學習大樣本中的分子特徵的模式,如血細胞中特定基因組位點的CpG甲基化水平或血漿中的蛋白質濃度,這可以用來估計樣本來源的個體年齡(圖2)。人們普遍假設,這個估計年齡可以作為個體生理年齡的衡量標準,而估計年齡和實際年齡之間的差異,稱為“Δ年齡”或“年齡差距”,反映了他們過去衰老速度的變化(圖2)。這些假設透過實驗的觀察結果得到了支援,即年齡差距為正(也被稱為年齡加速)的個體有更大的死亡風險,並容易患上一些衰老相關疾病,如心臟病、代謝綜合徵和某些癌症。

在這篇綜述中,作者批判性地審視了使用組學資料構建的衰老時鐘的研究現狀。在此過程中,作者試圖闡明衰老時鐘可以實際測量什麼,如何改善衰老時鐘以增進人們對衰老生物學的理解,並思考關於組學技術支援的衰老生物標誌物的未來研究前景。

Omic時鐘

衰老時鐘是利用多種機器學習模型由許多不同型別的組學資料構建的(框1和圖2)。每個組學層次在測量衰老的不同方面都有一定的內在優勢和劣勢。作者在這篇綜述中調研了該領域迄今為止的主要發展(圖3),尤其關注了來自不同組學、已經能夠準確測量的一些衰老表型以及衰老標誌物。

DNA甲基化

表觀遺傳改變是衰老的一個標誌,最近的研究表明,透過瞬時的表觀遺傳重程式設計,細胞可以獲得再生,功能得到恢復。該領域主要關注一種特殊的表觀遺傳標記:CpG二核苷酸中的胞嘧啶甲基化(CpG甲基化),它隨著年齡的增長而變化。第一個DNA甲基化時鐘是由Bocklandt等人在2011年建立的彈性網路模型(框1),他們僅使用大約100個唾液樣本證明了高度準確的實際年齡預測(誤差大約在5年內)。這個“表觀遺傳衰老時鐘”的概念在2013年被明確命名和普及,首先由Hannum等人使用656個全血樣本構建了Hannum時鐘(71-CpG時鐘),然後由Horvath使用包含51種不同組織和細胞型別的8,000個樣本進一步構建了泛組織Horvath時鐘(353-CpG時鐘)。自2013年這些里程碑式的研究以來,已經建立了其他幾個表觀遺傳時鐘,包括Weidner等人的3-CpG時鐘、Lin等人的99-CpG時鐘和Vidal-Bralo等人的8-CpG時鐘。所有這些時鐘,以及在後續章節中討論的大多數時鐘,都是使用稀疏線性迴歸方法構建的,該方法已成為可解釋性模型領域的標準(框1)。

DNA甲基化時鐘的一個特別有趣的方面是,不管用於測量的組織型別是什麼,它們能夠準確預測各種不同型別組織的年齡,表明它們測量的是細胞型別之間共享的衰老訊號。此外,在許多癌症佇列中,癌症組織在Horvath時鐘上顯示出明顯的年齡加速,這表明它測量了衰老和許多癌症之間共享的表觀遺傳失調位點。

然而,死亡風險,一種被廣泛用於衡量“整體”生理年齡的因素,也顯示出與這些時鐘之間微弱而多變的關聯,這就提出了一個問題,即它們實際上測量的是什麼物質。一個已知的混雜因素是血細胞組成,它也隨著年齡的增長而變化從而損害健康。但嘗試消除和利用細胞成分變化造成的混淆也並沒有改變這些時鐘與死亡率和其他健康結果的弱相關性。

框1 構建衰老時鐘的機器學習模型

衰老時鐘是一種機器學習模型,它透過學習數學公式,並根據整個壽命中隨年齡變化的特徵(如基因表達水平)來估計個體的年齡。最普遍的模型是基於線性迴歸的模型,透過特徵和年齡資料計算出一條最佳擬合線(或多維資料中的最佳擬合平面)。更具體地說,“最佳擬合”是指成本函式最小化的平面,通常是所有預測的剩餘平方誤差(圖2a)。結果是一個用加權特徵線性組合預測年齡的方程(預測年齡 =β0 +β1 X1 +β2 X2 +。。。+ βn Xn,其中Xi是特徵i值的向量,βi是成本函式的相應權重),可以應用於其他資料集。這些模型的優勢在於它們的可解釋性:如果一個特徵被賦予一個正的權重,那麼該特徵的值越高則對應於更高的預測年齡,權重越正向,該特徵的影響就越強。然而,標準線性模型在應用於組學資料時往往存在一些問題。如果分子特徵比樣本多(即2萬個基因特徵和40,000個樣本),就很難從資料中獲得正確的關係。其中一個原因是維度魔咒(圖2b):獲得資料完整分佈所需的樣本數量隨每個樣本中測量的變數數量呈指數增長。另一個原因是組學資料的相關性結構複雜,線性迴歸不能很好地處理它。

因此,懲罰性線性迴歸模型,即套索、脊和彈性網路迴歸,被廣泛用於減少線性模型中的特徵數量(建立稀疏性),並解釋特徵之間的強相關性。絕大多數的組學衰老時鐘都是用這些方法(或者偶爾用其他稀疏線性迴歸方法)的變體構建的。這些模型透過對增添更多特性施加懲罰來工作。懲罰的確切形式各不相同,但它們都有降低高度相關或資訊較少特徵的權重的效果,有時甚至降到零,這樣只選擇重要特徵的子集。雖然在概念上相似,但每種迴歸方法都有細微的不同,可以測量不同的衰老訊號。一項研究表明,脊迴歸時鐘和彈性網路迴歸時鐘都可以檢測到熱量限制小鼠的減速衰老,但只有脊迴歸時鐘可以檢測到長壽侏儒小鼠的減速衰老,這表明模型選擇可能很重要,而且這取決於資料集。

其他通常用於衰老時鐘的機器學習模型包括支援向量機、決策樹和神經網路。深度神經網路是一種特別令人感興趣的方法,當應用於大規模資料時,它在幾個不同的領域都顯示出了前景。神經網路有幾種型別,但其基本原理是連線大量的簡單節點(“神經元”),從資料中學習更復雜的非線性關係(圖2c)。神經網路在處理小資料集時表現不佳,但如果它們能在包含數萬到數十萬個樣本的大資料集上進行訓練,那麼它們的表現往往會遠遠優於其他模型。隨著組學資料規模的增長,神經網路被越來越多地用於構建各種組學型別的衰老時鐘,並已經證明了一些生理年齡的測量方法。然而,考慮到其複雜性,神經網路比其他模型更難解釋,因為它通常不可能推斷出神經網路所學習到的資料中的生物關係。儘管如此,在設計可解釋的神經網路方面已經取得了進展,透過明確地將特定的生物通路編碼到其結構中或反向傳播資訊來輸入特徵,在設計可解釋的神經網路方面已經取得了進展。這些令人興奮的方法可能會更好地捕捉衰老的複雜性。

遵從第一性原則考慮的方法,從數十萬(甲基化陣列)到數百萬(亞硫酸氫鹽測序)的可能位點測量中選擇隨實際年齡變化最大的CpG位點並不能最大程度上捕獲相關的功能衰老生物學。為了支援這一觀點,一項包含14個佇列的大型薈萃分析表明,在極端情況下,將甲基化時鐘的準確性提高到極高的水平實際上降低了其與死亡風險的相關性,似乎有可能“過度擬合”這些與衰老表型無關的分子衰老“噪聲”模型,這表明僅對實際年齡進行測試可能是一種次優方法。

這些侷限性導致了第二代表觀遺傳時鐘的發展,該時鐘旨在透過開發將模型訓練與生物衰老重要特徵更直接地聯絡起來的方法,以識別衰老過程中更多功能相關的分子變化。2016年,Yang等人在測試稀疏線性模型之前,透過預先選擇胎兒組織中甲基化水平低、成年期甲基化水平增加的CpG位點,並對映到Polycomb群體目標(PCGT)的啟動子,構建了一個與細胞分裂數量相關的表觀遺傳時鐘。作者利用PCGT複合物啟動子的超甲基化與幹細胞增殖相關的生物學知識,構建了一個專注於衰老生物學這一方面的時鐘。引人注目的是,這個時鐘獨特地檢測到了癌前組織樣本的衰老加速。

該領域還開發了一系列專門設計與死亡風險相關的第二代時鐘。Zhang等人使用LASSO Cox迴歸法確定了10個與死亡風險高度相關的CpG位點。Levine等人建立了DNAm PhenoAge時鐘,該時鐘使用標準方法,但基於實際年齡和與死亡風險相關的9個臨床引數的線性組合,預測了複合生理年齡得分。Lu等人構建了DNAm GrimAge時鐘,該時鐘透過兩個階段來預測生理年齡,首先構建模型預測吸菸史和已知與死亡風險相關的7種血漿蛋白的濃度,然後結合這些輸出結果模擬成時鐘來預測死亡時間。根據設計,所有這些時鐘都與死亡風險有密切的關聯,其中一些顯示出與心臟病風險、身體功能(平衡性、握力、行走速度)和一些健康的血液化學指標有關。與其他時鐘相比,DNAm GrimAge時鐘始終顯示出與年齡相關功能障礙的各種指標之間更強的關聯,包括心臟病、身體虛弱、認知和身體機能衰退。

最近,Belsky等人建立了DunedinPoAm DNAm時鐘,這是一個令人興奮的進展,不同於許多以前的時鐘透過訓練來預測個體當前的衰老狀態,而是使用縱向資料更直接地預測個體的衰老速率。該研究利用了一個為期1年的出生佇列(n=810),追蹤了在26歲、32歲和38歲時收集的18個器官功能的臨床化學和生理生物標誌物的變化來量化表型,包括身體功能、認知能力、自我評估的健康狀況和死亡率,並比對DNAm表型時鐘。

表觀遺傳時鐘領域的創新速度是非常快的,而利用表觀遺傳血液衰老作為其他器官系統生理衰老的指標的能力更加突出了它們作為臨床生物標誌物的潛在用途。然而,由於組織衰老的速度各不相同,血細胞衰老測量和解釋身體其他部分衰老機制可能是有限度的,這可以從第二代衰老時鐘和器官特異性年齡相關功能障礙測量之間的微小聯絡(儘管在統計學上具有顯著意義)得到證明。這一觀點得到了進一步支援,研究表明,在特定組織中測試的表觀遺傳時鐘與這些組織的功能狀態有更強的關聯。此外,雖然表觀遺傳時鐘已被證明具有高度可重複性,但對基因組CpG甲基化的分子和細胞原因和後果普遍缺乏理解仍然是實現這些模型的潛在障礙。

【重磅綜述】利用組學大資料評估人的生物學年齡

圖2 組學衰老時鐘領域中重要的機器學習概念。a,衰老時鐘的基本概念為一個簡單的線性迴歸模型。群體抽樣用於學習分子特徵(如蛋白質的表達水平)和使成本函式最小化的因變數(年齡)之間的關係(圖表)。然後用學習到的關係來預測年齡,並用實際年齡和預測年齡之間的殘差來衡量生理年齡(輸出模型)。b,維度魔咒是組學機器學習的一個挑戰。在給定密度下進行抽樣,所需的樣本數量隨著每個樣本中測量的特徵數量呈指數增長。實際上不可能密集抽樣高維組學分佈,這也導致了去使用額外的方法來減少特徵空間。c,簡單深度神經網路的一般結構。特徵作為輸入資訊並傳遞到一組節點(隱藏層1),這些節點用數學函式(通常是一組已知權重的線性組合)轉換輸入,然後將值傳遞到下一層。該模型透過將多個隱藏層上具有可學習權重的簡單函式連結在一起,獲得了額外的表達能力。每個節點的權值可以透過最小化類似於線性迴歸情況的成本函式來聯合最佳化。

轉錄組學

利用RNA在基因表達水平上研究衰老時鐘,將衰老與基因更直接地聯絡起來,增加了這些模型的合理性和實驗可測試性。Peters等人2015年的一項研究是轉錄組時鐘的第一次正式試驗,他們利用來自多個大佇列的外周血單個核細胞的基因表達資料,使用標準方法研究轉錄組衰老時鐘。轉錄組時鐘在不同佇列中具有高度可變的年齡預測準確性,在所有測試佇列中,轉錄組時鐘在時序年齡預測方面的準確性明顯低於表觀遺傳時鐘。這可能部分是因為來自多個平臺的微陣列和測序資料被聯合使用,給資料增加了技術噪音。然而,轉錄組時鐘被發現與一些生物標誌物和危險因素(如吸菸)有關聯,並且Horvath和Hannum時鐘沒有注意到,這與血液收縮壓也有某種特殊關聯。儘管噪音很大,但這可能表明使用不同時鐘來衡量生物衰老的不同方面具有潛在的附加價值。

2018年,Fleischer等人利用人真皮成纖維細胞轉錄組資料研究了一個時鐘。採用整合方法將多個線性判別分析分類器組合在一起,以降低轉錄組資料的噪聲。該方法在時序年齡預測和檢測早衰症樣本加速衰老方面優於基於懲罰線性迴歸的標準時鍾,表明該方法穩定了轉錄噪音並提高了效能。然而,該模型並沒有在獨立的測試資料集上進行評估,因此該方法是否真正有所改進還需觀察。

Meyer等人在2021年取得了有趣的進展,他們證明對轉錄組資料進行簡單的二值化和相對年齡縮放可以去除資料的噪音,並將秀麗隱杆線蟲的年齡預測準確性提高到理論的上限(與蠕蟲的年齡一樣精確,以1天為增量進行跟蹤)。此外,這種時鐘可以檢測到長壽的daf2突變體或受輻射和熱量限制影響個體的預期生物學年齡變化,並在不同的壽命階段中效果良好。作者表明,在秀麗隱杆線蟲中,確實有可能產生一個準確的、有生物學意義的轉錄組衰老時鐘。此外,他們利用Fleischer等人的人類成纖維細胞資料證明,由二值化轉錄組資料衍生的彈性網路時鐘將實足年齡預測提高到r2為0。92,平均誤差為6。63年,可以檢測早衰症樣本的加速衰老。然而,這些方法是否能產生跨人類佇列模型還有待觀察。

Holzscheck等人使用了另一種建模框架——深度神經網路,該框架在其他領域效能強大且越來越受歡迎(框1)。他們實現了一種人工神經網路,限制神經元輸入且和已知生物通路連線。這使得研究人員能夠為時鐘中表示的每個通路提取一個重要分數,增加了黑匣子模型的合理性。他們報道說,他們的生物時鐘與多種生物面板衰老指標有關,他們的模型能夠以預期的方式對計算機中已知的生物年齡擾動做出反應。

儘管轉錄組時鐘領域已經研究出了幾種方法來克服轉錄組資料中的噪聲,但這些時鐘在大型人類佇列中的準確性和可重複性仍不清楚。大多數研究都是在小樣本上進行的,沒有在獨立佇列中進行測試,或者使用較老的微陣列技術,這比現代RNA測序的準確性和可重複性都要低。此外,它們是否有能力重複測量人類生物衰老的各個方面,如死亡風險、心臟病、身體功能和認知能力,在很大程度上仍有待確定。

蛋白質組學

在過去的十年中,基於質譜、基於抗體和基於核酸適配體蛋白質組學的發展使單個樣本中數千種蛋白質的準確定量成為可能。利用多種蛋白質組學技術的研究表明,在人血漿和腦脊液中,數千種蛋白質會隨著年齡的變化而變化,這導致了多種蛋白質組學衰老時鐘的發展。Baird等人和Menni等人的開拓性研究分別使用人類腦脊液和血漿樣本,基於SomaLogic核酸適配體蛋白組學平臺開發了第一個衰老時鐘模型,但沒有檢查與任何衰老表型或器官功能的關聯。

2018年,Tanaka等人描述了首個基於血漿蛋白的衰老時鐘,該時鐘研究了蛋白質組年齡差距與生物衰老之間的關係。Lehallier等人進一步證實了多個獨立佇列中穩定且高度準確的時序年齡預測。這兩項研究都使用標準方法構建了蛋白質組時鐘,並觀察了與許多生理和臨床衰老表型的關聯,包括身體功能、認知測試分數和健康的臨床化學標記。在一項隨訪研究中,Tanaka等人顯示了與死亡率、多重發病率、和健康壽命的相關性。這些研究表明,免疫和神經元通路是重要的衰老過程。Lehallier等人還證明了血漿衰老時鐘中的許多蛋白質是透過異體共生和運動來調節的,這是兩種“年輕化”的正規化。

後續研究表明,在血漿蛋白質組衰老時鐘中發現的數十種蛋白質直接調節壽命,數百種蛋白質與不同器官的健康狀況有生物學上的聯絡。事實上,與器官功能的直接聯絡代表了血漿蛋白質組學在研究不同組織和細胞型別之間衰老差異方面的巨大優勢。血漿包含有幾乎所有器官和細胞型別的蛋白質,這使得開發專注於特定組織衰老生物學時鐘成為可能。此外,缺失蛋白質平衡是衰老的一個標誌,而其他衰老的標誌,如營養感知失調、細胞間通訊改變和細胞衰老,也意味著蛋白質組的改變,如胰島素和肽激素、訊號蛋白和炎症細胞因子的差異水平。這些與衰老生物學的直接機制聯絡使蛋白質組學成為開發生物學上合理衰老時鐘的一個特別好的平臺。

儘管血漿蛋白質組學在發現衰老生物標誌物方面有許多理論優勢,但仍有侷限性。腎功能對血漿蛋白濃度的影響尚不完全清楚,但可能混淆衰老分析。事實上,許多器官的功能可能會對血漿蛋白質組的組分產生影響,這可能是一個重要特徵,但需要思考分析。此外,蛋白質組學技術比DNA定量技術更新穎且缺少更進一步的研究,因此蛋白質組學時鐘比甲基化時鐘更少被廣泛驗證。儘管以SomaLogic核酸適配體為基礎的平臺特別強大,可以準確量化各種生物液體和細胞提取物中的7,000多種蛋白質,但目前還不能準確量化整個蛋白質組。隨著蛋白質組學技術的進步,對衰老蛋白質組學的進一步和更大規模的研究可能會帶來更多的見解。

與DNA甲基化和轉錄組時鐘類似,目前還不清楚蛋白質組的變化在多大程度上代表了整個身體的所有衰老過程。儘管與其他組學相比,蛋白質組學有更多的證據是樂觀的。對動物異體共生和血漿交換的研究表明,迴圈蛋白可以對整個身體的衰老表型產生因果影響,包括骨骼肌、心臟和大腦。未來對由衰老時鐘識別的蛋白質進行的實驗研究,將可以更深入地理解衰老生物學以及它與衰老的組學特徵之間的關係。

代謝組學

最先進的質譜和核磁共振方法可以識別人類血漿中數百到數千種代謝物,多項研究試圖瞭解它們與衰老之間的相互作用。在愛沙尼亞和芬蘭的一項大型生物樣本研究中,使用血漿的1H-NMR來識別預測死亡風險的代謝物。作者確定了多種充分研究的代謝物,如白蛋白、極低密度脂蛋白顆粒和氨基酸,它們與多種原因引起的死亡有關。隨後,另一項大型1H-NMR生物研究從血漿中的56種可靠的代謝物中開發了代謝組學時鐘,並評估了代謝組學年齡差距、心血管表型和死亡率之間的關係。在獨立的前瞻性佇列中,發現代謝組年齡增長與心血管危險因素、心血管疾病風險和全因死亡風險相關。

其他研究使用多種靶向和非靶向質譜和核磁共振方法從血漿和尿液代謝物生成代謝組時鐘,對這些時鐘與疾病風險因素(高血壓、糖尿病、肥胖、吸菸、飲酒、缺乏體力活動)、收入和心理風險因素(抑鬱、焦慮、創傷後應激障礙)的關聯進行了測試。代謝組學年齡增長與甘油三酯水平、肥胖、酗酒、糖尿病、抑鬱、焦慮和創傷後應激障礙相關。Robinson等人還評估了質譜代謝組學衰老時鐘對生物通路的富集,並確定了幾種維生素、氨基酸和外源生物相關的代謝富集。

基於核磁共振的代謝組學的低成本使生物樣本庫規模的佇列量化成為可能,這是將代謝組學時鐘應用於人群健康的優勢。然而,開展和解釋代謝組學實驗仍然具有挑戰性。非靶向代謝組學方法的優勢在於能夠檢測數千種代謝物特徵;然而,大多數透過質譜和核磁共振檢測到的化合物是孤體化合物,也就是說,它們的結構尚未確定。靈敏度是非靶向方法的另一個挑戰,許多代謝物在一些樣本中被檢測到,但在其他樣本中卻沒有,這限制了許多分析化合物用於建模的有效性。有針對性的方法具有更好的靈敏度,但由於預先定義了一組代謝物,又大大減少了檢測到的特徵數量,阻礙了新的代謝物的發現。在靶向和非靶向方法中,即使是對已確定的化合物,對產生它們的生物過程往往也知之甚少。此外,儘管在非常大的樣本量上進行了試驗,但代謝組學時鐘已被證明比其他組學資料型別具有更低的年齡預測精度,而且對衰老特徵的效應是中等的。因此,代謝組學資料中的噪聲可能會限制它們目前在衰老研究中的效用。

儘管存在這些挑戰,新陳代謝和衰老之間的緊密聯絡為進一步研究代謝組學時鐘提供了理由。與血漿蛋白質組學類似,血漿和尿液代謝組學也攜帶了全身多個組織的資訊,相對於血細胞的甲基化和轉錄組學時鐘,可以增加潛在的代謝衰老資訊。

其他組學

其他新興技術已經開始利用糖鏈、微生物組組成和染色質狀態來構建衰老時鐘,這只是其中的幾個例子。雖然這些型別資料的研究還不夠深入,但它們是未來研究的一個令人興奮的領域。

糖組學

糖鏈是一類多樣的生物分子,在新陳代謝、細胞訊號轉導、蛋白質和RNA功能中發揮重要作用,是體內許多結構的組成部分。全面識別和量化人體內的各種糖鏈結構仍然極具挑戰性,隨著年齡的增長,糖鏈會發生廣泛的變化,然而糖鏈的變化在衰老過程中還未被充分認識。雖然目前還不可能全面地研究糖鏈,但最近的質譜研究只檢查了少數幾個經過充分研究的糖鏈濃度,就已經能夠準確地預測時序年齡和衰老表型。Kriti等人在多個歐洲佇列中觀察到血清IgG N-糖基化變化,且可以預測年齡。此外,IgG糖鏈年齡與代謝健康的臨床標誌物相關。在進一步的研究中,IgG N-糖基化與健康的代謝指標,包括胰島素水平、體重指數、甘油三酯水平和II型糖尿病有進一步的聯絡。Merleev等人使用質譜方法檢測了血漿中17種常見糖蛋白上159個糖鏈濃度,也顯示出作為衰老時鐘的希望,儘管結果還未在獨立佇列中得到驗證,也未與任何衰老表型相關。

微生物組組成

過去十年的研究表明,腸道微生物組的組成隨著年齡的增長而變化,長壽的人與普通老年人的微生物組組成不同,某些微生物及其產生的代謝物對人類健康有益。儘管它與健康和長壽有著密切的聯絡,但構建基於微生物群落的衰老時鐘一直是一項挑戰。Galkin等使用深度神經網路模型從腸道微生物組組成預測時序年齡。他們的時鐘與其他組學模式訓練的時鐘具有相似的準確性,在一個單獨的佇列中,微生物組時鐘預測I型糖尿病患者明顯年齡更大。他們還觀察到,某些經過充分研究的有益微生物(如Akkermansia muciniphila)的丰度對年齡預測模型的影響比檢測到的大多數其他微生物更大。

染色質標記和染色質狀態

雖然CpG甲基化已被廣泛研究,但染色質結構、狀態或構象隨年齡的其他表觀遺傳變化尚未被徹底研究。這在很大程度上可能是由於批次染色質可及性和染色質構象捕獲分析的複雜性和噪聲造成的,這些分析受到樣品之間的細胞成分差異和其他批次效應的強烈影響。儘管如此,染色質狀態的變化與早衰症(核纖層及其相關的異染色質結構都會遭到破壞)密切相關。這些變化被假設為是正常衰老的一個重要驅動因素,這使其成為未來研究的一個有趣領域。衰老免疫細胞的染色質可及性研究表明,CD8+ T細胞的染色質可及性隨年齡的變化而改變。事實上,這些變化可能會導致免疫細胞組成隨年齡的變化而變化,導致nave T細胞的喪失,並向更分化和功能失調的細胞狀態轉變。染色質可及性分析的進展將使未來在大樣本、純化細胞群和單細胞中的研究成為可能,這將進一步闡明染色質狀態在衰老過程中的作用。

鑑於甲基化時鐘的重要性,在衰老時鐘領域,CpG甲基化和染色質狀態之間的聯絡尚需更多研究。血液細胞中的甲基化水平已被觀察到與細胞組成密切相關,這可能是年齡改變染色質狀態的結果。此外,研究表明,CpG甲基化狀態的改變可以選擇性地改變與核層異染色質的聯絡,這可能是導致衰老的一個驅動因素。多組學衰老時鐘可以進一步剖析這種關係是未來研究的一個令人興奮的領域。

【重磅綜述】利用組學大資料評估人的生物學年齡

圖3 2008-2021年衰老時鐘研究的主要進展和研究的時間表。在2008年至2021年間組學技術使衰老時鐘研究領域向前推進。值得注意的是,這並不是重要研究或技術的完整列表。時間軸是指根據PubMed的出版日期。GH,生長激素;DHEA,脫氫表雄酮;DNAm,DNA甲基化;RNA-seq,RNA測序。

比較不同的時鐘

由於基於不同分子資料型別和多種機器學習模型構建的時鐘數量不斷增加,瞭解不同時鐘之間的相互關係以解析它們捕獲的衰老訊號對該領域來說變得越來越重要。很少有整合分析比較不同時鐘之間的生物年齡估計,但確實存在的少數比較表明,組學層次內和跨組學層次普遍缺乏一致性。

儘管這些大部分來自血細胞的模型都是根據個體的年齡進行建模和訓練的,但第一代表觀遺傳時鐘(Hannum, Horvath, Lin, Weidner, Vidal-Bralo)的年齡差距似乎在彼此之間只有輕微的相關性(r = 0。1-0。5)。這可能是由於DNA甲基化陣列中存在較大的噪聲,限制了在資料集上應用這些模型的穩健性。最近的一項分析表明,在增加樣本量的基礎上訓練第一代甲基化時鐘可以將年齡預測精度提高到幾乎完美的水平,消除了年齡差距和生物衰老之間的關聯,支援噪聲作為這些模型中的重要因子。這一發現表明,這些生物鐘中的年齡差距並不主要由生物衰老訊號驅動。第二代死亡率最佳化時鐘(Zhang, PhenoAge, GrimAge)中的年齡差距也只是輕微相關。然而,它們通常與不同佇列的生理衰老和死亡率有更密切的聯絡,需要做更多的工作來了解它們捕捉到的衰老生物學的具體特徵。

不同型別的組學衰老時鐘中,許多時鐘是獨特的。Peters等人的轉錄組年齡差距與Horvath和Hannum clocks的不同生物衰老指標相關;Tanaka等人的血漿蛋白質組年齡差距與Horvath時鐘無關,與GrimAge和物候時鐘的相關性較低;Robinson等人的代謝組學年齡差距與同一佇列中的Horvath、Hannum和物候時鐘沒有相關性,但年齡差距與被測表型之間的相關性有重疊。在一項多組學研究中,作者在單個佇列中構建了自己的端粒、表觀遺傳學、蛋白質組學和代謝組學時鐘,發現表觀遺傳學和轉錄組學時鐘年齡差距之間以及蛋白質組學和代謝組學時鐘年齡差距之間存在輕度相關性。有趣的是,表觀遺傳年齡差距與蛋白質組學和代謝組學年齡差距沒有相關性,強調不同的組學技術可能捕捉不同的衰老訊號。在未來,評估驅動時鐘的生物機制對於評估其相對效用至關重要。將多個組學層合併到複合模型中的多組學衰老時鐘也將有助於瞭解哪些分子衰老特徵在組學層之間共享或攜帶不同的表型資訊。

從上述研究中可見,第一代表觀遺傳鐘似乎主要捕捉到了與時間相關的訊號,而第二代表觀遺傳鐘和其他組學衰老鍾捕捉到了更多生理相關的衰老訊號。基於不同分子特徵的時鐘之間的相關性相當低,不同的生物衰老方面的敏感性進一步強調了時鐘間的差異(圖4)。

【重磅綜述】利用組學大資料評估人的生物學年齡

圖4 時鐘年齡差距與衰老表型之間的關聯。年齡差距(頂部)是大多數衰老時鐘的主要衡量指標。不同衰老時鐘的年齡差距對各種衰老表型表現出不同的敏感性,這表明它們可能在不同程度上衡量衰老生物學的不同方面。甲基化時鐘對死亡率非常敏感,而轉錄組學、蛋白質組學和代謝組學時鐘對衰老表型疾病的敏感性增加。

未來展望

衰老時鐘有望為深入瞭解衰老的生物學過程提供思路,併成為指導未來衰老治療應用的潛在臨床工具。為了在這些方面取得進展,需要進一步考慮和完善四個概念。首先,時鐘需要根據其測量內容進行調整(例如,細胞、組織或有機體的年齡和功能);其次,為了獲得最佳的時鐘效能和生物學相關性,可能需要使用多種分子模式和功能資料;第三,我們需要在理解時鐘在多大程度上衡量相關或因果衰老過程方面取得進展;第四,必須更好地理解時間和年代在建模中的作用。

定義衰老時鐘的應用

大多數衰老時鐘是根據血液和面板細胞的分子特徵開發的,然後對整個生物體的生物年齡進行估計。雖然這些時鐘在組織和有機體功能或死亡率上有令人驚訝的擬合效果,但為特定細胞或組織功能建模的時鐘在測量衰老和揭示生物學方面可能更強大。

在這方面,越來越清楚的是,在個體之間和單個個體內部,老齡化都有相當的複雜性和差異(圖5)。最近對人類進行的一項縱向多組學研究確定了四種人群水平的老齡化途徑,這些途徑在富集與肝臟、腎臟、代謝和免疫功能障礙相關的生物通路的個體中可見。作者還觀察到,個體水平與人群水平老齡化趨勢有相當大的偏差,這主要是因為個體存在不同的衰老速率和老齡化機制的差異。對大鼠的研究發現,不同器官和細胞型別的轉錄組具有截然不同的衰老軌跡。對人體組織的超微結構研究也顯示了類似的結果,甚至不同的人腦區域隨著年齡的增長表現出不同的基因表達軌跡。在細胞水平上,細胞衰老的研究表明,組織中的一些細胞比其他細胞更早衰老,它們分泌的因子甚至可能透過血液介導的細胞通訊刺激區域性或其他組織中其他細胞的衰老。綜上所述,這些觀察結果支援了這樣一種觀點,即衰老時鐘需要更有針對性地利用衰老的有機體複雜性。

【重磅綜述】利用組學大資料評估人的生物學年齡

圖5 測量全身衰老。衰老在個體間(左)和個體內(中)水平不同。不同組織以不同速率,透過不同的機制衰老。心臟、大腦、免疫或代謝組織會在不同的個體中經歷不同程度的衰老,這些個體可能會發展出特別影響這些組織的衰老疾病,但身體其他部位功能仍然正常。即使在單個組織中,不同的細胞也會以不同的速率衰老(右)。衰老細胞是細胞衰老表型的例子,它對不同的器官和細胞型別(如巨噬細胞、內皮細胞和膠質細胞)產生不同程度和速率的影響。衰老細胞可能透過分泌促衰老因子加速其他細胞的衰老,某些細胞可能更容易受到其環境中促衰老因子的影響。

測量衰老的理想分子特徵

由於基於不同組學模式的衰老時鐘通常不一致,並且沒有明確的真正的生物衰老指標來評估它們,現在說哪種分子型別可能是生物年齡和衰老速率的最佳預測因子還為時過早。顯然,瞭解時鐘中單個的生物學特性在合理化衰老測量的有效性方面具有優勢,在這方面,轉錄組和蛋白質組可能是最有用和可驗證的。蛋白質組還有幾個額外的優勢,它們通常是生物過程的直接介體,並且構成了目前疾病中絕大多數的藥物靶點。此外,它們在許多與老齡化相關的情景,尤其是在心臟、腎臟、肝臟、代謝、炎症和神經退行性疾病中,顯示出巨大的臨床實用性和作為預後生物標記物的前景。因此,與染色質標記和RNA轉錄物等其他分子特徵相比,蛋白質作為臨床生物標誌物已被廣泛青睞。例如,在神經退行性疾病病理學中破壞蛋白質穩態的首要地位表明,蛋白質組衰老時鐘可能為大腦衰老提供獨特的見解。

瞭解相關性和因果關係

最後,當前的衰老時鐘都是相關的統計模型。它們不能洞察衰老的因果關係,但可以闡明可驗證的假設,並支援或反駁分子衰老的其他觀察結果。然而,即使具有相關性,在評估衰老時鐘時也必須小心,因為僅僅評估它們能否準確地預測時序年齡是不夠的。事實上,如甲基化時鐘部分所強調的那樣,使用年齡作為唯一的指南可能會產生誤導。因此,在這裡選擇不關注時鐘的年齡預測準確性,而是關注評估可以透過時鐘的年齡差距來衡量哪些生物衰老表型。

為了超越相關性,該領域需要在實驗測試衰老時鐘背後的分子機制方面取得進一步進展。特別是對於表觀遺傳時鐘,關於時鐘CpG位點的改變如何影響基因表達和年齡相關生理學的下游變化,人們知之甚少。表觀遺傳重程式設計的新證據表明,CpG甲基化可能是這一系列變化的誘因,Lu等人發現,小鼠視網膜細胞的表觀遺傳重程式設計需要DNA甲基化酶,但還需要更多的工作。轉錄組和蛋白質組時鐘具有潛在優勢,因為它們更適合於基因篩查方法,並且已知一些因果途徑。現代人類遺傳學方法,如遺傳共定位和孟德爾隨機化,也可用於測試衰老時鐘模型中的因果關係。隨著大規模佇列中分子性狀的數量性狀位點研究和衰老時鐘的全基因組關聯研究變得更加穩健,期望這些方法的應用能夠進一步闡明使衰老時鐘指標轉動的分子齒輪。

超越實際年齡

雖然迄今為止開發的許多衰老時鐘僅使用按實際年齡來訓練模型,但該領域正在透過將額外的特定衰老表型或衰老生物學納入特徵選擇和模型訓練而不斷超越。最突出的是第二代甲基化時鐘的成功,該時鐘將實際年齡與各種生物學特徵相結合,以提高其在特定環境中的預測能力。PhenoAge時鐘在臨床化學的死亡風險因素和年齡上進行了訓練。GrimAge時鐘採用了類似的方法,但直接在臨床蛋白質標記物和每年吸菸量上訓練甲基化時鐘,然後將其輸出與年齡和性別結合到Cox比例風險模型中,以預測死亡率。有趣的是,這兩個模型都用已知的疾病生物學訓練了血漿蛋白質和代謝物的估計器,再次指出了血漿是未來研究的沃土。Yang等人和Lu等人採取了不同的方法,分別對細胞特徵(有絲分裂和端粒長度)進行時鐘訓練,以開發對細胞衰老這些方面具有特定敏感性的模型。

Nelson等人最近的一項模擬研究支援訓練這些複合模型的基本原理,表明第一代甲基化衰老時鐘在識別因果衰老位點方面比隨機因素會更差,這是由於橫斷面衰老佇列中發生的佇列選擇效應。此外,他們表明,隨著年齡的增長,因果衰老特徵的表現往往會變得越來越少,因為不健康的老年人由於死亡或健康問題而無法參與研究,因此不太可能被納入研究。然而,與生理年齡時鐘方法一樣,納入關於死亡率的額外生物資訊的方法能夠糾正這種影響,並以更高的頻率選擇因果位點。

透過有目的的特徵選擇或透過開發複合訓練指標來結合衰老生物學的特定方面的建模,有助於提高模型的可解釋性並指導它們識別導致衰老的特徵。最近的一系列研究透過分析免疫細胞和炎症標誌物來開發一種免疫衰老時鐘來預測死亡率、心血管結果和免疫衰老。作者使用來自時鐘的資訊將 CXCL9鑑定為免疫衰老的潛在因果調節因子,並透過細胞模型中的功能跟蹤驗證了這一結果,這進一步證明了這些混合方法發現衰老的因果調節因子的能力。

也許更接近測量衰老生物學的更大膽的方法是在時鐘訓練中排除實際年齡。事實上,實際年齡是生物學差異的最大來源之一,因此,無偏捕捉資料變化的模型最有可能捕捉衰老訊號。基於主成分分析的生物年齡估計器已證明了這一概念,該估計器涉及無監督降維以無偏地識別衰老訊號,似乎甚至優於按時間順序排列的時鐘。當涉及到從具有深度和廣度的特徵、樣本數和物種的大型資料集中發現進化保守的衰老特徵時,先進的機器學習模型(如神經網路)可能是降維的特別強大的工具。事實上,由於衰老的基本生物學過程在許多壽命差異大的物種中在很大程度上是保守的,所以測量普遍的衰老原因或衰老速度的時鐘應該無處不在。此外,由於這些模型將不再受時間的阻礙,它們可能會揭示使用傳統時鐘無法發現的衰老生物學的新原理。因此,這些新模型可能被稱為“年齡計”,而不是“時鐘”(根據定義測量時間)。

最後,值得注意的是,迄今為止建立的絕大多數衰老時鐘都沒有根據縱向資料進行訓練,也沒有直接預測未來的衰老速率,這一缺陷可能會限制其當前的臨床實用性和解釋力。設計用於使用縱向測量專門估計衰老速率的時鐘尤其有前景,這仍然是一個嚴重未被探索的前沿領域。

結 論

組學革命揭示了衰老生物學的絕對複雜性,顯示了成千上萬的分子特徵隨年齡變化。衰老時鐘是一個激動人心的前沿領域,可以充分利用組學資料,將衰老生物標誌物的研究範圍擴大幾個數量級。該領域已經表明,可以從多種組學資料中開發出穩健的年齡估計器,這促進了對生物學的理解,並提高了開發精確診斷和替代終點的希望,以測試抗衰老幹預的有效性。

由DNA甲基化資料、轉錄組學、蛋白質組學和代謝組學構建的衰老時鐘都證明了識別生物衰老新生物標記物的能力,在不久的將來,其他組學模式可能也會發揮同樣的作用。越來越多的研究人員使用多組學技術對佇列進行分析,未來將多組學納入衰老時鐘的努力將進一步擴大對衰老分子特徵的認識,並可能擴大這些模型的預測能力。將生理學和組織功能直接納入衰老時鐘模型的方法也被證明是富有成效的,擴充套件這種方法可能會在未來產生更多可解釋和可操作的見解。

機器學習工具的不斷進步將提高在組學資料中識別相關衰老特徵的複雜性。能夠區分更復雜、非線性衰老過程的模型是未來研究的一個激動人心的領域。例如,Lehallier等人證明,血漿蛋白質在三種非線性衰老“波”中發生變化;同樣,血細胞或面板中的表觀遺傳和其他分子特徵在整個生命週期中以明顯的波動模式變化。同樣重要的是,細胞和組織以不同的速度衰老,未來的衰老時鐘研究可以受益於他們打算測量衰老的哪些方面:個體的整體器官年齡,來預測死亡率,或者心臟、肺或大腦的年齡,以更深入地瞭解衰老的特定疾病。鑑於老齡化帶來的巨大疾病負擔,很明顯,衰老時鐘將為推動衰老研究及精準醫療策略開發方面發揮重要作用。

【重磅綜述】利用組學大資料評估人的生物學年齡

原標題:《【重磅綜述】利用組學大資料評估人的生物學年齡》

Top