您現在的位置是:首頁 > 網頁遊戲首頁網頁遊戲

Nature|機器學習構建人類血清代謝組參考圖譜

簡介研究人員使用一種廣泛使用的機器學習模型——梯度提升決策樹演算法 (GBDT)A reference map of potential determinants for the human serum metabolome,透過基於可釋方差的

血清化學圖是什麼

血清代謝組的主要研究物件是血清所含有的各種生物標誌物。這些標誌物既可是內源生成,也可由環境中攝取,其中部分標誌物的來源較為清晰,包括高遺傳性的代謝物或可被腸道菌或生活方式 (如吸菸或飲食) 所影響的代謝物,因此,血清代謝組研究對於瞭解多種疾病具有重要意義。

為更進一步瞭解血清代謝物的關鍵決定因素,2020年11月11日,來自以色列Weizmann科學院

Eran Segal

團隊的研究人員在

Nature

雜誌線上發表了題為

Nature

的研究論文,

A reference map of potential determinants for the human serum metabolome

Nature|機器學習構建人類血清代謝組參考圖譜

首先,研究人員對491名健康志願者的血清樣品進行質譜檢測,這些志願者此前的臨床引數、生活方式、膳食狀況、遺傳學及腸道菌特徵已被收集。隨後,研究人員對1251中代謝物進行了非靶向代謝組分析,這些代謝物包括脂質、氨基酸、外源化合物、碳水化合物、多肽、核苷酸以及其他未識別的化合物。大多數代謝物在不同志願者體內都廣泛存在,其中498種代謝物能在所有樣品中能被檢測,1104種代謝物能在50%以上的樣品中被檢測。鑑於475名志願者的血清樣品具有較高質量,因此被用於後續分析。

研究人員使用一種廣泛使用的機器學習模型——梯度提升決策樹演算法 (GBDT)

A reference map of potential determinants for the human serum metabolome

,透過基於可釋方差的系統線性模型預測志願者資料

使用質譜技術對健康志願者的血清樣品進行了深度鑑定,基於志願者的宿主遺傳學、腸道微生物、臨床引數及生活方式等特徵,使用機器學習演算法對血清樣品中一千多種獨特代謝物進行預測,從而揭示了主要代謝物的關鍵決定因素,從而更好地幫助我們瞭解這些代謝物在不同條件下變化機制,從而制定干預措施。

。其中,335個代謝物可被飲食相關特徵所解釋,182個代謝物可被腸道菌相關特徵解釋,因此

【1】

。隨後研究人員檢測代謝物是否富集於主要預測因素 (superior prediction),發現臨床資料能更好地預測血脂、氨基酸及多肽等類別的代謝物,而腸道菌資料能更好預測外源化合物及未識別的化合物等類別的代謝物。也就是說,該模型能識別大量未識別化合物的來源

(圖1a-b)

Nature|機器學習構建人類血清代謝組參考圖譜

圖1

研究人員也構建了預測主要代謝物相對預測效度的模型,發現飲食因素具有最強的預測效度,可推測所有特徵48。9%的引數

該模型對血清代謝物具有較強預測性

。值得注意的是,腸道菌資料具有30。8%的較高預測效度,而生活方式僅佔1。9%,提示

(圖1c)

Nature|機器學習構建人類血清代謝組參考圖譜

圖2。 模型可預測主要代謝物的相對預測

基於此,為進一步驗證該模型的可靠性及可重複性,研究人員使用兩項地域獨立的資料集對該模型的準確性進行確認。這兩個資料集包括一項來自英國TwinsUK Registry的1004名健康志願者的樣品,以及一項來自IMI DIRECT cohort的北歐2型糖尿病患者的245份血清樣品,透過腸道菌資料特徵分別獲得107個或50個代謝物的預測。對來自TwinsUK的107個預測代謝物中,95個可以得到複製,而來自IMI DIRECT的50個預測代謝物中,50個可以得到複製

(圖2)

,說明

腸道菌資料在預測及決定血清代謝物水平上具有重要意義

Nature|機器學習構建人類血清代謝組參考圖譜

圖3

鑑於此前研究關於飲食調控腸道菌的結論

(圖3)

,研究人員比較了飲食或腸道菌對血清代謝物可釋方差的預測,發現

本研究構建的模型可獨立於人群及資料庫採集方式對血清代謝物和腸道菌之間的關聯進行準確預測。

,也就是說,

【2】

為推測每個預測的驅動因素,研究人員使用基於博弈理論最優Shapley值的SHAP分析,發現多種飲食及腸道菌特徵可強烈預測血清代謝物

除了攝取咖啡這一項可同時被飲食及腸道菌預測之外,絕大部分代謝物均可分別被飲食或腸道菌獨立預測,提示飲食及腸道菌的模型具備各自獨立性

。如圖4所示,咖啡攝入可作為比其他飲食特徵更強烈的預測因子來預測血清代謝物中大量外源化合物及未識別化學物的水平,這些代謝物包括黃嘌呤代謝途徑的7-二甲基黃嘌呤 (paraxanthine)。另一個例子為長期攝入魚類食物可準確預測多種血脂水平,如一種在慢性腎疾病患者血清中聚集的CMPF (一種尿毒症毒素),而這種代謝物也被報道可預防及逆轉脂肪變性

腸道菌可獨立於飲食因素來調控這些血清代謝物的生成

Nature|機器學習構建人類血清代謝組參考圖譜

圖4

除此以外,研究人員也使用該模型揭示了遺傳-代謝組的關聯,並從概念上驗證了臨床干預的效度。透過將正常飲食健康志願者進行隨機分組,使其分別攝入全麥麵糰麵包或市售白麵包

(圖4)

,研究人員隨後分別在基線水平及一週干預後檢測志願者的血清代謝物,發現全麥麵糰麵包攝入後,由本研究發現的與全麥麵包正相關的標誌物顯著上升,平均上升1。62倍

【3】

,而與全麥麵包負相關的標誌物平均改變僅0。66倍,而白麵包乾預組未檢測到顯著變化

(圖5a)

(圖5c)

Nature|機器學習構建人類血清代謝組參考圖譜

圖5

總的說來,

(圖5c)

這一實驗證實了本研究構建的預測模型可有效預測不同干預措施後的血清代謝物水平改變。

儘管本文不是檢測血清代謝物的大資料研究,但透過關聯廣泛決定因素,本文提供了一種可揭示迴圈血代謝物的潛在決定因素的預測模型,其中檢測到的許多關聯和相互作用均能有效複製此前報告的結論,證明了這個模型的有效性。而本文也檢測到了大量的新的血清代謝物的關聯及相互作用,能極大地幫助我們瞭解健康和疾病狀態下的分子機制,並幫助我們尋找改變這些血清代謝物水平的新幹預措施。

Top