大規(guī)模蛋白質組學研究能夠深化對健康和疾病的理解,但現(xiàn)有研究仍集中于有限的疾病結局,蛋白與健康和疾病之間的關系仍然存在許多未解之謎。疾病相關的蛋白質是特異性的還是共同的?這些蛋白質能否啟示疾病的生物學分類?它們能否作為疾病預測和診斷的生物標志物及潛在的治療靶點?
2024年11月22日,復旦大學附屬華山醫(yī)院郁金泰、毛穎團隊與復旦大學類腦智能科學與技術研究院程煒、馮建峰團隊合作,在國際頂尖學術期刊 Cell 在線發(fā)表了題為:Atlas of the plasma proteome in health and disease in 53,026 adults 的研究論文。
這項研究全面繪制了人類健康與疾病蛋白質組圖譜,并結合人工智能大數(shù)據(jù)分析方法,構建了疾病診斷預測模型以及發(fā)現(xiàn)了26個藥物治療新靶點,為精準醫(yī)學的實施提供了重要科學依據(jù)。
該研究于2025年1月9日,登上了 Cell 期刊封面,該封面描繪了一個由蛋白質構成的人類,正在借助人工智能(由芯片和二進制代碼代表)的幫助來檢查自己的健康狀況(通過心電圖監(jiān)測界面來體現(xiàn))。
封面圖片來自郁金泰、程煒
該研究的核心突破:
該研究通過深入分析53026名個體的血漿蛋白質組數(shù)據(jù),納入了2920種血漿蛋白質與406種既往患病、660種隨訪新發(fā)疾病以及986種健康相關特征,跨越了14.8年的中位隨訪期,揭示了168100個蛋白質-疾病關聯(lián)和554488個蛋白質-表型關聯(lián)。研究中發(fā)現(xiàn)超過650種蛋白質與至少50種疾病存在聯(lián)系,而超過1000種蛋白質表現(xiàn)出性別和年齡的異質性,這些發(fā)現(xiàn)深化了對疾病間共享和特異分子機制的理解,揭示了不同人群在疾病易感性上的差異。
人類健康與疾病血漿蛋白質組圖譜
研究團隊發(fā)現(xiàn)免疫系統(tǒng)相關通路在絕大部分疾病中富集,強調了炎癥在人類健康中的重要作用。此外,對不同疾病之間的生物學通路的比較完善了對疾病病理生理學相似性和異質性的理解。例如,阿爾茨海默?。ˋD)和血管性癡呆(VaD)相關的蛋白質在與神經系統(tǒng)相關的共同通路中富集,而AD特異性通路大多與脂質代謝有關,VaD特異性通路與心肌有關。傳統(tǒng)的疾病分類策略通?;谙嗨频呐R床癥狀和表型特征,而忽略了共同的分子病因。利用蛋白質組學特征對660種疾病進行聚類,能夠根據(jù)其共享的生物學特性將這些疾病聯(lián)系起來,從而重新審視疾病的類別和亞型。例如,各種癡呆亞型被劃分到同一疾病亞群,該亞群還包含精神、內分泌、心血管等系統(tǒng)疾病,基于此,研究團隊進一步揭示了該亞群的特征性生物學功能,將生物學上相關的疾病聯(lián)系在一起,有助于解釋為何患者身上會同時出現(xiàn)看似不相關的癥狀,并進一步加深對機制的理解和提高治療的有效性。
血漿高通量測序蛋白質數(shù)據(jù)存在復雜交互作用,往往難以單獨處理,而人工智能算法,能夠高效提取關鍵特征,構建精確預測/診斷模型。研究團隊利用機器學習等人工智能大數(shù)據(jù)分析技術,識別出了具有潛在診斷和預測價值的生物標志物,發(fā)現(xiàn)基于蛋白質的模型在183種疾病中的AUC值超過0.80,明顯優(yōu)于基于人口統(tǒng)計學的模型,將有助于提高疾病的早期診斷率。
值得一提的是,GDF15被發(fā)現(xiàn)是預測和診斷多種疾病的關鍵蛋白,其在對200種疾病的預測中的重要度均排名榜首,這表明GDF15在疾病的早期識別和風險評估中具有重要作用,可能成為一個重要的生物標志物。此外,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多個疾病中表現(xiàn)出良好的預測和診斷性能,表明它們在多種生物過程中發(fā)揮著核心作用,具有廣泛的臨床應用潛力。
對歷史藥物開發(fā)項目數(shù)據(jù)的評估顯示,有遺傳證據(jù)支持的靶點-適應癥對在藥物開發(fā)中更有可能獲得成功。該研究通過整合蛋白質數(shù)量性狀位點(pQTL)和疾病全基因組關聯(lián)研究(GWAS)數(shù)據(jù),使用孟德爾隨機化分析(MR)確定了474個具有潛在因果關聯(lián)的蛋白質-疾病對。通過檢索DrugBank和Therapeutic Target Database中的藥物靶點信息以及進行安全性評估,該研究提供了對25個已知靶點的37種潛在藥物重新利用機會,并確立了26個具有治療潛力且安全性良好的新靶點,為老藥新用和新藥開發(fā)提供了重要線索。
為了進一步推動科學研究和精準醫(yī)療的發(fā)展,該研究建立了一個可開放訪問的蛋白質組-表型組資源數(shù)據(jù)庫Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。
這個數(shù)據(jù)庫不僅有助于科學家們更好地理解疾病的生物學機制,還將加速疾病生物標志物、預測診斷模型和治療靶點的開發(fā),為精準醫(yī)學的實施提供強有力的支持。
Proteome-Phenome Atlas數(shù)據(jù)庫首頁
總的來說,這項研究繪制的人類健康與疾病蛋白質組圖譜揭示了血漿蛋白在疾病診斷、預測和治療中的潛在應用價值。該研究為臨床實踐提供了科學依據(jù),有助于疾病的早期檢測、精準分層和個性化治療。
未來,基于這一開放獲取的蛋白質組學圖譜,研究人員將能夠更深入地探索疾病發(fā)病機制,推動生物標志物和預測/診斷模型開發(fā),并探尋全新治療靶點,為精準醫(yī)學發(fā)展奠定了基礎。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(24)01268-6
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com