日韩欧美亚洲一区,亚洲一区二区精品,在线观看国精产品一区,蜜臀99久久精品久久久久小说

微軟開源EvoDiff新型蛋白質生成人工智能 核心是6.4億參數模型

微軟開源EvoDiff新型蛋白質生成人工智能 核心是6.4億參數模型

本周,微軟推出了一個通用框架EvoDiff,該公司聲稱可以根據給定的蛋白質序列生成“高保真”、“多樣化”的蛋白質。與其他蛋白質生成框架不同,EvoDiff 不需要任何有關目標蛋白質的結構信息,省去了通常最費力的步驟。

微軟高級研究員 Kevin Yang 表示,EvoDiff 是開源的,可用于創建用于新療法和藥物輸送方法的酶,以及用于工業化學反應的新酶。

“我們設想 EvoDiff 將擴展蛋白質工程的能力,超越結構-功能范式,轉向可編程、序列優先的設計,”EvoDiff 的聯合創始人之一楊向媒體表示,“通過 EvoDiff,我們證明我們實際上可能不需要結構,而是‘蛋白質序列就是你所需要的’來可控地設計新蛋白質。”

EvoDiff 框架的核心是一個包含 6.4 億個參數的模型,該模型根據來自所有不同物種和蛋白質功能類別的數據進行訓練。(“參數”是從訓練數據中學習的 AI 模型的一部分,本質上定義了模型解決問題的技能 – 在本例中生成蛋白質。)訓練模型的數據來源于用于序列比對的 OpenFold 數據集UniRef50,UniProt 數據的子集,UniProt 聯盟維護的蛋白質序列和功能信息數據庫。

EvoDiff 是一種擴散模型,其架構類似于許多現代圖像生成模型,例如穩定擴散和DALL-E 2。EvoDiff 學習如何逐漸從幾乎完全由噪音組成的起始蛋白質中減去噪音,使其慢慢地、一步一步地接近蛋白質序列。

微軟開源EvoDiff新型蛋白質生成人工智能 核心是6.4億參數模型
EvoDiff 生成蛋白質的過程。圖片來源:?Microsoft EvoDiff

擴散模型已越來越多地應用于圖像生成之外的領域,從設計新型蛋白質(如 EvoDiff)到創作音樂甚至合成語音。

“如果要從 EvoDiff 中汲取一件事,我認為我們可以而且應該通過序列進行蛋白質生成,因為我們能夠實現通用性、規模化和模塊化,” EvoDiff 的另一位共同貢獻者、微軟高級研究員 Ava Amini 表示,“我們的擴散框架使我們有能力做到這一點,并控制我們如何設計這些蛋白質以滿足特定的功能目標。”

Amini 認為,EvoDiff 不僅可以創造新的蛋白質,還可以填補現有蛋白質設計中的“空白”。例如,如果蛋白質的一部分與另一種蛋白質結合,模型可以圍繞該部分生成滿足一組標準的蛋白質氨基酸序列。

由于 EvoDiff 在“序列空間”而不是蛋白質結構中設計蛋白質,因此它還可以合成最終不會折疊成最終三維結構的“無序蛋白質”。與正常功能蛋白質一樣,無序蛋白質在生物學和疾病中發揮著重要作用,例如增強或降低其他蛋白質活性。

原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/582034.html

AI的頭像AI認證作者

相關推薦

發表回復

登錄后才能評論
主站蜘蛛池模板: 天长市| 镇原县| 许昌县| 南平市| 双峰县| 峨山| 柳州市| 孟津县| 凉城县| 蓬莱市| 泸西县| 老河口市| 庆元县| 嵩明县| 正镶白旗| 蛟河市| 郎溪县| 彰化市| 营口市| 宜阳县| 翁牛特旗| 株洲市| 库伦旗| 贵阳市| 昌黎县| 清新县| 乾安县| 武鸣县| 南华县| 共和县| 鄂尔多斯市| 广平县| 卓尼县| 鄯善县| 紫云| 陇南市| 绩溪县| 荥经县| 博湖县| 台东市| 温州市|