国产在线精品一区二区三区直播_精品国产乱码久久久久久影片_欧美老妇人与禽交_男人天堂2018手机在线版_亚洲中文精品久久久久久不卡_国产毛多水多做爰爽爽爽_野外做受三级视频_中文天堂在线www_国产精品无码久久四虎_国产在线观看免费人成视频

您的位置:首頁 >關(guān)注 >

《科學》:蛋白設(shè)計技術(shù)革命!生化大牛David Baker團隊顛覆蛋白設(shè)計方法,通過強化學習逆向從頭創(chuàng)造全新蛋白

《科學》雜志發(fā)表了來自蛋白質(zhì)學大牛David Baker團隊的新論文,研究者們提出了一種“Top-Down”的基于強化學習的蛋白設(shè)計新思路。與以往不同,這并非是指揮AI修飾優(yōu)化現(xiàn)有結(jié)構(gòu)、組裝所需功能蛋白,而更接近于告訴AI,我要一個xxx功能的蛋白,去做!

在實驗中,Top-Down思路不僅設(shè)計出了先前技術(shù)完全達不到蛋白結(jié)構(gòu),其產(chǎn)物還具有極強的功能性,對蛋白納米材料、蛋白藥物和疫苗等領(lǐng)域來說不亞于一次技術(shù)革命。

論文題圖


(資料圖片僅供參考)

David Baker其人,非常的牛逼,在這里我也不費勁去給他做傳,偷懶抄抄同事寫過的大牛履歷:

作為蛋白質(zhì)學領(lǐng)域的杰出科學家和領(lǐng)軍人物,David Baker在蛋白質(zhì)折疊預測、蛋白質(zhì)與小分子結(jié)合、自組裝蛋白納米顆粒、蛋白質(zhì)設(shè)計等方向都有著深入研究和眾多貢獻。

早在1998 年時,David Baker及其團隊就開發(fā)出Rosetta平臺來預測蛋白質(zhì)結(jié)構(gòu),基于物理學原理,對蛋白質(zhì)的構(gòu)象進行能量最小化計算,以預測最穩(wěn)定的三維結(jié)構(gòu),并在后續(xù)的時間里不斷拓展Rosetta的應(yīng)用,如蛋白質(zhì)。2008年時,David Baker實驗室還創(chuàng)造性地開發(fā)了蛋白質(zhì)結(jié)構(gòu)預測和設(shè)計的“硬核”小游戲Foldit,動員科研人員、非科研人員一起參與到這個領(lǐng)域。

近幾年,他們研發(fā)的深度算法RoseTTAFold與備受關(guān)注的AlphaFold 2并駕齊驅(qū),僅根據(jù)氨基酸序列即可快速準確地預測蛋白質(zhì)結(jié)構(gòu),成為迄今為止最準確的蛋白質(zhì)結(jié)構(gòu)預測算法之一 。去年,他們推出的深度學習算法ProteinMPNN ,可快速根據(jù)給出的蛋白質(zhì)三維結(jié)構(gòu)“逆推”出可能的氨基酸序列,序列恢復率達52.4%(Rosetta為32.9%)。

總之,學科之光。

這次他們想要做的事情,是完全顛覆此前的蛋白結(jié)構(gòu)設(shè)計方法。

以前的方法,是一種“Bottom-Up”思路,由單體結(jié)構(gòu)開始逐步組裝成寡聚物、復雜的聚合體。這種方法固然有它的有點,比如多個部件可以拆分獨立驗證,主打一個穩(wěn)定。

Bottom-Up思路

但它也有局限性,設(shè)計的終產(chǎn)物范圍被有限的低聚結(jié)構(gòu)限制住了,畢竟只用七巧板,能拼出來的東西也就那么多了。而且這種針對單個亞基來設(shè)計優(yōu)化的方法,也限制了對終產(chǎn)物的整體優(yōu)化。

而Top-Down的思路則是從整體的結(jié)構(gòu)和性能出發(fā),給出所需的結(jié)構(gòu)特性,讓AI進行計算,通過大量模擬蛋白質(zhì)片段組裝,最終尋找到最符合預期的產(chǎn)物。

用昨天剛掉下來的SpaceX打個比方,Bottom-Up要做的是分析總結(jié)哪些馬達發(fā)動機可以用,哪些有問題需要優(yōu)化,迭代做新的;Top-Down要做的是把鋼板螺絲(或者樂高)給AI,然后告訴它,“我要去火星,來做個SpaceX Plus吧!”

Top-Down思路

為了實現(xiàn)全讓AI來的想法,研究者們選擇了強化學習(RL),也就是AlphaGo打敗圍棋大師的機器學習方法。更具體地說,是采用了其中的蒙特卡洛樹搜索算法(MCTS)。在這個算法中,每個分支點都會進行一次評估,并向上返回進行加權(quán),最終得到最優(yōu)的路徑。

用在蛋白設(shè)計上,我們可以理解為,在一個蛋白質(zhì)片段上,依次增加新的蛋白質(zhì)片段,每次增加都參考預期的結(jié)構(gòu)特性來評估并打分,比如蛋白的形狀、大小、孔隙率、末端位置等等,如此逐次模擬,最終獲得在原子級別上,符合預期的精確蛋白結(jié)構(gòu)。

算法思路

如此一來,我們只要給算法提供一些基礎(chǔ)的蛋白質(zhì)片段,然后告訴AI我們想要什么,就夠了。

接下來就是看AI有沒有理解一切了!

研究者提出的第一個難題是設(shè)計一個能填充特定形狀的蛋白。之前他們做過兩個不同大小的蛋白質(zhì)環(huán),現(xiàn)在他們決定讓AI設(shè)計一個能把它倆“粘”在一起中間結(jié)構(gòu),這個結(jié)構(gòu)要能緊緊連住內(nèi)外兩個環(huán),同時還要有足夠的密度,不留下大的空隙。

這是一個Bottom-Up完全做不到的工作。

目的是把這兩個環(huán)組裝成盤

MCTS模擬得到的蛋白結(jié)構(gòu),通過ProteinMPNN設(shè)計了序列,由AlphaFold預測得到了32種符合要求的設(shè)計。其中28種是可溶且可純化的,11種能形成符合預期大小和形狀的顆粒,其中2種的形狀與設(shè)計模型的基本一致。

我們可以看看在冷凍電鏡5.1?分辨率下的終產(chǎn)物之一,與設(shè)計模型不能說像,就是一個一模一樣。

冷凍電鏡下的終產(chǎn)物

研究者認為,這種非自然的形狀可能應(yīng)用于基于納米孔的傳感器。

接下來,研究者使用MCTS設(shè)計了一個二十面體蛋白衣殼,他們的目標是讓這個產(chǎn)物達到其他方法實現(xiàn)不了的小體積和高緊湊性,它的表面還要擁有能連接其他結(jié)構(gòu)的末端。

經(jīng)過一萬次迭代,MCTS最終生成了比之前已知的任何二十面體蛋白質(zhì)序列都更短、孔隙與天然進化的衣殼蛋白相當?shù)漠a(chǎn)物。

該團隊之前也設(shè)計過二十面體衣殼蛋白,并用在了疫苗上

從幾十萬個產(chǎn)物中,研究者最終選擇了368個進行實驗測試,并最終得到了2個非常符合要求的蛋白產(chǎn)物,直徑分別為13nm和10nm,比大多數(shù)病毒衣殼都小得多。

更值得期待的是,它們的表面具有60/120個N/C端融合蛋白拷貝,比他們之前設(shè)計的二十面體蛋白高6倍以上,可以融合到功能蛋白的結(jié)構(gòu)域,形成有生物活性的納米顆粒。

這意味著,它們能夠以更高效的方式易位到細胞核中,為遞送蛋白質(zhì)或DNA提供了新工具。

研究者讓衣殼蛋白融合了血管生成素1的F結(jié)構(gòu)域,話不多說看圖!融合衣殼蛋白的效果比單獨的血管生成素1或者F結(jié)構(gòu)域都好太多。它還比血管生成素1更容易制造、也更穩(wěn)定……

冷凍電鏡下的兩種產(chǎn)物結(jié)構(gòu)

血管生成素1(Ang1),F(xiàn)結(jié)構(gòu)域(Fd)

研究者還給衣殼蛋白融合了流感血凝素(HA),形成了新的流感疫苗,效果也比之前已經(jīng)投放入臨床試驗的前代產(chǎn)品效果更好。

MI15-RC_I_1體積更小、效果更好

以類似的思路,MCTS具有產(chǎn)生任何我們指定的幾何形狀的蛋白的能力。我小小聲預言一句,蛋白學的未來,翻天覆地了!

參考資料:

[1]https://www.science.org/doi/10.1126/science.adf6591

[2]https://www.bakerlab.org/2023/04/20/protein-design-reinforcement-learning/

標簽:

熱門資訊

圖片新聞

精彩新聞