7月17日,由百度智能云主辦的“千帆思享會·生命科學(xué)專場”在深圳舉行,來自暨南大學(xué)生命科學(xué)技術(shù)學(xué)院、百圖生科、中晟全肽、一葦資本等科研院所、生物醫(yī)藥企業(yè)及投資機(jī)構(gòu)的行業(yè)代表出席活動,共話生科領(lǐng)域前沿技術(shù)與產(chǎn)業(yè)趨勢。會上,由百度螺旋槳PaddleHelix團(tuán)隊研發(fā)的HelixFold-S1推理模型正式亮相,該模型通過創(chuàng)新性的“接觸感知采樣策略”,首次將結(jié)構(gòu)預(yù)測的精度和效率提升至全新水平,標(biāo)志著蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)邁入“高效可控”的新階段。

會議同期,百度智能云全新推出基因測序存-算-分一體化方案,基于計算存儲產(chǎn)品優(yōu)化,結(jié)合百度網(wǎng)盤優(yōu)勢,提升基因測序全流程效率及客戶體驗,為產(chǎn)業(yè)上下游提供高效研發(fā)支持。

超越谷歌AlphaFold 3:

從“廣撒網(wǎng)”到“精準(zhǔn)制導(dǎo)”?,重構(gòu)生物醫(yī)藥研發(fā)范式?

當(dāng)前,生命科學(xué)與醫(yī)療健康領(lǐng)域是AI技術(shù)最重要的應(yīng)用試驗場之一。從蛋白質(zhì)結(jié)構(gòu)預(yù)測到基因測序分析,從藥物研發(fā)到精準(zhǔn)醫(yī)療的創(chuàng)新突破,AI正以前所未有的深度和廣度重塑生命科學(xué)的研發(fā)范式,成為全球科研與產(chǎn)業(yè)的核心增長極。

生命活動依賴于蛋白質(zhì)與化合物、RNA、抗原抗體等生物分子間的精準(zhǔn)結(jié)合,解析分子間的三維結(jié)構(gòu)是藥物設(shè)計、疫苗研發(fā)等場景的核心。數(shù)年來,蛋白質(zhì)結(jié)構(gòu)預(yù)測始終是生命科學(xué)領(lǐng)域的重大機(jī)遇和挑戰(zhàn)。盡管國內(nèi)外已有多款生物分子結(jié)構(gòu)預(yù)測模型能夠較為準(zhǔn)確地預(yù)測單個蛋白質(zhì)和復(fù)合體間的結(jié)構(gòu),但像AlphaFold3這類模型,大多依賴大規(guī)模盲采的傳統(tǒng)方法,即通過“廣撒網(wǎng)”生成海量結(jié)構(gòu),再從中篩選最優(yōu)解,面對缺乏共進(jìn)化信息的新型分子或復(fù)合物的結(jié)合模式未見過的情況時,常因方向不明導(dǎo)致冗余采樣與預(yù)測失敗,預(yù)測效率低、精度不足。

為了解決這一難題,百度螺旋槳團(tuán)隊基于HelixFold3框架,借鑒了大語言模型中的“Test-time Scaling”思想,創(chuàng)新性地引入了“接觸感知采樣策略”,推出生物領(lǐng)域首個Test-time Scaling的高效推理模型——HelixFold-S1,有效突破了AlphaFold3等模型在高難場景下的精度與泛化瓶頸。

據(jù)介紹,該模型能夠預(yù)測分子間結(jié)合概率,優(yōu)先探索高潛力結(jié)合區(qū)域,通過“先鎖定目標(biāo),再精準(zhǔn)建?!钡姆绞剑珳?zhǔn)引導(dǎo)結(jié)構(gòu)生成過程,顯著提升了復(fù)雜場景下的預(yù)測準(zhǔn)確率和效率,增強(qiáng)了模型在極具挑戰(zhàn)性樣本上的魯棒性和泛化能力,為靶點(diǎn)識別、疫苗設(shè)計等科研任務(wù)提供更強(qiáng)力支持。

HelixFold-S1來了!百度智能云驅(qū)動蛋白質(zhì)研究邁入“精準(zhǔn)高效”新階段真正能落地的AI結(jié)構(gòu)模型:

能力更強(qiáng)、應(yīng)用更廣,深度賦能科研與產(chǎn)業(yè)創(chuàng)新

得益于接觸感知采樣策略,HelixFold-S1 在性能上實現(xiàn)了突破性提升。在實際測試中,HelixFold-S1普遍比前代模型表現(xiàn)更好,在較難的抗原抗體場景上提升尤為明顯,實測數(shù)據(jù)顯示,對比base版本,HelixFold-S1在該場景下預(yù)測精度提升58%,對比Chai-1和Boltz-2分別提升80%和56%。同時,隨著取樣步數(shù)的增加,HelixFold-S1獲取更優(yōu)質(zhì)構(gòu)象的概率也在不斷增加,相比其他方法提升空間更顯著。

HelixFold-S1來了!百度智能云驅(qū)動蛋白質(zhì)研究邁入“精準(zhǔn)高效”新階段

HelixFold-S1不僅為生命科學(xué)領(lǐng)域帶來了一種更聰明、更高效的結(jié)構(gòu)預(yù)測范式,也為抗體改造、蛋白設(shè)計、藥物篩選等多個科研與臨床場景帶來了更多高效、低成本的技術(shù)解決方案,有效加速科研建模進(jìn)程、降低藥物開發(fā)成本,推動行業(yè)向智能化、精準(zhǔn)化方向發(fā)展。

在藥物研發(fā)領(lǐng)域,傳統(tǒng)的藥物設(shè)計多采用實驗試錯法,不僅成本高,原理也常常依賴實驗反推。中晟全肽在多肽藥物研發(fā)領(lǐng)域深耕多年,依托百度螺旋槳PaddleHelix領(lǐng)先的算法能力,能在實驗前設(shè)計出更有可能有效的多肽藥物,極大提升研發(fā)效率、降低研發(fā)成本。

在科研領(lǐng)域,百度智能云與暨南大學(xué)圍繞國際人類蛋白質(zhì)組計劃C-HPP展開深度合作,通過HF3算法解析超過3千個人類蛋白質(zhì)結(jié)構(gòu),與實際晶體結(jié)構(gòu)對比,效果顯著,打破了國際上對蛋白質(zhì)結(jié)構(gòu)預(yù)測算法的壟斷,深受國際權(quán)威學(xué)研界認(rèn)可。

蛋白質(zhì)設(shè)計平臺HelixDesign發(fā)布:

一體化、高精度、可擴(kuò)展,高效探索廣闊蛋白空間

在蛋白質(zhì)結(jié)構(gòu)預(yù)測的基礎(chǔ)上,有另一個重要研究方向:蛋白質(zhì)設(shè)計。

近年來,隨著AI技術(shù)的飛速發(fā)展,蛋白質(zhì)設(shè)計領(lǐng)域相繼迎來多項重磅成果。這一浪潮之下,百度基于自研高精度結(jié)構(gòu)預(yù)測模型HelixFold3和高性能計算平臺,同步推出了一體化、高精度、可擴(kuò)展的蛋白質(zhì)設(shè)計平臺HelixDesign,賦能大分子藥物發(fā)現(xiàn)、酶設(shè)計等新興賽道。

在生物醫(yī)藥領(lǐng)域,抗體作為關(guān)鍵的治療手段與研究工具,其設(shè)計與開發(fā)始終占據(jù)著核心地位。在過去,要想設(shè)計一個能“黏住”病毒或癌細(xì)胞蛋白的蛋白藥物,流程極為繁瑣,需要經(jīng)過多輪結(jié)構(gòu)建模、人工分析和實驗驗證,耗時數(shù)周到數(shù)月,且驗證上百個候選序列的總成本可達(dá)數(shù)十萬元,成功率卻不到0.1%,嚴(yán)重制約著藥物研發(fā)的進(jìn)程與效率。

近期,百度PaddleHelix團(tuán)隊最新發(fā)布了HelixDesign-Antibody平臺,為抗體設(shè)計領(lǐng)域帶來了革命性的突破。憑借超高通量的蛋白設(shè)計和評估能力,平臺能夠設(shè)計出結(jié)合能力優(yōu)于野生型的候選蛋白,且在新穎性、多樣性上更具優(yōu)勢。目前,HelixDesign在整體性能上已與 DeepMind、MIT和Chai-2等國際先進(jìn)工作保持相當(dāng)水平。

HelixFold-S1來了!百度智能云驅(qū)動蛋白質(zhì)研究邁入“精準(zhǔn)高效”新階段

百度智能云泛科技業(yè)務(wù)部總經(jīng)理張瑋表示:未來,百度智能云將持續(xù)深耕AI for Science領(lǐng)域,為行業(yè)帶來更多高效、創(chuàng)新性解決方案,加速科研成果向產(chǎn)業(yè)應(yīng)用轉(zhuǎn)化,為生命科學(xué)產(chǎn)業(yè)的創(chuàng)新發(fā)展注入強(qiáng)勁動力。