從神農(nóng)嘗百草,到李時(shí)珍踏遍神州寫(xiě)下《本草綱目》,他們無(wú)一不是在身體力行尋找治病救人的藥。如今,藥物的研發(fā)雖然不必行萬(wàn)里路,卻也一樣要不斷的嘗試,持續(xù)的研發(fā)。
作為國(guó)內(nèi)藥物研發(fā)創(chuàng)新的代表,星藥科技(Galixir)從2019年成立以來(lái)始終在使用尖端人工智能技術(shù)賦能藥物研發(fā)。星藥通過(guò)使用人工智能的前沿算法,結(jié)合計(jì)算化學(xué)、藥物化學(xué)和生物學(xué)的工具及經(jīng)驗(yàn),全方位攻克小分子藥物早期研發(fā)流程中的疑難問(wèn)題,快速發(fā)現(xiàn)活性高、成藥性好且結(jié)構(gòu)新穎的候選分子。在這一過(guò)程中,火山引擎為星藥科技提供了一系列的技術(shù)產(chǎn)品支持,大幅降低了藥物研發(fā)過(guò)程中的算力需求門(mén)檻。
智能時(shí)代的藥物研發(fā)
星藥科技目前已經(jīng)和國(guó)內(nèi)外藥企以及研究機(jī)構(gòu)進(jìn)行了諸多合作,推進(jìn)多個(gè)藥物研發(fā)管線,覆蓋中樞神經(jīng)系統(tǒng)疾病、自體免疫類疾病、腫瘤、呼吸系統(tǒng)疾病等不同疾病領(lǐng)域,作用機(jī)制包括抑制劑和激動(dòng)劑等不同類別。
通過(guò)技術(shù)創(chuàng)新,星藥科技將單個(gè)臨床前藥物研發(fā)管線的成本和時(shí)間大幅降低和縮短,使得同時(shí)儲(chǔ)備多條藥物研發(fā)管線、優(yōu)化整體戰(zhàn)略布局都成為了可能。星藥科技獨(dú)立通過(guò)將蛋白結(jié)構(gòu)建模,分子設(shè)計(jì)、性質(zhì)預(yù)測(cè)、逆合成分析與智能計(jì)算平臺(tái)M1及Pyxir平臺(tái)有機(jī)結(jié)合,配合生物實(shí)驗(yàn)平臺(tái),形成了“AI-計(jì)算-實(shí)驗(yàn)迭代”的藥物研發(fā)新范式。尤其在M1計(jì)算平臺(tái)中,星藥科技FEP和Docking計(jì)算精準(zhǔn)度已達(dá)到業(yè)界先進(jìn)水平,邀測(cè)情況良好,并已完成商業(yè)化落地。
技術(shù)的發(fā)展很難一帆風(fēng)順,一些難題在研發(fā)過(guò)程中逐漸浮出水面:
首先,面對(duì)業(yè)務(wù)量的波動(dòng),需要實(shí)現(xiàn)按需調(diào)度的彈性伸縮算力,最大化利用計(jì)算資源;
其次,以往計(jì)算節(jié)點(diǎn)較多,需要大量專人開(kāi)發(fā)維護(hù)集群,才能保證應(yīng)用的高可用性;
第三,醫(yī)藥研發(fā)有海量非結(jié)構(gòu)化文件數(shù)據(jù)讀取需求,這就需要有高吞吐的數(shù)據(jù)讀取能力。
面對(duì)以上難點(diǎn),也為了建立更多增益的差異化管線,尤其是未成藥、難成藥靶點(diǎn)的藥物管線,星藥科技需要有一個(gè)充足的、動(dòng)態(tài)的、極致性價(jià)比的算力資源,一個(gè)可以提供無(wú)限計(jì)算、存儲(chǔ)等擴(kuò)展能力的云超算平臺(tái)。如果能實(shí)現(xiàn)這樣的云超算平臺(tái),就可以滿足其計(jì)算任務(wù)需求,為藥物研發(fā)新范式提供動(dòng)態(tài)資源,從而在更短時(shí)間內(nèi)獲得期望的實(shí)驗(yàn)結(jié)果。
火山引擎高性能計(jì)算平臺(tái)
星藥科技引入了火山引擎的高性能算力資源、機(jī)器學(xué)習(xí)平臺(tái)及高性能并行文件系統(tǒng)等資源。基于火山引擎高性能計(jì)算平臺(tái),星藥科技能夠無(wú)縫集成彈性容器,靈活調(diào)度底層計(jì)算資源,實(shí)現(xiàn)了海量實(shí)例快速秒級(jí)啟動(dòng),從而靈活應(yīng)對(duì)計(jì)算高峰。
火山引擎機(jī)器學(xué)習(xí)平臺(tái)幫助星藥科技無(wú)縫對(duì)接了已有集群資源調(diào)度引擎Slurm,支持全流程的數(shù)據(jù)管理、代碼開(kāi)發(fā)、模型訓(xùn)練等全生命周期工作流;通過(guò)機(jī)器學(xué)習(xí)平臺(tái)對(duì)Gromacs的GPU性能優(yōu)化,大幅提升效率、降低成本;同時(shí),減少了星藥科技對(duì)Slurm集群的維護(hù)負(fù)擔(dān),節(jié)省人力成本30%。

火山引擎與星藥科技的合作解決方案
星藥科技通過(guò)集成火山引擎的技術(shù)產(chǎn)品,獲得了如下能力:
● 高可用彈性算力集群。其能夠利用云上的高可用、靈活伸縮的特性,實(shí)現(xiàn)資源的按需實(shí)時(shí)調(diào)用,無(wú)需關(guān)心擴(kuò)容策略。
● 高性能并行存儲(chǔ)–vePFS。提供亞毫秒級(jí)時(shí)延,20G/s吞吐,百萬(wàn)級(jí)IOPS,同時(shí)可以在線彈性擴(kuò)展,容量與性能實(shí)現(xiàn)線性靈活增長(zhǎng)。
● 機(jī)器學(xué)習(xí)平臺(tái)。能夠支持Slurm提交任務(wù);支持NVIDIA Clara系列工具(如Gromacs)的云端應(yīng)用,實(shí)現(xiàn)醫(yī)療生信行業(yè)任務(wù)的GPU加速;支持從數(shù)據(jù)托管、代碼開(kāi)發(fā)、模型訓(xùn)練、模型部署的全生命周期工作流。
● 遷移對(duì)接便利:利用Terraform,在多個(gè)可用區(qū)快速批量創(chuàng)建云上高性能計(jì)算集群,節(jié)省人力成本,實(shí)現(xiàn)資源彈性敏捷。
總體來(lái)看,星藥科技在與火山引擎合作后,通過(guò)引入IntelAVX512優(yōu)化指令集,使得整體性能提升了30%;通過(guò)火山引擎機(jī)器學(xué)習(xí)平臺(tái)提供的Slurm提交任務(wù),能夠卸下自己維護(hù)Slurm集群的重?fù)?dān),減少人力成本投入30%;同時(shí),在火山引擎機(jī)器學(xué)習(xí)平臺(tái)中優(yōu)化Gromacs的GPU性能,將原本需要7小時(shí)處理的任務(wù)降低到不足3小時(shí),同時(shí)算力成本降低至60%,藥物研發(fā)的先導(dǎo)化合物發(fā)現(xiàn)階段整體效率提升20%。
在聯(lián)手火山引擎后,星藥科技更高效準(zhǔn)確地找到比對(duì)標(biāo)藥物活性更好、并具有更大專利空間的全新分子,進(jìn)而大幅度節(jié)省藥物開(kāi)發(fā)環(huán)節(jié)的時(shí)間和成本。雙方聯(lián)手實(shí)現(xiàn)以“AI驅(qū)動(dòng)的研發(fā)管線”和“AI賦能的計(jì)算平臺(tái)”的雙循環(huán),賦能藥物研發(fā)產(chǎn)業(yè),讓新藥的研發(fā)更加高效。(作者:袁夢(mèng))