隨著第三代基因測序技術的引入,生物信息學的研究領域得以廣泛拓展,為深度挖掘基因信息提供了更多的可能性,同時,也帶來了海量的數(shù)據(jù)分析和處理任務。
北京希望組生物科技有限公司(下文簡稱希望組)在打造全新的三代測序項目交付平臺時,引用火山引擎 Bio-OS 解決方案,建立了基于 web 的生信數(shù)據(jù)分析平臺,不僅有效降低生信數(shù)據(jù)分析門檻,也使售后人力成本降低了40%,運維成本降低了30%。
希望組(Grandomics)是全球知名的三代測序技術拓展者,也是中國首家三代測序服務公司。多年來,一直專注于在三代測序平臺上進行技術開發(fā)與應用拓展,其自主開發(fā)了基因組變異分析系統(tǒng)、單細胞測序技術等多項三代測序軟件和技術,并構建了三代測序高性能計算集群,為客戶提供優(yōu)質(zhì)的第三代測序分析和存儲服務。
圖片來源:希望組(Grandomics)官網(wǎng)
第三代測序發(fā)展迅速,底層調(diào)度迎來挑戰(zhàn)
近年來,第三代測序技術迅速發(fā)展,為基因組研究提供了高分辨率的數(shù)據(jù)。希望組致力于打造一個三代測序項目交付平臺,通過可視化界面幫助用戶進行生信數(shù)據(jù)分析,降低難度、提高效率。然而,生信數(shù)據(jù)分析流程復雜,計算任務多且波動大,需要處理海量非結構化文件數(shù)據(jù)。因此,希望通過異構集群納管調(diào)度能力,實現(xiàn)資源復用,降低成本,提升集群擴容的便利性。
火山引擎Bio-OS,助力生信數(shù)據(jù)分析
生信數(shù)據(jù)分析平臺
在火山引擎 Bio-OS 解決方案的支持下,希望組成功構建了基于 web 的生信數(shù)據(jù)分析平臺。該平臺不僅能夠充分利用現(xiàn)有的本地計算資源進行生信計算,同時也方便其客戶通過 web 頁面提交自己所需的生信分析流程來獲取分析結果。該平臺擁有無縫集成彈性容器、海量實例快速秒級啟動、靈活應對計算高峰等特性。此外,這些特性的引入也有效地縮減了售后支持方面的人力成本。
生信數(shù)據(jù)分析平臺的三大優(yōu)勢:
降本增效,資源利用:希望組引入 Bio-OS 方案,通過將本地的 SGE 集群納入私有集群的管理范圍,將舊有的計算資源轉化為有價值的資源,進一步提升計算效率,減少資源浪費,降低維護成本。
流程簡化,操作追溯:Bio-OS 通過在工作流中預置一系列分析步驟,希望組成功降低了生物信息學數(shù)據(jù)分析的門檻。實驗人員和醫(yī)生等非專業(yè)人士也能夠輕松地啟動復雜的數(shù)據(jù)分析流程,不需要深入了解技術細節(jié)。同時,通過 git 管理工作流的不同版本,確保了操作的可追溯性和回顧性。
容器集群,智能管理:在計算資源管理方面,火山引擎的 Bio-OS 方案引入了彈性容器,使系統(tǒng)能夠快速啟動和停止計算實例,以適應計算任務的變化。特別是在處理計算高峰時,依然能夠保證系統(tǒng)高效運行,不會因為負載增加而陷入延遲。
售后成本降低40%,運維成本降低30%
生信數(shù)據(jù)分析平臺,有效降低了生信數(shù)據(jù)分析的門檻,讓普通人員也可輕松開啟數(shù)據(jù)分析之旅。另外,Bio-OS 納管本地 SGE 集群的功能實現(xiàn)本地算力的充分利用,在提升集群管理效率的同時,降低了40%售后支持人力成本和30%運維成本。
目前,希望組在 Bio-OS 平臺集成的 notebook 工具基礎上,還開發(fā)了諸如花瓣圖、動態(tài)火山圖、單細胞基因表達降維圖、單細胞降維分群圖工具等。隨著技術的不斷演進,基因測序和 Bio-OS 的結合,將擴展我們對基因組含義和應用的理解,并創(chuàng)造出更多的發(fā)展機遇。
END
日前,火山引擎與基因會等六家生信領域企業(yè),共同發(fā)布了《2023基因行業(yè)藍皮書》。未來,火山引擎將持續(xù)為科技研發(fā)提供支持,為生物信息領域的創(chuàng)新發(fā)展注入更多的動力。
更多詳細內(nèi)容,請點擊閱讀原文,下載《2023基因行業(yè)藍皮書》。
閱讀原文鏈接:
https://www.volcengine.com/docs/6624/1109238