速途網(wǎng)9月18日訊(報道:龍翔)中國AI團(tuán)隊(duì) DeepSeek 再獲突破 —— 其核心團(tuán)隊(duì)完成、梁文鋒任通訊作者的 DeepSeek-R1 推理模型研究論文,不僅登上國際權(quán)威期刊《自然》封面,DeepSeek-R1更成為全球首個經(jīng)獨(dú)立同行評審的主流大語言模型,填補(bǔ)行業(yè)關(guān)鍵空白。


據(jù)悉,與今年1月發(fā)布的DeepSeek-R1的初版論文相比,本次論文披露了更多模型訓(xùn)練的細(xì)節(jié),并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。
2025年初,當(dāng)DeepSeek R1模型發(fā)布時,其卓越的推理能力和極低的開發(fā)成本瞬間引發(fā)全球科技股震蕩,英偉達(dá)等AI龍頭企業(yè)市值蒸發(fā)數(shù)千億美元,DeepSeek也一戰(zhàn)成名。
而后,DeepSeek延續(xù)在深度推理方面的領(lǐng)先優(yōu)勢。同時,DeepSeek-R1也是全球首個經(jīng)過同行評審的主流大語言模型。Nature評價道:目前幾乎所有主流的大模型都還沒有經(jīng)過獨(dú)立同行評審,這一空白“終于被DeepSeek打破”。
有行業(yè)專家認(rèn)為,該成果不僅標(biāo)志中國自主大模型獲國際頂尖學(xué)術(shù)認(rèn)可,更為主流大模型建立 “學(xué)術(shù)評審標(biāo)桿”,推動行業(yè)從 “商業(yè)快速迭代” 轉(zhuǎn)向 “商業(yè)價值與學(xué)術(shù)嚴(yán)謹(jǐn)并重”,倒逼技術(shù)透明化與成果可驗(yàn)證性提升,為全球 AI 領(lǐng)域規(guī)范發(fā)展提供范本。
論文鏈接: