
3月16日,百度于北京總部召開新聞發(fā)布會,主題圍繞新一代大語言模型、生成式AI產(chǎn)品文心一言。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏現(xiàn)場展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。官方表示,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)
用數(shù)據(jù),以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處于獨一無二的位置。作為革新生產(chǎn)力工具,文心一言某種程度上具有了對人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性都逐漸接近人類水平。
引發(fā)搜索引擎革命,百度的“背水一戰(zhàn)”
從人工智能風(fēng)潮發(fā)展起來,百度便全身心投入到人工智能業(yè)務(wù)的發(fā)展中來,在百度文心一言發(fā)布前夕來看,百度更是將“用科技讓復(fù)雜的世界簡單”作為自己的使命,也確實取得了一系列的成果。
從去年開始,元宇宙、數(shù)字人、AIGC等關(guān)鍵詞基本可以囊括百度近期所有動作,無論是語言大模型、自動駕駛,還是Web3.0技術(shù)產(chǎn)品(百度希壤、百度曦靈數(shù)字人平臺等),也可以看到,更多的是百度在不斷追逐熱點,尋找業(yè)務(wù)增量的過程。
然而,在速途元宇宙研究院看來,“文心一言”對于百度而言,在開拓的同時,讓人們看到了更多的“守”的意味。
不得不承認(rèn)的是,ChatGPT的出現(xiàn),這種生成式AI大模型,不僅顛覆了人們對于AI語言表達(dá)能力的認(rèn)知,同時也顛覆了人們信息檢索的效率。
相比傳統(tǒng)的AI聊天工具或AI語音助手,ChatGPT雖然仍存在一些因AI錯誤理解而導(dǎo)致的瑕疵,不僅擁有遠(yuǎn)超現(xiàn)階段語言類AI流暢的表達(dá)能力,能夠模擬真人來聊天交流,且擁有邏輯清晰的總結(jié)能力,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務(wù)。
從顯示信息到直接生成結(jié)果,有業(yè)內(nèi)人士評價“ChatGPT 可能是這個時代做出的第一次接近 AGI (Artificial general intelligence,通用人工智能) 的產(chǎn)品。”
而搜索引擎,正是生成式AI首當(dāng)其沖的對象。目前國內(nèi)外搜索引擎經(jīng)過多年發(fā)展,雖然技術(shù)屢經(jīng)迭代,不斷改進(jìn)搜索算法如何去更好的排序、更好的給用戶展現(xiàn)想要的結(jié)果,但表現(xiàn)形式仍然處在傳統(tǒng)的鏈接形式。而ChatGPT的出現(xiàn),給用戶提供了更為“簡單粗暴”的搜索結(jié)果,從效率的角度出發(fā),用戶顯然會更容易接受更直接的搜索結(jié)果。
掌握了生成式AI的高地,或?qū)⑼耆淖兯阉魇袌龅母窬帧F髽I(yè)對生成式AI的需求不斷增長,市場空間進(jìn)一步抬高,AI市場爆發(fā)性的需求增長,將釋放出前所未有的、指數(shù)級的商業(yè)價值。即使是人們曾經(jīng)認(rèn)為會“顛覆千行百業(yè)”的AI,事實上目前還沒有完全地顛覆一些行業(yè),而是將AI技術(shù)的基因融入各行各業(yè),重構(gòu)行業(yè)的效率。
面對OpenAI的“鯰魚效應(yīng)”,所以在眾多想要投身到生成式AI研發(fā)的企業(yè)中,以搜索引擎為重要流量入口的企業(yè),自然成為最全力投入、也是最迫不及待推出生成式AI模型的企業(yè)。
作為OpenAI的投資方,微軟直接將GPT的能力整合進(jìn)了Bing搜索引擎中,近日,微軟還宣布將ChatGPT背后的技術(shù)整合到其Power Platform平臺上,允許用戶在幾乎不需要編碼的情況下,就能開發(fā)自己的應(yīng)用程序。
當(dāng)前,全球多家大型科技公司,均爭相將“生成式人工智能”整合到他們的產(chǎn)品中。
今年2月初,谷歌在演示類ChatGPT的AI聊天機(jī)器人產(chǎn)品—— Bard時,錯誤地把另一個望遠(yuǎn)鏡取得的成就安給了前者,這一錯誤致使谷歌母公司Alphabet當(dāng)日股價盤后大跌7.4%,市值蒸發(fā)了1056億美元(折合7172億元人民幣)。
而百度似乎吸取了谷歌的教訓(xùn),在Demo演示環(huán)節(jié),采用了提前錄制好的視頻,更多注重于能力的演示。不僅如此,百度還在開放方面則采取了內(nèi)測在先的方式,公布了文心一言的邀請測試方案:3月16日起,首批用戶可通過邀請測試碼,在文心一言官網(wǎng)體驗產(chǎn)品,吸收足夠多內(nèi)測伙伴的反饋,并完善產(chǎn)品之后,再將其推向市場。
文心一言將是百度的重要拐點
回顧百度的發(fā)展,1999年,看到中文搜索引擎服務(wù)的巨大發(fā)展?jié)摿Φ睦顝┖陱拿绹韫绒o職回國,懷揣著“科技改變?nèi)藗兊纳睢钡睦硐朐诖文陝?chuàng)立了百度,幫助中國互聯(lián)網(wǎng)打造了先進(jìn)的搜索引擎,也改變了國人查找信息的方式。行業(yè)報告顯示,2022年上半年,百度仍以75.54%的市場占有率,牢牢坐穩(wěn)中國搜索引擎的頭把交椅。
憑借著優(yōu)勢的市場地位,搜索引擎不僅成為了百度重要的流量入口,也是其互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展的根基。根據(jù)百度近期發(fā)布的2022第四季度及全年財報顯示,百度移動生態(tài)流量強(qiáng)勁,依然是貢獻(xiàn)經(jīng)營利潤和現(xiàn)金流的重要來源,第四季度百度移動端搜索查詢次數(shù)和信息流分發(fā)量繼續(xù)實現(xiàn)同比兩位數(shù)的增長。
就如同前文所提到,生成式AI的到來,將重塑搜索引擎市場的格局。如果文心一言為百度取得成功,將會進(jìn)一步提升百度在中國搜索引擎市場的占有率,會給互聯(lián)網(wǎng)業(yè)務(wù)帶來更多的流量,為移動生態(tài)的發(fā)展注入更多動能。
同時,作為承載人工智能的重要技術(shù)設(shè)施,百度智能云的相關(guān)業(yè)務(wù)也將因此受益。基于生成式AI帶來的增長,也會引爆服務(wù)器算力需求,作為最早在云上布局AI能力廠商之一,也將進(jìn)一步促進(jìn)百度智能云的市場份額。
而從企業(yè)的屬性上,生成式AI的成功開發(fā),將強(qiáng)化百度的“人工智能”屬性,并優(yōu)化百度的收入結(jié)構(gòu),降低作為傳統(tǒng)的互聯(lián)網(wǎng)企業(yè)廣告流量為主的營收占比,提高科技相關(guān)、尤其是人工智能領(lǐng)域相關(guān)的營收占比。
可見,對于站在人工智能“浪潮之巔”的百度而言,文心一言“成則前途無量,敗則元氣大傷”。甚至在這場為文心一言獨立召開的發(fā)布會上,李彥宏除了發(fā)布重磅產(chǎn)品的自豪之外,語氣中還多了幾分對于新產(chǎn)品的期待與謹(jǐn)慎,其重要性不言而喻。
中外生成式AI的對抗
就在文心一言發(fā)布的前一日(3月15日),OpenAI發(fā)布了多模態(tài)預(yù)訓(xùn)練大模型GPT-4。作為目前生成式AI模型的標(biāo)桿,搶在文心一言之前發(fā)布,行業(yè)內(nèi)紛紛開始討論“壓力是否來到了百度這邊”。
在發(fā)布會上,李彥宏表示,“文心一言不是中美科技對抗的工具,而是一代代百度技術(shù)人員追逐科技改變世界的夢想的產(chǎn)物,是創(chuàng)新驅(qū)動發(fā)展的最佳證明”。雖然科技巨頭之所以能夠走在創(chuàng)新的前列,更多是企業(yè)在技術(shù)理解與演進(jìn)上的“各顯神通”,但在文心一言與GPT-4的產(chǎn)品演示細(xì)節(jié)來看,我們?nèi)匀荒軌蚩吹絻杉褹I巨頭在打造產(chǎn)品的理念上不同。
在新的GPT-4上,產(chǎn)品不僅擁有了更高的回答準(zhǔn)確率,同時能夠生成歌詞、創(chuàng)意文本并實現(xiàn)風(fēng)格變化,但最大的升級顯然是增加了強(qiáng)大的“識圖”能力,允許用戶指定任何視覺或語言任務(wù),例如分析一張圖片的“笑點”與“梗”。
速途元宇宙研究院已經(jīng)在發(fā)布當(dāng)日收到了“文心一言”的內(nèi)測資格。在測試的過程中,文心一言能夠識別語言的內(nèi)容,并能夠給出具有一定創(chuàng)作力的回答。
即使面對中文語序中出現(xiàn)的倒裝,缺乏量詞,也擁有一定的識別能力。
速途元宇宙研究院也嘗試了李彥宏在現(xiàn)場DEMO中演示的問題,而文心一言的回答與演示的回答并不盡相同,可見文心一言的內(nèi)容是利用AI大模型真真正正“生成”出來的。
在文學(xué)創(chuàng)作、商業(yè)文案、數(shù)理推算、中文理解和多模態(tài)生成之外,百度文心一言的優(yōu)勢在于不僅能夠生成文字,還融合了百度在AI領(lǐng)域的其他能力,例如文心一格的圖片創(chuàng)作能力、以及根據(jù)文案自動生成視頻的能力,能夠生成圖文并茂的內(nèi)容。
不過,李彥宏也坦承,文心一言對英文的理解和處理能力現(xiàn)在還沒有中文這么好。部分原因是因為在訓(xùn)練數(shù)據(jù)樣本還不夠大。
可見,GPT的團(tuán)隊,更像是“從0開始開發(fā)AI”,但不可否認(rèn)的是,從文字、到識圖,下一步可能就是視頻,團(tuán)隊在不斷提高GPT模型的感知維度,而且進(jìn)步神速。而相比于OpenAI想要做一個真正可以交互的“機(jī)器人”,百度則似乎更傾向于將其工具化,通過服務(wù)于產(chǎn)業(yè)發(fā)揮更大的價值。
據(jù)了解,現(xiàn)階段OpenAI的主要收入,仍然多數(shù)來自于微軟等企業(yè)的投資,2019年-2023年,微軟先后宣布投資OpenAI累計約130億美元。據(jù)國盛證券報告《ChatGPT需要多少算力》估算,GPT-3訓(xùn)練一次的成本約為140萬美元,對于一些更大的LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1200萬美元之間。以ChatGPT在1月的獨立訪客平均數(shù)1300萬計算,其對應(yīng)芯片需求為3萬多片英偉達(dá)A100 GPU,初始投入成本約為8億美元,每日電費在5萬美元左右。與巨大成本成為鮮明對比的是,業(yè)內(nèi)人士估計,OpenAI今年營收僅約為2億美元。
不可否認(rèn)的是,對于OpenAI這種幾乎沒有營收壓力的公司來說,自然可以選擇更為純粹的研發(fā)路線。然而對于百度而言,不僅要推動人工智能技術(shù)的創(chuàng)新的同時,還要兼顧AI技術(shù)對于企業(yè)帶來的“造血能力”,而如何將文心一言的能力實現(xiàn)商業(yè)化變現(xiàn),對于百度而言同樣也將是一個重要的挑戰(zhàn)。
就目前而言,文心一言仍然是最有可能在國內(nèi)開展商業(yè)落地的模型。
一方面,從技術(shù)來看,如今百度是全球為數(shù)不多、在這四層進(jìn)行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動駕駛、小度等應(yīng)用,各個層面都有領(lǐng)先業(yè)界的自研技術(shù)。文心一言基于百度2016年開源出首個國產(chǎn)深度學(xué)習(xí)框架PaddlePaddle(飛槳),也是國內(nèi)至今唯一能與國際兩大主流框架TensorFlow和PyTorch同水平的深度學(xué)習(xí)框架,擁有充分的技術(shù)自主性。
另一方面,從數(shù)據(jù)安全角度出發(fā),作為中國企業(yè)的百度,在吸引國內(nèi)企業(yè)合作中,也能夠避免一些合規(guī)性的問題。
從文心一言內(nèi)測版的體驗來看,在語言模型的訓(xùn)練上,雖然在生成的準(zhǔn)確性方面,仍然有進(jìn)步的空間,但在語言表達(dá)能力上已經(jīng)媲美了目前頂尖的生成式AI大模型,也看到了將AI作畫與文字相結(jié)合的新形態(tài)。
在速途元宇宙研究院認(rèn)為,“文心一言”雖然不是一款全面超越的生成式AI產(chǎn)品,但它在部分能力的表達(dá)上,能夠看出百度所沉淀的技術(shù)能力與創(chuàng)新實力。
就如同發(fā)布會上所言,自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài)。其中,速途網(wǎng)宣布成為百度文心一言(英文名:ERNIE Bot)首批生態(tài)合作伙伴。后續(xù),速途網(wǎng)將全面體驗并接入文心一言的能力。此舉標(biāo)志著速途網(wǎng)優(yōu)先獲得領(lǐng)先AI技術(shù)的加持,也標(biāo)志著對話式語言模型技術(shù)在國內(nèi)新媒體場景的首次著陸。
未來,速途元宇宙研究院將在第一時間上線文心一言的評測,屆時我們將更加詳細(xì)地剖析國內(nèi)首個生成式AI的全貌。










