
“我想,AI之所以被稱為產業革命級的機會,就是因為它對于社會經濟,帶來了生產力的無限擴張。”百度創始人李彥宏在百度世界2024上這樣說道,并給征戰“AI時代”的開發者們遞上了兩把“神兵”。
11月12日,百度世界2024在上海正式舉辦,大會期間,既展示與分享百度在AI技術領域的創新與應用進展,也深度探討AI時代的前沿洞見。期間,百度發布兩大賦能應用的AI技術:檢索增強的文生圖技術(iRAG)以及無代碼工具“秒噠”。

本屆大會以“應用來了”為主題,不僅要展示近年來AI應用的蓬勃發展的現狀,更要用技術為AI應用的發展勾勒出新的輪廓。李彥宏指出,“百度不是要推出一個‘超級應用’,是要幫助更多人、更多企業打造出數百萬‘超級有用’的應用”。
事實上,早在一年之前,李彥宏就曾提出“AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。”
其中首先要解決的,便是AI應用“怎么來”的問題。
一年前,李彥宏拋出了這個問題,而一年之后的今天,他帶著解決問題的方法,來了。
“秒噠”無代碼,AI應用迎來“群星閃耀”時刻
在2024年百度世界大會上,哪項發布最令人印象深刻?毋庸置疑,多數人會將票投給大會的壓軸之作——“秒噠”。
在傳統的應用開發模式下,構建一款AI應用對于非專業人士而言仍是一項艱巨的任務。復雜的編碼和繁瑣的開發流程,往往使許多創新想法受限于技術門檻。為解決這一痛點,百度推出了無代碼工具“秒噠”,其目標是讓每個人都能輕松創建屬于自己的應用。
據官方介紹,“秒噠”具備三大核心特性:
1.無代碼編程:由大模型直接生成代碼,不需要人寫一行代碼。門檻很低,人人可上手;
2.多智能體協作:基于文心大模型的思考和規劃能力,實現對不同智能體的調度和編排
3.多工具調用:通過文心大模型的工具調用能力,可調用網頁檢索、iRAG、地圖API等各類型工具。
基于具備無代碼編程、多智能體協作和多工具調用三大特性,用戶只需通過自然語言指令即可完成應用的創建。
現場,李彥宏以蘿卜快跑新技術發布會為例,演示了只需要簡單幾句話,只見0號智能體作為“小組長”,很快給1-4號智能體進行分工,分配策劃、小編、程序員和質檢員的任務。只要3分鐘的時間,這個“智能體TEAM”便生成了一個簡單發布會的邀請系統。超低的使用門檻與超高的效率,也引得臺下觀眾無不嘖嘖稱奇。
“秒噠”的問世,意味著每個人都將具備程序員的能力,只需會說話即可開發應用,這極大地降低了AI應用開發的門檻。這一創新極大地拓寬了AI應用開發的邊界,使得個人無需再依賴龐大的開發團隊,僅憑一己之力便能指揮多個智能體協同作戰,實現“一人成軍”。
技術的0門檻,將進一步加速智能體的爆發。“秒噠”可以幫助更多人、更多企業打造出數百萬“超級有用”的應用。
技術的零門檻,無疑將加速智能體的普及與爆發,助力更多個人與企業打造出數百萬“超級有用”的應用,為各行各業帶來前所未有的變革。目前,文心智能體平臺已吸引15萬家企業及80萬名開發者參與,覆蓋眾多應用場景。未來,“秒噠”將打通多智能體協同的鏈路,讓Creativity(創造力)轉化為Productivity(生產力)。
目前,文心智能體平臺上,用自然語言就能創建智能體,已經吸引了15萬家企業和80萬名開發者參與,覆蓋眾多應用場景;未來,“秒噠”將打通多智能體協同的鏈路,讓創造力落地,轉化成生產力。
這意味著,“秒噠”不僅是一個無代碼開發平臺,更是一個讓創意落地的工具。只要有想法,就能用“秒噠”將其變成現實,“只靠想法就能賺錢”或許不再是天方夜譚。
李彥宏表示,“秒噠”是“迄今為止人類歷史上最復雜的多智能體協作工具”。這種創新性的協作不僅使得AI應用開發更加高效,還帶來了前所未有的靈活性,使得AI成為用戶日常工作中的得力助手。“
當下,全球所有頂尖科技公司都很關注智能體,但像百度這樣把智能體作為最重要戰略方向的并不多。而李彥宏則認為,智能體是AI應用的最主流形態,即將迎來它的爆發點,會變成AI原生時代,內容、信息和服務的新載體。
回顧2021年百度港股上市之時,李彥宏重申:“從過去到現在,我們的信仰從未改變,我們堅信技術可以改變世界。我們有決心,也有耐心。我們能夠忍受萬丈孤獨,也能夠擁抱星辰大海。”
展望未來,隨著2025年第一季度“秒噠”的正式上線,李彥宏所言的“AI應用的群星閃耀時刻”或許真的即將到來。
文心iRAG——產業價值是百度固有的堅持
而從百度世界2024上的另一項重磅發布——文心iRAG,則能夠看到百度對于技術價值的特殊的堅持。
在人工智能技術的發展進程中,可靠性是至關重要的。李彥宏指出,若大模型總是“一本正經地胡說八道”,就無法贏得人們的信任,更不會有實際的應用場景。
因此,攻克大模型幻覺問題,成為了AI發展必須越過的難關。為此,百度提出檢索增強(RAG),研發了「理解-檢索-生成」的大模型檢索增強技術架構,對搜索和大模型進行聯合優化,顯著提升了大模型的效果。
作為以搜索起家的百度而言,昔日自己的老本行,逐步成為了行業的共識,各家紛紛開始嘗試利用RAG來優化自家的模型。
過去24個月的大模型狂熱中,行業的最大變化正是大模型基本消除了幻覺。如今,文字層面的檢索增強生成(RAG)技術已取得顯著成效,但圖像等多模態內容與RAG的結合仍有待加強。
如何在RAG領域邁出下一步?行業內卻突然出現了變數。
今年2月,OpenAI發布了Sora視頻生成模型。突如其來的新技術思潮,是機遇,也是誘惑,考驗著企業對于技術投入的“定力”。不少模型企業似乎看到了未來的方向,紛紛將研究方向轉為視頻大模型。
而百度則選擇了堅持要對多模態“幻覺”下手,這個問題看起來更簡單,甚至更枯燥,但是只有解決了這個問題,多模態模型的產業應用才能夠真正的規模化出現。如此,才有了今天百度發布的檢索增強的文生圖技術iRAG(image based RAG)。

傳統的AI生成圖像常常會在特定的場景中產生認知錯誤,例如生成歷史人物或標志性建筑時,AI可能會出現物體拼接錯位、細節模糊等問題,極大影響了內容的真實性。

提示詞:幫我畫一張馬斯克和孫悟空一起參觀水族館的圖
而iRAG通過將百度搜索的億級圖片資源與文心大模型的生成能力結合,通過“理解-檢索-生成”三步流程,首先理解用戶的圖像需求,隨后通過多模態協同檢索最符合需求的素材,讓AI生成的圖像在精準度和細節還原度上達到了前所未有的水準。這一創新,極大提升了AI生成圖像的真實性,使生成的內容接近照片效果,消除了幻覺問題帶來的不信任感。

在相同的提示詞“畫一張正在玩手機的包青天”的需求下,大模型之家使用搭載文心iRAG的文心一言進行圖片生成,可以看到文心一言生成的“包公”黑色的面容之下,一副威嚴的神情,展現出了他鐵面無私、公正剛直的形象,在衣著和皮膚質感方面也更加逼真和寫實。相比DALL·E生成的包公,一張外國面孔,與角色設定相去甚遠,顯然對于中華文化的理解還有提升空間。

在給出提示詞“生成一張比薩斜塔和自由女神像同框出現的圖”的需求下,搭載文心iRAG的文心一言(左)生成的圖像中,我們可以清晰地看到石磚紋理、光影效果以及游人參觀等細膩之處,更重要的是,比薩斜塔和自由女神像被自然地置于同一地平線上,形成了和諧統一的視覺效果,而非DALL·E(右)那樣簡單的素材拼湊。
多模態模型幻覺的消除不僅僅是技術的突破,更為AI生成內容的實際應用鋪平了道路。在如今AI產業加速發展的背景下,iRAG為眾多應用場景提供了一個更加真實、可靠的圖像生成方式,徹底改變了傳統AI生成內容的局限性。
李彥宏用四個詞,精準概括了文心iRAG的價值在于“無幻覺、超真實、沒成本、立等可取”。iRAG為品牌宣傳和創意制作帶來了巨大的商業價值。以前制作一組廣告海報需要幾萬元的預算,而iRAG則讓這種圖像生成幾乎零成本。
也許,正是這股追求技術的純粹,讓百度能夠靜下心來,在同行都在追隨Sora的時候,選擇“死磕”人工智能行業最為頑固的痛點,才有了今天文心iRAG的驚艷登場。
作為中國人工智能的“扛旗者”,既要與谷歌、OpenAI這樣的國際人工智能巨頭搶攀技術的高峰,更要發揮自己的能力,推動AI技術的普惠。而百度也確實在不遺余力地,通過iRAG、“秒噠”這樣的AI工具,讓更多人可以加入到這場智能變革的浪潮之中。
作為中國人工智能行業發展的一個縮影,截至11月初,百度文心大模型的日均調用量超15億,相較5月披露的2億,增長7.5倍,相較一年前首次披露的5000萬次,更是增長約30倍。數字“陡峭”增長的背后,是過去18個月中國大模型應用爆發縮影。大模型技術的廣泛運用,正深刻改變著各行各業的生產方式和商業模式。
正如同李彥宏所言:“百度不是要推出一個‘超級應用’,是要幫助更多人、更多企業打造出數百萬‘超級有用’的應用”。這種理念不僅體現了百度對AI技術的深刻理解,也展示了百度在全球AI產業中的戰略格局。
寫在最后
在發布環節,有這樣一個細節,李彥宏在展示工具類智能體“自由畫布”時,特別強調了這款激發人們的無限靈感和創造力的智能體,“不是期貨,而是立即可用的現貨”,言語中帶著些許激動。這份激動,想必是出于那些我們所期待的世界,正在被AI應用所創造。
而在百度世界2024的AI應用小鎮上,大模型之家看到了展出的上百家大模型應用中,有很多已經走進家庭、入駐工廠、踏入農田……遍及我們衣食住行的方方面面。
當我們留意觀察,才發現,AI應用的時代,其實已經來了。