12月1日—3日,由中國互聯網協會主辦的2025“人工智能+”產業生態大會在北京中關村國家自主創新示范區展示交易中心舉辦。本屆大會主題為“智賦鏈動 生態共鳴”,旨在構建以“政策解讀、技術展示、需求對接、成果轉化”于一體的綜合性生態平臺,聚焦人工智能應用生態協同中的熱點難點,推動產業各方務實交流。
大會期間,銜遠科技 CTO 張開顏在“人工智能與智能體應用論壇”,以《銜遠大觀:基于強化學習的專家級智能體進化平臺》為題,分享了他對于智能體技術創新與行業趨勢的洞察,并介紹了基于強化學習的專家級智能體進化平臺——銜遠大觀的核心技術、產品創新及應用落地。

針對當前通用智能體應用落地難、長尾問題處理成本高等痛點,銜遠科技根據創始人周伯文教授提出的“通專融合”技術路線,構建可支撐智能體持續進化的“數字風洞”。其核心解法體現為“大觀公式”,將專家能力拆解為基礎模型、仿真環境與強化學習三部分,強調環境是模型進化的關鍵壁壘,并指出跨領域任務的強化學習可通過遷移學習促進專業能力快速提升,體現通專融合的根本價值——既實現了廣度的平臺化,更實現了深度的專業價值挖掘。
在技術內核層面,銜遠自研三大引擎:一是具備課程學習能力的智能體模擬訓練場,能夠合成海量邊緣任務案例,并依托生成式世界模型模擬環境狀態;二是融合業務準則驅動生成式獎勵與內在獎勵的自適應反饋機制,可提供接近專家水準的反饋信號;三是基于過程獎勵監督與多智能體協同的高效強化學習引擎,即使對閉源模型也能通過上下文強化學習實現經驗庫優化。這三者共同構成智能體從體驗、評估到進化的閉環體系。
產品架構上,基于“銜遠大觀”系統構建了三層平臺,涵蓋數據管理、進化引擎與專家智能體管理,并將智能體劃分為決策型(CIP)與執行型(Syngents)兩類,打造企業“數字員工”的入職培訓與終身學習中心。該平臺已在建筑、生信、供應鏈等多個行業實現應用落地,顯著提升任務效率與專業水平,推動智能體從“演示可期”邁向“實戰可靠”。
基于這套平臺,銜遠科技已構建了多個行業的專家級 Agent。
在建筑行業,與頭部央企合作構建了“計劃編制 Agent”。它既能從“經驗驅動”到“模型驅動”,實現智能計劃編制;又能從“事后補救”到“事前預見”,實現智能風險預警。相比人工,計劃編制時間節省70%,工期延誤全面受控,并為某中型企業降本3300萬。
在生信行業,與國家蛋白質科學中心合作。所構建的Agent能提出新的科學假設,并自動進行蛋白質組學數據分析。實測顯示,其分析速度比人工快10倍,且約有25–30%的自動生成假設,達到了研究生水平的原創性與合理性。
在供應鏈領域,為行業頭部企業構建了“國際物流多式聯運路徑規劃 Agent”。它結合大模型對多源路況的實時感知,以及運籌學求解器(Solver)的最佳路徑計算,將應急物流規劃的時間從幾小時縮短到了幾分鐘。
針對價格預測任務,我們構建了“自動機器學習 Agent”。它能對預測模型進行多輪自動優化。相比人類算法工程師,其模型預測準確率提升了10%。

張開顏表示,數據終將耗盡,但環境可以無限生成數據。銜遠大觀,能夠提供開箱即用的專家級智能體進化平臺。誠摯邀請各行各業的專家,與銜遠攜手合作,將各領域深厚的行業 know-how,轉化為 Agent 的訓練場,一起構建真正專家級別的智能體。