分享
國家互聯網信息辦公室準許從事互聯網新聞信息服務業務的網站
互聯網新聞信息服務許可證編號:10120220005
中新經緯>>科技>>正文

Agent熱度飆升,一場暫被高估的“效率游戲”

2025-03-26 20:20:26 第一財經

  Agent熱度飆升,一場暫被高估的“效率游戲”

  作者:呂倩 鄭栩彤

  從天使輪押注DeepWisdom到目前新輪融資,遠望資本創始合伙人程浩的投資回報頗豐。AI+創始人和投資人段雨嫣對記者表示,近期Agent概念因基座模型技術的成熟而熱度提升,美國硅谷幾乎每一家公司都在做Agent。

  創業者群體中,Convergence AI 工程負責人鄭淺對記者表示,海外市場垂類Agent早有案例,相對來說,通用類Agent在OpenAI相關產品發布后熱點得到提升。在Pokee AI創始人、前Meta應用強化學習負責人朱哲清的體感上,去年下半年,他所接觸的VC還沒有一家十分清晰地理解公司為什么做、怎么做Agent,而今年春節前后,包括投資人與潛在客戶,大批行業人士前來向他咨詢Agent相關的問題。

  整個人工智能領域熱度的逐漸高漲,背后是不同時間點不同“爆款”AI產品的助推。包括DeepSeek在春節期間完成對大眾關于大語言模型的教育與普及,1月OpenAI Operator清晰演示了AI Agent的樣板;3月Manus的出圈啟動了對Agent市場的教育。

  市場研究機構Gartner 將 Agentic AI 列為 2025 年十大技術趨勢之一,并指出到 2028 年至少 15% 的日常工作決策將通過 Agentic AI 自主完成。記者調研觀察,目前海外市場中,Agent基于資本對技術長期投資、相對充裕的算力支撐、付費習慣較成熟、資本對技術創新與商業化進展的包容等原因,已有不少案例。但在國內市場中,Agent暫處于大廠戰略布局范疇內,尚未大范圍涌入普通用戶的生活中。

  Agent革新與亂象并存

  Agent可以翻譯為代理、智能體、助理等,概念最早萌芽于1959年,用于解釋更大系統的自主行為。2010年之后,基于大模型驅動,Agent逐漸具備跨任務知識遷移和快速學習能力,如微軟推出 Microsoft 365 Copilot,通過 Agent 自動化辦公流程;OpenAI旗下ChatGPT 插件生態賦能第三方工具集成;谷歌Project Astra 打造個人智能助手,整合搜索與多模態能力。

  至于大語言模型(LLM)與Agent之間的關系,前者接收文字、圖片等內容,輸出相應文字或圖片,但沒有記憶,無法連接真實環境或操作外部工具。Agent以LLM為“大腦”,加上記憶與軀體,可以感知環境、記憶過程、執行任務、規劃與行動。

  近期海內外熱點事件推動,伴隨模型技術提升,Agent熱度漸起。鄭淺對記者表示,2025年1月,OpenAI發布Operator之后,Agent行業啟動了新一輪的熱潮,Convergence AI初期也獲得1200萬美元Pre-seed投資。此前國外市場中,垂類Agent較為豐富,如聚焦醫療、金融、法律等具體場景。基于方便落地、痛點解決精準而獲得客戶買單。而Operator“打樣”之后,通用型Agent行業開啟了新輪熱潮,創業者開啟項目推進,VC前來咨詢項目技術更新。

  另一種分類方式在鄭淺看來,也可以分為已經落地的通用型Agent、備受關注的開發中產品,以及為Agent AI提供服務的產品。通用型如OpenAI的Operator,系行業第一個真正落地的通用協議型Agent,目前僅限美國地區使用;Convergence AI Proxy在Operator亮相兩天后向公眾開放,專注于研發Agent;Anthropic的computer use是一個企業級API服務,嚴格來說不算產品。但它的推出為這方向的AI產品奠定了技術基礎,影響深遠。

  開發中的產品如谷歌的Project Magi,最初Demo在去年12月,核心方向偏向人機交互,目標將AI Agent整合到Chrome瀏覽器中,但目前官方未透露更多細節。服務型產品如BrowserBase和Browser Use,是為瀏覽器Agent提供虛擬瀏覽器服務的公司;Microsoft Azure正在緊鑼密鼓研究為AI Agent提供虛擬機服務。

  另外,目前Agent也可粗淺分為垂直型與通用型。Monica雖然官方宣稱推出通用型AI Agent Manus,官方演示案例中涉及了簡歷篩選、股票分析、購房推薦、課程設計、文娛創作等多個種類,輸出形式包括文檔、圖像、音頻、Dashboard等不同類型的輸出。但由于垂直功能不夠精準,反而側面證明通用型Agent目前難以完成垂直功能的“專精深”。

  需注意的是,Agent熱度的暴漲也使得目前行業存在“Agent Washing”(智能體清洗)的亂象。AW是指AI領域中,部分企業通過重新包裝現有技術或簡單自動化工具,宣稱其具備 AI Agent功能,但實際并未驗證或實現真正的自主決策、學習和適應能力的現象,利用市場對 AI Agent 的熱度進行營銷,導致市場混淆和誤導性投資。

  具體如將傳統的聊天機器人、RPA(機器人流程自動化)工具或基于規則的系統重新命名為 “AI Agent”,但核心功能仍依賴預設指令或簡單邏輯,缺乏自主性。或者宣稱產品具備 “自主決策”“持續學習” 等能力,但實際無法處理復雜環境或未預見情況,如將簡單的郵件自動回復工具稱為 “銷售智能體”,將固定流程的客服腳本包裝為 “智能服務代理”。還有一種是模糊 “AI 助手”“工具” 與 “AI Agent” 的邊界,如將僅提供信息檢索的工具宣傳為具備獨立行動能力的智能體。

  AI Agent行業早期,泛濫的“Agent Washing”亂象可能導致企業因誤判技術價值投入資金,卻未能獲得預期的自動化或效率提升,導致資源浪費;用戶對AI Agent的實際能力產生懷疑,阻礙真正創新技術的落地;以及虛假宣傳掩蓋實時性差、可解釋性弱等真實技術瓶頸,導致市場過熱與后續回調風險。在具體判斷與界定上,用戶可以通過相關產品能否在無人工干預下完成任務、是否支持動態優化策略、能否應對未預設的場景、能否清晰展示決策過程、是否支持與其他系統或人類協同工作等方面進行區分。

  垂類與通用Agent將并存

  那么,Agent具體是何如運作的?

  在工作模式上,吳恩達此前提及,在應用中構建具有Agentic推理或Agentic工作流的方法有四種主要設計模式:反思型設計模式、tool use(API calls功能調用)、規劃或推理、多智能體協作(Multi-agent Collaboration多智能體協作)等。

  在這樣的工作方式分類邏輯下,Manus以明顯的tool use形式破圈傳播。但在用戶使用端,多位行業人士對記者表達了“早期階段”的判斷。一位AI領域從業者對記者表示,Manus在長期任務中表現較差,多個步驟的任務會因為每一步的細微誤差被放大,導致最終失敗。核心問題是工具能力較差,雖做了規劃和計劃,但實際執行出來的效果不及預期,所以導致整個任務失敗。這方面的原因不在規劃能力,而是規劃了卻沒有足夠的tools去執行,或者tools太簡單,導致復雜問題無法處理,而tools豐富生態的搭建需要足夠資金實力支撐才能破解。

  另外,行業人士對記者表示,Manus目前屬于“堆tools”的形式,而這種形式無法進行持續進化。朱哲清也認為,做Agent需要考慮的幾個板塊包括通用性、算力部署要求、工具調用能力、執行力。其中,工具調用是比較復雜的問題。

  AI工程師、Pleias聯合創始人 亞歷山大·多里亞(Alexander Doria )此前發文表示,未來 AI 智能體的發展方向會是模型本身,而不是工作流(Work Flow)。而Manus 基于預先編排好的提示詞與工具路徑構成的工作流智能體,短期或許表現不錯,但長期必然遇到瓶頸,核心原因就是提示驅動的方式無法擴展,也無法真正處理那些需要長期規劃、多步驟推理的復雜任務。

  中金公司研究部認為,相比于上述海外廠商在Agent底層技術上的創新,Manus更多是一種模式上的創新:Manus證明了多代理模式可以相對容易地實現通用AI Agent的落地,這也與海外廠商推出構建模塊、統一API協議的目的比較類似;“展示過程”的形式有助于降低大眾的理解門檻,提高用戶對AI產物的信任度,并催化AI Agent實現大規模落地。

  中金公司引用LangChain(專注于AI應用開發的開源框架提供商)調查報告顯示:人們在長耗時任務中對AI Agent有較大需求,但同時,用戶對AI Agent普遍存在“完成質量”或“可靠性”方面的擔憂,AI Agent在復雜場景中并不一定能夠持續保持響應和問題解決路徑的準確性,因此有一半以上的受訪者在實際使用中會為AI Agent補充跟蹤和觀察的控件。

  拋開通用Agent早期尚存的不足,鄭淺更看好通用型Agent的前景。一方面,OpenAI的Operator已經為行業“打了樣”,另一方面,通用型可以通過簡單化任務、小體量模型完成,在海外算力較為充足的背景下,通用型Agent比拼的主要是小模型與工程能力。模型不是越大越好,而是適合才好,工程也是Agent領域重要影響因素。

  更重要的是,鄭淺認為,通用型Agent可以同時自主完成不同任務,具備規劃和重新規劃能力,而實現這一功能的核心就是Agent另一個“大腦”——Agent Orchestrator。上文所提LLM是Agent進行思考和決策的核心組件,在多Agent系統中,LLM負責單個Agent內部語言處理和決策,Agent orchestrator負責決定哪個 Agent來處理特定的任務,以及如何在多個 Agent 之間傳遞信息,讓Agent各司其職,最大化效率。

  基于這樣的邏輯,鄭淺判斷通用型Agent中,并行Agent將是未來趨勢。但整個行業內,垂類Agent將與通用Agent長期并存甚至達成“合作”,例如垂類工具接入通用Agent平臺,補足后者在具體行業方面的欠缺。

  大廠蓄勢,行業尚早

  任何一個新興領域,創業者都免不了面臨“大廠來了”怎么辦的問題。程浩稱:PC互聯網時代,VC對創業者最常見的問題是“你這個項目如果騰訊做了怎么辦?”進入AI時代,VC仍然會問此類問題,只是騰訊變成了字節。

  據記者了解,字節跳動Dev Infra團隊已開發出一款功能類似Manus的智能體產品,名為Dev Agent,主要通過集成內網知識庫與多種內部工具實現調研、開發、數據分析等任務。記者獲悉,Dev Agent是一款實驗性質的內部工具,僅面向開發部門內測使用。

  在技術方面,字節此前提出基于強化學習(RL)的 LLM Agent 框架 AGILE,會主動向人類專家咨詢,增強了快速適應新任務的泛化能力。產品方面,“Coze 扣子” 作為 AI bot 開發平臺,堪稱字節版GPTs,提供豐富的Agent工具。目前豆包電腦版APP已呈現瀏覽器模式,將已有AI工具匯總調用,輸入“撰寫一段貪吃蛇的代碼并運行”,豆包可調用工具、演示過程、最終運行。

  阿里主推的AI時代代表應用夸克近期推出“超級框”概念,阿里巴巴智能信息事業群總裁的吳嘉表示,“超級框”不是ChatBot或搜索,而是直接交付結果的“超級Agent”——用戶在“框”中表達意圖,AI會調用工具與方法來幫你寫一份工作報告、旅游計劃,或是一份就醫指南。

  目前在整個阿里集團戰略布局中,夸克被寄望于搭建AI時代“超級入口”,但同時,作為試水探路者,目前夸克方面暫未嘗試重投入,因此在Agent模式上,暫時處于阿里自有工具調用的早期形式,未接入增加更多算力耗費與技術復雜性的中間調優與反饋。

  除上述大廠案例,記者觀察到的主流Agent代表案例暫時集中于海外市場。談及海外大廠的競爭,鄭淺對記者表示,各行業有各自專攻領域。OpenAI、Anthropic及Deepmind在模型研發方面確實強大,但他們在產品開發方面表現不佳。如過去兩年OpenAI推出了GPTs或Prompt Store等多款產品,但大多是失敗的。

  另外,Agent公司的創業核心競爭力在于其Agentorchestrator。目前雖有開源模型,但沒有人開源真正的Agentorchestrator,各家公司都有獨特做法。如何構建有效的AgentOrchestrator的能力在未來一兩年內都將是Agent創業公司重要的核心競爭力。

  目前在Agent生態構建呈現大廠定制規則、創業公司沖刺創新的局面,大廠相繼推出構建模塊、構建平臺等Agent開發工具,打造專有生態。

  2025年3月11日OpenAI發布了其第一組構建模塊,通過Response API,用戶通過幾行代碼調用OpenAI的內置工具來構建符合自身需求的Agent,而無需再專門編寫調用外部工具的復雜代碼,大大簡化了Agent開發的流程。區別于建立一站式構建平臺,Anthropic推出MCP開放標準,同樣致力于提升Agent開發能力和效率。

  但目前行業對MCP持有不同觀點,鄭淺對記者表示,MCP 更像是一個 API,雖然使用起來方便,但其可擴展性和適用性都有一定局限。如果要構建真正的通用型 Agent,僅依靠 MCP 的接口會受到限制,因為支持的軟件有限。

  朱哲清告訴記者,長期來看,協議統一對于某個Agent體系的構建非常重要,但目前來看,協議在短期內不會有共識,原因在于還沒有哪家Agent公司已經做到最好。要等出現一家公司將Agent商業化應用做到很好的情況下,才會吸引很多人用它的工具,才有可能統一市場。而目前,即便是較早面世的MCP,所帶來的價值也有限,MCP可以幫助工具標準化,但大多數情況下工具都不是標準化的。Claude集成的MCP Agent也更多處于開發者測試和體驗的狀態,還沒有到商用的程度。

來源:第一財經

編輯:張嘉怡

廣告等商務合作,請點擊這里

本文為轉載內容,授權事宜請聯系原著作權人

中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其它方式使用。
關注中新經緯微信公眾號(微信搜索“中新經緯”或“jwview”),看更多精彩財經資訊。
關于我們  |   About us  |   聯系我們  |   廣告服務  |   法律聲明  |   招聘信息  |   網站地圖

本網站所刊載信息,不代表中新經緯觀點。 刊用本網站稿件,務經書面授權。

未經授權禁止轉載、摘編、復制及建立鏡像,違者將依法追究法律責任。

[京B2-20230170]  [京ICP備17012796號-1]

違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經聞信息科技有限公司

主站蜘蛛池模板: 大伊香蕉精品一区视频在线| 欧美乱色理伦片| 国产裸拍裸体视频在线观看 | 中文字幕在线观看| 精品无码国产一区二区三区麻豆| 天天摸天天摸色综合舒服网| 亚洲无成人网77777| 国产jizz在线观看| 揄拍成人国产精品视频| 免费免费啪视频在线| 2021果冻传媒剧情在线观看| 日韩国产精品欧美一区二区| 囯产精品一品二区三区| a级毛片高清免费视频在线播放| 欧美巨大黑人精品videos人妖| 国产四虎精品8848hh| 三级黄色毛片视频| 波多结衣一区二区三区| 国产成人精品一区二区三区无码| 久久99久久精品视频| 狠狠色噜噜狠狠狠狠69| 日本高清免费不卡在线| 午夜一级做a爰片久久毛片| 91九色视频无限观看免费| 日本道v高清免费| 免费a级毛片18以上观看精品| 男女xx动态图| 成年人免费视频观看| 亚洲欧美精品伊人久久| 颤声娇是什么意思| 天天综合色天天桴色| 五月天在线婷婷| 精品久久久噜噜噜久久久| 国产精品乱子乱XXXX| 中文字幕亚洲精品资源网| 欧美理论电影在线| 国产一区二区在线视频播放| 99久久99久久精品免费观看| 日本妇人成熟免费| 亚洲精品视频免费看| 青青青青久在线观看视频|