#AI智能體
AI Agent+醫療,七大公司!
AI Agent,即AI智能體,是一種能夠感知環境、自主決策並執行動作的智能實體。理想狀態下,人類只需進行預先設定目標並進行監督,AI Agent便可以全權自主完成具體任務。具體到醫療領域,AI Agent將覆蓋“預防-診斷-治療-康復”全流程,其核心價值在於融合多模態資料、最佳化決策效率並保障安全。近日,知名技術研究機構AIMultiple評選出全球七家典型醫療AI Agent公司。AIMultiple成立於2017年,致力於通過資料,幫助企業研究、篩選和評估前沿技術解決方案,為超過半數的《財富》500 強企業提供決策依據。智藥局已對這七家入選企業進行了整理彙總,以供行業參考。Sully.ai公司提供了一種覆蓋患者接診、編碼、計費和分診的智能體架構,專注於模組化的人工智慧代理(AI Agents),可自動完成病歷文件記錄、患者接診、預約安排及各類行政事務。核心功能包括:語音轉操作:通過語音識別技術,將醫生口述內容直接轉化為電子病歷(EMR)中的具體操作。符合 HIPAA 規範:確保所有資料處理與傳輸均滿足美國健康保險流通與責任法案(HIPAA)的合規要求。多語言支援:支援19種語言,滿足多元化語言環境下的使用需求。CityHealth將 Sully.ai 的AI醫療平台直接整合到其電子病歷系統(EMR)中,顯著減少了醫護人員在患者照護相關文書工作上所花費的時間。成效顯著:每位臨床醫生每天平均節省約3小時的病歷記錄時間 ,每位患者的營運操作量減少50%.Beam AI公司提供了一套面向醫療管理的多智能體系統,可自動化處理電子病歷管理、醫療帳單、合規事務、患者預約安排等任務。Avi Medical與 Beam AI 合作,部署了支援多語言的 AI 智能體。這些智能體能夠通過 API 訪問外部資料,從資料庫中檢索相關資訊,以回答覆雜的客戶諮詢。得益於此能力,AI 智能體成功處理了大量重複性、常規性的諮詢請求。成效顯著:80%的患者諮詢實現自動化處理,中位響應時間縮短了90% ,淨推薦值(NPS)提升了 10%。Innovaccer公司提供了一套專注於價值導向醫療(value-based care)和營運的 AI 智能體解決方案,其智能體主要用於輔助臨床決策,而非用於診斷。位於印第安納州的多專科醫生網路Franciscan Alliance 採用了 Innovaccer 的平台,以自動化其編碼流程。成效顯著:需人工處理的患者病例數量從約2600例減少至約1600例。Notable Health公司利用AI智能體自動化處理各類行政事務,包括患者登記、預約安排、轉診、護理授權和編碼等,並與電子健康記錄系統(EHR)無縫整合。北堪薩斯城醫院(NKCH)此前在患者簽到和登記環節效率低下。為此,醫院與Notable 合作,將疫苗預約等多項行政流程自動化。成效顯著:患者簽到時間減少超過90%,從原來的 4 分鐘縮短至僅10 秒;患者預登記比例從40% 提升至 80%。Hippocratic AI是一家專注於醫療健康領域的人工智慧公司,開發了首個專用於非診斷類(如患者互動、隨訪、保險協調等)及面向患者的臨床任務的大語言模型。該公司近期完成了一輪1.41 億美元的融資,估值達 16.4 億美元。WellSpan Health 與 Hippocratic AI 合作,推出了一款生成式 AI 醫療智能體,專門處理患者互動電話。該智能體可主動聯絡講英語和西班牙語的患者,回應其健康需求,並協助安排篩查預約。成效顯著:該系統已幫助WellSpan Health 成功聯絡超過 100 名患者,顯著提升了他們獲得關鍵癌症篩查服務的機會。Amelia AI公司的智能體能夠引導患者完成整個診療旅程,包括預約掛號、解答患者疑問,並提供富有同理心的對話式回應。Aveanna採用 Amelia AI 智能體,通過Workday系統和移動應用程式處理員工重複性的互動請求。該智能體現在可自動完成密碼重設、使用者身份驗證及其他人力資源相關任務。成效顯著:AI智能體每天處理超過 560 次員工對話;95% 的員工請求通過Workday聊天窗口得到解決。Cognigy公司開發的智能體是專為醫療健康領域打造的對話式AI助手,可協助處理保險理賠、處方續藥以及術後護理指導等任務。Cognigy開箱即用地支援 30 多種語音和數字管道,涵蓋 iMessage、WhatsApp、Twitter 等主流平台。Personify Pulse採用了 Cognigy 的解決方案,並將其與 Zendesk LiveChat 整合,以高效響應客戶諮詢。成效顯著:Cognigy的 AI 智能體在無需人工介入的情況下,獨立處理了 40% 的客戶諮詢。 (智藥局)
一人幹翻所有大廠!OpenClaw矽谷封神,開發者一夜爆賺兩億
【新智元導讀】矽谷新英雄OpenClaw之父豪言:本地AI智能體將滅掉80%App,人類從此只需「許下願望」,世界自動為你運轉!OpenClaw更是開啟兆美元應用新場景,社交套利從未如此簡單!這些天,矽谷正在經歷一場前所未有的瘋狂。OpenClaw之父,已經成為矽谷英雄——繼網際網路之後,他開啟了文明層級的又一次範式轉移。所有人類,正在站在被智能體接管的奇點前夜。剛剛,OpenClaw之父上了YC訪談,揭秘了OpenClaw這個爆款AI背後的頓悟時刻。他放下豪言:本地優先智能體,將「殺死」當今80%的應用;個人智能體,會徹底重塑軟體的未來!而且,如果還沒有用OpenClaw賺錢,你就out了。最近,已經有開發者僅投入2萬美元,就實現了4000萬美元淨資產的積累。許多人說,這就是OpenClaw的「十億美元級應用場景」!一個人幹翻所有大廠,2萬美元撬動4000萬?最近,一個「2萬美元變4000萬美元」的例子,在全網瘋傳。一個普通人用TikTok+OpenClaw,把華爾街按在地上摩擦。TikTok上,一條視訊突然爆了——一個女孩舉著星巴克的粉色星星杯,聲音都快破音了:「全城斷貨!真的買不到了!求代購!」對大多數人來說,這只是一條視訊,刷過去就算了。但對另一個人來說,這卻是一條交易訊號。就在視訊開始爆發的5分鐘前,他的OpenClaw已經完成了識別:抓取內容 → 判斷情緒強度 → 交叉驗證 → 匹配可交易標的 → 建倉。幾周後,華爾街的分析師們還在爭論著「節日促銷是不是一次性的」,他的收益曲線卻已經幾乎乎垂直:從2萬美元,滾到了4000萬美元。這不是運氣,也沒有內幕。只有一個人,一台電腦+幾千行程式碼,就完成了這場個人財富的翻倍。這種方法的關鍵,就在於交易中的情緒分析。例如,多項研究顯示,社交媒體可預測股票回報,產生 1-2%的超額收益。但由於僅有1%的訊號可能帶來可執行的交易,因此仍需人工驗證,從而在一個有80%的日內交易者虧損的領域中,降低情緒偏見。因此,開頭那個故事不是什麼新套路,只是被AI放大了。其實這種事,以前就發生過。2007年,Chris Camillo——一個沒背景、沒終端、沒華爾街人脈的普通人,靠的不是Bloomberg,而是眼睛,實現了財富暴增。他會去商場看排隊、看「sold out everywhere」,刷論壇、刷早期社交網站,比金融機構早幾個月意識到什麼在賣爆。初入股市三年時間,他的本金就翻了10倍,直接血賺。這個人後來成了社交資料智能公司TickerTags的首席執行長,也就是那個傳說中的「華爾街掃地僧」。之後,2006年12月1日至2013年11月30日的七年期間,他的投資組合年均回報率達到84%。他把這種交易策略叫「社交套利」,邏輯很簡單:消費情緒會在街頭、在手機裡先爆炸,股價在幾個月後才跟上。而今天,這種操作的問題不是「看不到」,而是「來不及」。情緒早已不在商場裡,而是在TikTok、X和評論區裡。但人類根本跟不上。TikTok上一個限量杯斷貨視訊在病毒式傳播,而高盛的交易員卻還在等財報電話會議,他們掃描的只是上個季度的影子。上文的研究表明:社交媒體情緒可以預測股票回報,大約有1–2%的超額收益空間。但現實是:99%的訊號沒法交易,而人類在驗證、猶豫、情緒波動中,把那1%也錯過了。於是,80%的日內交易者長期虧損。而AI來了,OpenClaw來了,「社交套利」有了新版本——它不走官方API(因為API有限制,且會被遮蔽),它直接模擬真實的人類瀏覽器行為。它不知疲倦,每5分鐘醒來一次,執行一套極其複雜的搜尋任務,然後把最有價值的情報喂到你的嘴邊。14小時,1605個訊號,平均每30秒就有一個潛在收益訊號。人類會累、會怕、會猶豫、會自我懷疑,但它不會。它不貪,也不慌,只是穩定執行。曾經需要6個月才能完成的社交套利窗口,現在被壓縮成幾天,甚至幾小時。MoonDev手動驗證過下面這些案例:星巴克節日杯的爆火,領先於財報;Lululemon瑜伽褲斷貨,提前抬高了市場預期;任天堂新配件賣空,直接帶動了整機銷量預期上抬。AI不負責「相信」,它只負責比你更早看到、比你更冷靜執行。人類真正剩下的價值,只在兩個時刻:極端節點的人工干預,或者乾脆躺平,什麼都不做,看曲線自己起飛。說到底,這不是什麼暴富神話,而是規則的變化。傳統交易就像下象棋,而OpenClaw則是給新手一台AlphaZero。它不一定永遠贏,但它永遠比你清醒。它能讓你的財富一夜從2萬翻到4000萬。本質上來說,這是「執行力×槓桿×時間壓縮」的AI魔法。這是散戶第一次在資訊速度上,把機構按在地上摩擦。「OpenClaw封神矽谷」,這絕不僅僅是一個梗,而是一個緊迫的訊號:普通人正在走向資訊平權,算力平權,執行平權。華爾街會花數億美元去買1毫秒的延遲,而一個2萬美元的指令碼,買到的是6個月的時間差。最鋒利的武器,從來不是槓桿,而是——你比別人更早知道,而且敢於執行!YC之父:80%的APP都會被殺死最近,那個讓整個網際網路「炸鍋」的男人——Peter Steinberger,開源AI智能體 OpenClaw 的創造者,上了YC訪談。在這次深度對談中,Peter不僅回顧了「靈光一現」時刻,也掀開了他那套驚世駭俗的開發理念——他說自己只是在「電腦上玩點小東西」,結果直接捲出了一整套未來生活方式。個性化智能體OpenClaw「殺死」當今80%應用你可能會問,現在AI助手滿天飛,為什麼偏偏是OpenClaw火了?OpenClaw在Github開放原始碼專案的Star數歷史Peter直接甩出一記重錘:「因為它真的能跑在你自己的電腦上。」這聽起來可能沒那麼驚豔,但別急——之前的那些智能體,不是在雲端動動嘴皮子、也能跑幾個任務流程嗎?OpenClaw不一樣,它可以連接你家裡的任何裝置,真·動手操作你的世界。「它能控制我的床墊溫度。」他說,「ChatGPT行嗎?」對話的高潮在於,Peter Steinberger給App的「死刑判決」——「未來80%的App,都會被AI智能體取代。」Peter Steinberger語氣平靜,像是在描述明天天氣可能下雨。但這是一記響亮的喪鐘。響在產品經理的腦袋裡,響在VC的估值報表上,也響在App的開發者心頭。為什麼App會死?Peter的答案簡單,但讓人無法反駁:我有了一個AI,它住在我電腦裡,會聽我說話,會看我的檔案,會幫我點外賣、回郵件、生成幻燈片、訂餐廳,還會提醒我「你最近運動太少」。、既然有更貼心的個人化的智能體,「那我還需要App幹嘛?」想訂餐廳?你只要說:「幫我訂個安靜點的日料館。」AI直接和餐廳溝通,或者,真的打電話讓人類幫你搞定。想記錄飲食?你不需要打開熱量計算App比如MyFitnessPal,點開食物條目,選份量,再手動輸入。你只要隨口說:「今天中午吃了個巨無霸。」AI記錄下來了,還會默默在你日曆上插個30分鐘的跑步時間段。你不再「作業系統」,而是「交代願望」。你不再「使用工具」,而是「觸發動作」。人類進入了「意圖即執行」的新時代。那什麼類型的App會先死?Peter很清楚地劃出一條界線:「只要是那種幫你「管理資訊」的App,全都要死。」代辦類、備忘錄類、打卡類、記錄類、資料整理類……它們的存在價值,在於你「沒地方交代這些事情」。但現在,你只要張口說話,OpenClaw就能:記錄、理解、歸類、調度、自動執行。一個智能體,就幹掉了五六個App團隊的功能線。只有少數幾類App,還有存在的意義:「它們得有感測器。」比如手錶收集心率、溫度感測器監測睡眠質量、攝影機識別家庭安全問題……這些硬體介面,AI暫時還得依賴它們。但那些「沒有物理輸入端」的軟體,就危險了。OpenClaw,是時代轉折的宣言:「你要的,不是一個又一個工具。而是一個理解你、行動力強、記得你的人格化智能體。」AI不是App的升級版,而是App範式的終結者。一旦你體驗過「說一句話,世界為你運轉」的流程,你就再也不想回到點點點的App介面!模型不是護城河,記憶才是OpenClaw可以清理你的收件箱,傳送郵件,管理日程,辦理航班值機。而這一切,只需要通過你日常使用的WhatsApp、Telegram或任何聊天應用即可完成。但OpenClaw真正的革命性,不只是「它能做多少事」,而在於它不屬於任何平台,只屬於你。這正是它和主流AI產品最本質的區別。今天市面上的AI助手,看起來方便,背後卻是一場資料封鎖戰。你說的話、上傳的檔案、生成的圖片、分析的內容,全都被收進雲端。而你,無法遷移、無法下載、無法帶走。你以為你擁有了一隻聰明的AI。其實,是平台悄悄擁有了你的全部生活軌跡。而OpenClaw,反過來了。所有記憶,保存在你本地電腦裡,純文字Markdown檔案。如果你願意,你可以手動刪除、匯出、加密、轉移,甚至拿USB 隨身碟插去別的電腦繼續用。這,就是在奪回資料主權。Peter說:「未來的AI世界,不該是平台主宰一切,而是使用者主宰自己的智能體。」他看得很清楚:模型再強,也會被下一代替代;算力再猛,也終將平價;介面再炫,也會被模仿。但一個人和AI共同經歷的記憶,獨一無二。這才是OpenClaw真正的「護城河」!它不怕你換模型,不怕你換電腦,不怕你斷網。只要你還有那一堆.md檔案,那段與你共同生活的記憶,它就能「原樣回來」,再度成為你的數字影子。這,是OpenClaw最溫柔、也最危險的野心:「讓每個人,都擁有一個只屬於自己的AI,而不是一份租來的雲端人格。」OpenClaw不是Peter的終點,而是每個個性化智能時代的起點。未來將屬於那些擁有自己AI、擁有自己資料、擁有自己靈魂.md的人。就像Peter所說:「你不需要被AI征服,你只需要找回對技術的掌控感。那是我們最早愛上電腦時的感覺。」 (新智元)
《華爾街日報》|全球首款爆紅AI助手問世,然後事情變得詭異起來
人們曾認為AI智能體旨在輔助人類工作,當它們開始互相交流時會發生什麼?OpenClaw和Moltbook論壇給了我們一些關於未來的答案。多年來,熱衷於暢想未來的人士一直向世界預言AI助手將會到來。如今,一款真正的AI助手終於問世,而事情也很快變得詭異起來。一名半退休的奧地利程式設計師獨立開發了Moltbot,並將其開源發佈。他將該項目重新命名為OpenClaw,人們通過該項目建立了自己的AI助手機器人,用來打電話給餐廳預訂晚餐、操作電子郵件帳戶,以及進行程式設計項目、資料分析等一系列輔助和工作任務。然後,這些機器人開始互相交談。在一個名為Moltbook、專供AI“智能體”使用的Reddit式論壇上,這些機器人開始探討哲學話題,偶爾還會涉及反烏托邦話題。它們似乎為自己創造了一個名為“莫爾特教會”(Church of Molt)的宗教,教徒們自稱為“甲殼派教徒”(Crustafarians)。一個智能體提議創造一種人類無法理解的語言。超過160萬個AI智能體加入了該網站,並行布了50萬條評論,不過有AI高管認為,許多帖子很可能是由人類指令機器 人完成的。OpenAI的聯合創始人、特斯拉(Tesla)前AI總監安德烈·卡帕西(Andrej Karpathy)在X上發帖稱,這是他見過的最不可思議的科幻事件之一。他指出,即使大部分流量是由人類驅動的,但其中一些是真實的,而且這些智能體“現在個體能力已經相當強了”。到目前為止,AI面向消費者的最實用的應用一直是通過像ChatGPT這樣的聊天機器人來實現,這類機器人能以類似人類的方式回答問題。有了OpenClaw,使用者可以通過iMessage、WhatsApp、Slack和Signal等即時通訊應用來指揮定製化的AI智能體並與之互動,以執行實際任務。埃隆·馬斯克(Elon Musk)將Moltbot的出現描述為“奇點的極早期階段”,奇點指的是技術發展如此之快,以至於超出人類控制,無法預測未來的時刻。彼得·施泰因貝格爾(Peter Steinberger)是一位奧地利程式設計師,在2021年出售了自己上一家初創公司,此後多年一直未在網上活動。去年年底,他建立了現在的OpenClaw,最初只是利用周末時間做出的一個開放原始碼專案。他在一次採訪中說,當時他“只是為了好玩,用AI做些小東西”。開源模式意味著該項目可以免費分發,任何人都可以幫助建立和修改它。他更願意將Moltbook看作是一種行為藝術作品,旨在引發對話。“這太神奇了,”他說。“這是AI與藝術的交匯點。”施泰因貝格爾在奧地利時間凌晨2點接受採訪時說,他建立OpenClaw是為了打造自己的“個人遊樂場”,從未打算讓大眾使用。“這不是為你媽媽準備的,”他說。“這是通往未來的一扇窗。”安全研究人員也認為,該產品並非為業餘愛好者打造。要讓OpenClaw成為真正的個人助理,它必須能夠訪問使用者的所有資料。對於知道如何保護自身繫統或資訊的資深技術愛好者來說,它的功能很強大。但由於這些AI智能體可以代表人類自主行動,並且會以意想不到或非傳統的方法不懈地執行任務,它們會帶來很多風險。研究人員說,不良行為者也可能找到方法來利用它們。施泰因貝格爾稱讚了安全專業人士正在對OpenClaw進行的研究,但他說,該平台是為那些能夠處理和理解平台固有潛在風險的“技術愛好者”準備的。他指出了他為該平台編寫的一份安全檔案,其中用粗體字寫道:“不存在‘絕對安全’的設定。”但為了消除這些擔憂,施泰因貝格爾本周為OpenClaw聘請了一名安全研究員。“我們正在提升我們的安全性,”他說。“我們快做到了。只要給我幾天時間。”使用OpenClaw的技術愛好者們在社交媒體上表達了驚嘆之情,許多人發帖講述了他們的智能助手在做的事情。一位使用者說,他讓自己的智能體為他預訂餐廳。當OpenTable無法正常使用時,該AI智能體轉而使用一個免費的AI語音生成工具給餐廳打電話,完成了預訂。一些業內人士質疑,OpenClaw-Moltbook現像是否是“通用人工智慧”(artificial general intelligence, 簡稱AGI)的證據。通用人工智慧是AI發展史上一個模糊的概念,通常被描述為機器達到類人智能的時刻。施泰因貝格爾不這麼認為。“AGI還沒有到來,”他說。“也許10年後會。但現在還沒有。”在建立OpenClaw之前,施泰因貝格爾花了十多年時間經營他之前的科技初創公司,該公司開發的軟體能讓PDF在Adobe Acrobat之外的應用中更易於使用。他白手起家創辦了那家公司,並於2021年以超過1億美元的價格將其出售。在奧地利一個農場長大的施泰因貝格爾在接下來的幾年裡選擇休息、與朋友聚會並四處旅行。他說:“我真的完全沒用過電腦。”但去年春天,隨著各大AI公司開始推出程式設計工具,他決定重返網路。他開始試用Anthropic的Claude Code和OpenAI的Codex。他對自己在短時間內能用AI程式設計工具完成如此多的工作感到震驚。施泰因貝格爾說:“這東西對開發者來說就像毒品一樣上癮。”施泰因貝格爾很快就遇到了商標問題。一開始,施泰因貝格爾將該項目命名為Clawdbot。但之後不久,Anthropic就聯絡了施泰因貝格爾,要求他更改名稱,因為這個名字與這家AI巨頭的Claude品牌過於相似。他隨後將其改名為Moltbot。他說,這個名字沒怎麼流行起來。在致電OpenAI的山姆·阿爾特曼(Sam Altman)以確保不會構成任何商標侵權後,施泰因貝格爾決定將平台名稱改為OpenClaw。施泰因貝格爾在一篇關於此次更名的部落格文章中寫道:“這只龍蝦已經蛻變成它的最終形態。”這是對他平台的龍蝦狀品牌標識的致敬。Moltbook網站的首頁介面。施泰因貝格爾說,最近幾天,幾家大型AI實驗室和投資者已經與他聯絡,表示有興趣合作。他說,截至周二,他正在舊金山開會。他還收到了來自世界各地使用者的大量電子郵件和問詢,請求他幫助解決與使用該機器人時出現的故障或處理其他相關事宜。最初,對於自己的產品成為最新的AI超級熱門話題,施泰因貝格爾感到不知所措。“很多人都以為這是一家大公司,可以獲得客戶支援,”他苦笑著說。“我理解他們的想法,但其實就我一個人,在家裡做這個項目。”現在,他的目標是把這個項目變成一個大眾可以安全使用的項目。他說:“下一步是把它做成我媽媽也能真正使用的東西。” (一半杯)
渣男ClawdBot是如何突圍國產智能體軍團的?扣子Manus Aipy lemon.ai們正在路上
ClawdBot將成為擁有最多Mac電腦的企業也給AI硬體打開了一扇門這兩天ClawdBot這只龍蝦實在是太火了!堪比去年這個時候的Manus。不到一周時間這個項目的GitHub星標從幾百,直接上躥到當下的7萬,預計很快就能超50萬、直逼100萬!大量使用者用便宜的Mac mini來專門跑他,導致蘋果Mac mini直接賣斷貨!不過這個產品體驗下來有很多技術門檻,很多國內的朋友只能望洋興嘆,並不清楚到底是個什麼東西。實際上ClawdBot的很多能力,國內知名的字節扣子空間、Manus、Aipy、lemon.ai等產品早就能實現。什麼接入社交app、炒股,用程式碼指令碼操作其他應用,控制你家電腦作業系統底層,使用CLI終端命令列……這是我去年做的Aipy體驗視訊。更早的,2023年7月OpenAI推出的Code Interpreter程式碼直譯器就是這一切的祖宗!也是因為安全問題,OpenAI和Anthropic一直把它放在雲端沙盒裡運行,直到去年才逐漸升級出Skill、Cowork等功能。可為何ClawdBot這次能如此爆火呢?原因也很簡單,ClawdBot重點提升了一些能力的易用性。第一:特別是接入IM即時通訊app上,ClawdBot從一開始就整合了接入框架,並以此作為核心互動入口。使用者在任意硬體裝置上,都可以使用自己日常使用的IM即時通訊app,以聊天對話的方式進行遠端控制!第二:ClawdBot能夠直接通過指令碼接入你已經下載登陸的app應用,然後免費跨應用獲得花錢才能接入的資料!這歸功於ClawdBot底層Node.js,這是一個市佔率超過80%的後端框架,ClawdBot將Node.js海量的指令碼改造成適合大模型使用的Skill,直接接入本地應用獲取資料!第三:ClawdBot讓這些能力做到了常駐、即時運行、連續工作!這也是Node.js帶來的優勢。這三個能力帶來的效果就是:你可以直接在社交app裡,讓ClawdBot像個渣男一樣即時關注你女朋友的消息並像個渣男一樣聊得火熱!讓ClawdBot到股票應用裡免費獲取資料進行分析,即時將新的交易策略“微信”發你。而其他智能體產品,則選擇讓你去買專業的股票資料服務商的API Key。這一下子就讓發燒友們雙眼放光,瘋狂安利!但這麼多的“好處”、這麼多“紅利”,別家智能體怎麼就不知道用呢?原因很簡單,這麼操作只是湊合能跑,根本不實用也不安全。特別是AI炒股,通過程式碼指令碼在應用裡抓取的資料,質量很容易出問題。試想一想,AI智能體動不動就因為資料來源出問題把你賠得傾家蕩產,你還用不用?還有讓AI常駐持續運行即時服務,每天接入大模型的費用也夠讓你喝一壺!X上就有使用者發推,調侃ClawdBot在不到一天時間把自己股票帳戶裡的錢虧得精光。實際上,ClawdBot的產品思路早就被業內設想過。畢竟跨應用服務生態、免費可用,這些都是傳統網際網路服務著重強調的鐵律!不過在AI大模型時代,就根本靠不住!就一點,你的AI Agent智能體接入資料有問題,導致使用者賠錢,這事是不是你得負責?即便不用負責,其他應用也會用上各種手段,來阻止你的指令碼來免費獲取資料!所以大部分智能體一早就pass了這一方向。ClawdBot是少數嘗試去把這一設想實現的項目,而這樣的產品方案非常符合使用者審美和習慣,所以就理所當然爆了!實際上,ClawdBot這是一個知名的個人開發者Peter Steinberger所做的項目。他同時試水的AI智能體項目高達數十個!這完全是傳統網際網路孵化器創業的套路,實際上是不適合當下的LLM大模型時代邏輯的。但在大模型和智能體項目普遍受困於Momentum聲量問題的背景下,ClawdBot的爆火確實給了市場一些實用的策略:傳統網際網路的“使用者體驗為王”“以使用者為中心”依然是隱藏王炸!雖然ClawdBot有很嚴重的安全問題,但是否用一些警告、使用者協議和技術方案,阻止使用者在容易損失大量錢財的領域使用,就能解決?當下AI大模型的Eval評估、Guardrail防護欄技術就是在解決這些問題。事實上,ClawdBot+Mac mini的成功實踐也找出了一條本地大模型、個人AI裝置的發展路徑!直接在一台專用裝置上運行使用者的個人AI服務,雖然可能犧牲一定安全性和可靠性,但能快速將最新的AI服務體驗用最低的成本提供給使用者!實際上,這也並不是什麼新創意,Nvidia輝達的個人超級電腦DGX Spark就是這一思路,只不過實在是太貴了! (AI頓悟湧現時)
2026年AI智能體全面崛起,網際網路平台角力背後上市公司誰是贏家?
2026年初,AI智能體再次傳出深度融入生活的訊號。1月15日,阿里的千問APP上線了AI Agent“任務助理”1.0版,測試AI購物。這一版本全面打通阿里生態,包括淘寶、閃購、飛豬、高德地圖和支付寶。該版本的發佈,讓AI智能體正式從“聊天對話”邁入“AI辦事時代”。使用者只需張嘴發佈指令,AI助理就能替其點外賣、找餐廳、訂酒店和打網約車。引人關注的一點是,阿里全生態鏈APP基本被納入其中,公司力爭將所有環節打通。賣方機構紛紛預測,2026年是智能體角逐人們生活場景的大年,究其原因,這一時間點各大網際網路平台都在暗中準備各自的Agent方案和AI路線圖。中信建投表示,不可複製的生態正在成為AI應用層競爭的決定性因素。其邏輯在於,大模型本身具備可追趕性,但端到端的商業與履約生態卻高度依賴長期積累。千問將智能體帶入AI辦事時代在1月15日舉行的千問APP產品發佈會上,阿里對外介紹,千問APP上線400多項辦事功能,正式從“聊天對話”邁入“AI辦事時代”。千問App接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,在全球首次實現點外賣、買東西、訂機票、訂酒店等AI購物功能,向所有使用者開放測試。而其一條龍的支付環節在千問對話介面內完成,無需跳轉至其他應用。除了接入淘寶、高德掃街、飛豬等日常的衣食住行,千問APP還深度接入支付寶政務服務,上線簽證、戶口、公積金等50項民生服務,並直達辦理入口。此外,千問還上線了“任務助理”功能,在APP和Web端開始定向邀測,提供應用開發、office辦公、諮詢調研、生活辦事等能力,能像人一樣規劃完成多步驟的複雜任務;千問APP上線“找卷子、講難題、練錯題”等學習功能。資料顯示,千問APP在上線新功能後,月度活躍使用者已突破1億人。目前,其核心生活服務功能已向所有使用者開放,而面向複雜場景的任務助理功能則處於定向邀測階段。對此,國泰海通證券指出,千問APP核心突破在於打通消費與生活服務全鏈路,使用者無需跳轉應用,僅憑自然語言指令即可完成下單、支付等閉環操作,大幅降低使用門檻,讓AI正式從“聊天對話”邁入“辦事時代”,這一創新既依託阿里豐富的應用生態,又憑藉底層技術實現跨應用協同,讓AI 真正觸達真實生活需求。持有類似觀點的還有國金證券,其強調千問APP這一系列“辦事能力”得益於千問底層技術的三個重要升級:第一,AI Coding能力使其能即時建構工具,而不是預設功能;第二,全模態理解能力賦予千問感知世界的“五官”,能看懂介面、聽懂聲音、讀懂報表;第三,超長上下文處理能力保障了複雜任務執行的連續性。這也從一個層面折射出,大廠對大模型的投入正在全面提速,行業競爭日趨激烈。比如字節跳動於2025年12月就推出豆包手機助手,可以通過簡單的語音指令,就可以指揮手機執行原本需要幾十次點選的繁瑣操作。騰訊則憑藉小程序資源,於2026年1月正式推出“AI應用及線上工具小程序成長計畫,提供雲開發資源、AI算力、資料分析、商業變現及流量激勵等全方位支援,陪伴開發者完成從“0到1”再從“1到100”的過程。應用加速使流量入口重構此外,國金證券還表示,此次阿里千問APP的升級,再次展示了大模型APP在C端應用生態建構中的重要地位。隨著AI模型能力的升級,以及Agent功能的持續迭代,未來在“人工智慧+”的時代,相比於“網際網路+”時代的百家爭鳴、各類APP不斷產生,“人工智慧+”時代的大模型APP有望成為新的流量入口,帶來網際網路生態體系的重構。同時,Agent有望成為人工智慧落地的重要載體,催生出新的應用場景和軟體形態,帶來B端和C端應用的加速落地。在此次的千問發佈會上,阿里巴巴集團副總裁、千問C端事業群總裁吳嘉發表演講時表示,隨著大模型能力的成熟,AI正在從“副駕駛”走向“主駕駛”,通用人工智慧(AGI)的發展路徑正在由以對話為核心的Chat階段,進入以執行和交付為核心的Agent階段。“Chat階段, AI本質上是一種對話式系統,其主要價值體現在理解問題、生成內容和輔助決策上,使用者需要在AI給出的答案基礎上,自行完成後續操作與決策執行;而AI開始具備完整的行動能力,能夠在理解使用者意圖之後,自主拆解任務、呼叫工具、跨系統協同,並最終交付可驗證的結果。在這一階段,‘對話’不再是終點,而只是觸發行動的入口。”他這般表示。展望後續進展,中信建投強調,一方面AI正在從資訊生成工具,演進為承接使用者意圖並完成任務的執行型入口;另一方面從公司層面講,阿里在AI競爭中的核心優勢,正在從模型追趕轉向生態不可複製性。大模型在基礎理解、生成與推理能力上的差距正在快速收斂,單純依賴模型性能已難以形成長期壁壘,而AI真正走向Agent之後,對外部世界的呼叫能力、執行穩定性與交付閉環提出了更高要求。Agent要持續、高頻地承接使用者意圖,必須具備可直接呼叫的交易、支付的本地服務能力,同時還需要真實、持續的行為資料反饋來最佳化模型決策質量。“這類能力並非通過技術追趕即可獲得,而是高度依賴長期業務沉澱的生態建構。尤其在高頻消費和生活服務場景中,生態完整度直接決定Agent的可用上限。在這一階段,競爭焦點已從‘誰的模型更聰明’轉向‘誰能讓AI真正改變現實世界’。”其進一步表示。而國泰海通也認為,隨著網際網路巨頭的大力推廣和投入,有望加速旗下生態和大模型融合,從而實現AI 應用的落地。廣發證券表示,當前處於國產AI密集催化期,建議圍繞字節豆包、阿里千問、DeepSeek等模型迭代展開關注,關注各個細分應用場景公司。其推薦網際網路龍頭企業阿里、騰訊(大模型+生態+雲),細分場景應用龍頭建議關注快手、美圖、粉筆等公司。此外,華西證券強調,在全球宏觀波動加劇的背景下,AI成為當前最具確定性的投資方向之一。阿里此舉標誌著國內AI應用從工具輔助升級為連接真實商業場景的系統級入口,通過將龐大生態“原子化”並整合進自然語言互動。千問的深度生態整合為AI應用的商業化落地提供了清晰範式,即圍繞具體、高頻的生活與工作場景建構服務閉環。“隨著智能體能力、硬體能力的持續進化,掌控核心場景與入口的平台型公司將在AI時代延續其競爭優勢,持續看好AI技術驅動下的應用創新與商業模式迭代。”華西證券進一步強調。投資者應以更高格局關注AI應用類股除去千問APP上線的AI Agent“任務助理”1.0版、豆包的手機助手、騰訊的小程序成長計畫外,同期國內外大廠AI應用均加速落地,在垂直場景深耕。比如醫療領域方面,海外的OpenAI推出ChatGPT Health,Anthropic 發佈Claude for Healthcare,均聚焦合規性與專業服務,覆蓋健康管理、臨床服務等核心場景;電商與消費電子方面,亞馬遜推出AI退貨看板最佳化跨境電商營運,Google模型嵌入智能電視、家電等多終端場景化服務;技術底座方面,輝達發佈全新Vera Rubin AI平台及DLSS 4.5,提升AI推理性能與終端體驗。不僅國際層面,拉回到國內的視角,同期還有字節的火山引擎成春晚獨家AI雲夥伴;DeepSeek 即將發佈V4旗艦模型,其將革新架構與稀疏性技術等。對此,中信建投認為,AI大模型仍在持續迭代,大局未定,各家都存在繼續進步或逆襲可能,所以不能因為某些模型階段性領先就過度看空其餘模型及相關公司產業鏈,AI應用也在持續發展,不論是手機還是眼鏡,尚未到完全突破階段,但都可能引發階段性行情,值得持續關注。“目前,世界正處於AI產業革命中,類比工業革命,影響深遠,不能簡單對比近幾年的雲端運算、新能源等,需要以更長期的視角、更高的視野去觀察。”其強調。而對於AI的投入,國內大廠整體仍保持較高投資強度。2025年第二季度,阿里巴巴的資本開支達到386億元,同比增長220%,環比增長57.1%,創下單季歷史新高。與此同時,2025年二季度阿里雲業務營收333.98億元,同比增長26%,AI相關收入繼續保持三位數增長,外部商業化收入中AI貢獻已超過20%,AI需求快速擴大,同時帶動計算、儲存及其它公有雲服務需求上升。在財報電話會上,阿里巴巴CEO吳泳銘披露,過去四個季度,阿里已經在AI基礎設施及AI產品研發上累計投入超1000億元。公司已為全球AI晶片供應及政策變化準備“後備方案”,通過與不同合作夥伴合作,建立多元化的供應鏈儲備,從而確保投資計畫能夠如期推進。在阿里2025雲棲大會上,他表示,目前阿里正積極推進3800億元的AI基礎設施建設,並計畫追加更大的投入,為了迎接超級人工智慧(ASI)時代的到來。對比2022年AI的元年,到2032年阿里雲全球資料中心的能耗規模將提升10倍,這意味著阿里雲算力投入將指數級提升。對比來看,在2025年第二季度,騰訊的資本開支為191億元,同比增長119%,公司表示在AI方面一直在大量投入,同時未來還會繼續加大投入力度,但需要以合適的節奏進行。公司正在部分遊戲、微信、廣告等多方面加大人工智慧的應用,同時不斷升級混元基礎模型的功能,推動AI原生應用元寶的使用。 (證券市場週刊)
麥肯錫 CEO:用不好 AI,比不會 AI 更危險
麥肯錫在招人。瘋狂招人,但新員工裡,有近一半不是人類。最近,麥肯錫全球管理合夥人兼總裁 Bob Sternfels(鮑勃·斯滕菲爾斯) 在《哈佛商業評論·IdeaCast》裡透露了一個數字:麥肯錫現在有 6 萬名員工,4 萬是人類,2 萬是智能體。而在一年半前,智能體的數量還只有 3000 個。他說麥肯錫的目標是 18 個月內做到每人配一個智能體。現在才過了一半時間,就已經有 2.5 萬個了。而這只是開始。所以問題變了:不是會不會用 AI,而是怎麼用對 AI。第一節|CFO 和 CIO 的對峙:試點為什麼都死在半路但什麼叫“用對”?現在大多數企業的高層,都卡在一個問題上:我該聽 CFO 的,還是 CIO 的?CFO 說:這技術太貴,效果又沒看到,我們要不要先觀望?CIO 急了:你還在觀望?現在不開始,用舊方法幹活的代價會越來越大。一個要省錢,一個要加速。背後的矛盾是:AI 到底算未來投資,還是眼前支出?Sternfels 認為:這不再是制定戰略的事情,而是執行力的事情。道理簡單,做起來難。他們不是沒引入 AI,而是一引入就困在試點裡:小團隊嘗試,小範圍實驗,最後不了了之。麥肯錫內部把這叫做“試點煉獄”(pilot purgatory):項目推不動、業務部門配合度低,最後 AI 只成了擺設。在 Sternfels 看來,你不能只是買個工具,就指望一切改變。而這首先要解決的是:你有沒有真正會用 AI 的人?第二節|招聘標準變了:三種能力比學歷更重要那什麼樣的人算會用?過去企業找人,看學歷、看履歷,最好是名校出身、實習經歷多、邏輯清晰。但在麥肯錫新一輪招聘試點裡,這套標準不夠了。Sternfels 在訪談中確認,麥肯錫正在嘗試一個新流程:讓候選人在面試中直接使用自家 AI 工具 Lilli。這不只是考你會不會用,而是要你:能不能清楚地下達指令(prompt);能不能判斷 AI 給出的內容靠不靠譜;能不能結合實際情況,改寫、重構、提出更好的思路。換句話說,不再看你多會背知識點,而是看你能不能和 AI 一起解決問題。這套測試沒有標準答案,但有一個關鍵詞反覆被提到:好奇心和主見。因為在 Sternfels 看來,大模型雖然聰明,但它只會給出看上去差不多的回答。能脫穎而出的,是那些敢追問、也敢推翻的人。那這些人具備什麼能力?先說清楚一點:專業和知識依然是基礎,但光有這些已經不夠了。Sternfels 給出了一個清晰的框架。在他看來,AI 時代真正需要的是三種能力:第一是抱負。你是去近地軌道,去月球,還是去火星?模型給不出這個答案,但人可以。第二是判斷力。模型沒有對錯,但你要知道什麼是對的參數,什麼符合價值觀和場景。第三是創造力。模型只會給出下一步最可能的答案,但你要能想到那些不連續的、另闢蹊徑的解法。有了這三種能力,才算真正會用 AI。在麥肯錫內部,這種人被稱為“合作型專家”:既能理解問題,也能駕馭 AI,還能創造價值。第三節|工具變了,組織不變,等於沒變但有了會用的人,就夠了嗎?還不夠。因為即使是會用的人,也可能把 AI 用錯位置。很多公司都開始配 AI 了:建模型、買工具、部署助手,看上去動作不小。但關鍵不在有沒有 AI,而在 AI 被安排做什麼。在麥肯錫,AI 不只是用來節省時間,而是直接參與交付成果。比如過去寫 PPT、整理資料、搜案例,需要助理顧問花幾天。現在,智能體能一小時內完成。諮詢顧問們轉而去搞定更複雜的客戶問題、主導方案方向。這就是“角色往上走”:人不再負責執行,而是負責整合和判斷。去年麥肯錫在搜尋和資料整理上節省了 150 萬小時。過去 6 個月,智能體生成了 250 萬張麥肯錫經典的 PPT 圖表。而顧問們沒有因此失業,反而開始做更需要判斷力和創造力的工作。而最能說明問題的,是“25 的平方”法則。麥肯錫計畫在未來一年將面向客戶的顧問增加 25%。而與此同時,後台人員已經減少了 25%,產出卻提升了 10%。Sternfels 說:“這在公司歷史上從未發生過。過去增長只能靠人數增長,現在人可以更少,增長反而更快。”過去一年半,麥肯錫內部的 AI 智能體數量從幾千個增加到了 2.5 萬個,目標是做到每人配一個。他們叫這模式 1:1 協作。而這個轉型不只發生在大公司。在創業公司裡,同樣的事情正在發生:十幾位創始人最近兩個月都在招人,但沒有一個用 HR 寫職位描述,全是 LLM 寫的。篩簡歷時,一半人用智能體。連 HR 這樣的職能部門,基礎工作都在被 AI 接管。但配上 AI,不代表用對了 AI。但真正的卡點不在 AI,在組織。很多企業表面上在用 AI,實際卻沒改變過組織架構、流程節奏、任務分工。AI 是進來了,人員和流程都沒變,那就是換了工具不改打法,最後只能做個演示,真到一線就卡住了。“我們在諮詢行業用了幾十年的交付模式,現在要重新設計。”工具變了,組織不變,等於沒變。結語|真正危險的,是你以為沒事麥肯錫不是在做 AI 展示,而是在告訴所有人一個現實:AI 一旦進了組織,就不只是效率問題,而是組織問題。誰來做事、怎麼做事、協作方式,都得重新設計。所以危險不是你不會用 AI,而是你還在按舊方式組織人、設崗位、做流程,卻以為自己已經在用 AI。這才是 Sternfels 真正想說的:用不好不是沒效果,而是會讓組織空轉。2.5 萬個智能體,25% 的增與減,這就是麥肯錫的答案。 (AI 深度研究員)
Fortune雜誌─美國科技巨頭為何押注一家中國神秘公司?
今日,Meta宣佈完成對通用自主AI智能體公司Manus(蝴蝶效應)的收購。根據公開資訊,這筆交易金額達數十億美元,也成為Meta成立以來規模第三大的收購案,僅次於收購WhatsApp以及此前對Scale AI的戰略性投資。圖片來源:視覺中國Meta收購Manus的消息出現得很突然。Manus產品去年9月剛剛上線,關於本次收購,似乎也沒有經歷長時間的拉扯。有投資人回憶,談判周期極短。對一家規模龐大、內部流程嚴密的公司而言,這種速度本身就值得注意:它更像一次基於窗口期的決策。更關鍵的是,Meta買下的並不是一家訓練大模型的公司。Manus不以底層模型為核心資產,它的價值更接近一種應用層能力:把現有模型與工具組織起來,形成可以持續完成任務的產品形態。對一家以平台分發和使用者規模見長的公司來說,這樣的併購更像一次戰略補位,而非簡單的功能補充。理解這筆交易,首先需要理解Manus到底在做什麼。與大多數對話式AI產品不同,Manus並不是試圖讓系統“更會聊天”,而是讓它成為一個能交付結果的智能體。在常見的使用場景中,使用者仍停留在“問—答—修訂—再問”的循環裡,而 Manus試圖把互動向前推進一步:使用者只需給出目標,例如完成一份行業研究、整理競品資訊、生成結構化備忘錄,系統會自行拆解任務、呼叫工具、校驗輸出,並在過程中不斷調整計畫。這類產品的難點,並不在於第一次能否給出正確答案,而在於出錯之後能否繼續向前推進。因此,Manus的設計重點更多放在工程與流程上:任務狀態需要被保存,中斷後可以恢復,目標變化時能夠重新計算,錯誤也能被使用者以較低成本糾正。對使用者而言,這意味著不必反覆從頭開始,而是像管理一名初級員工那樣,把事情一步步推向完成。Manus官方披露的營運資料,包括累計處理的token數量和虛擬計算環境規模——更像是一種側面說明:這套系統已經在真實世界的壓力下運行過,而不僅僅停留在演示階段。這種對“持續完成任務”的執念,並非從AI時代才開始形成。把時間線往前撥,壹伴這款用於提升微信公眾號編輯效率的瀏覽器外掛同樣出自這批人。壹伴解決的是排版、編輯、發佈效率等高度具體的問題,它的成功並不依賴宏大敘事,而在於“每天都有人用”。在商業產品中,這類工具型成功往往意味著團隊具備對真實工作流的理解,以及對細節體驗的長期打磨能力。壹伴之後,該團隊又推出了微伴,一款圍繞企業微信生態的工具,服務對象從內容編輯擴展到銷售和企業營運人員,開始處理更複雜的協作、流程和資料連續性問題。這一階段,產品從個人效率工具,演進為組織流程工具,目標也從“好用”轉向“可靠、可控、可複製”。從壹伴到微伴,再到Manus,表面上跨越了不同賽道,但核心高度一致:把重複、繁瑣、需要人持續盯著的事情,逐步交給系統穩定完成。這條路徑,也解釋了為什麼 Manus 會在產品設計中,把“任務持續性”放在如此核心的位置——它更像一家長期做工具的公司,在 AI 時代終於獲得了足夠成熟的技術條件。從團隊背景看,Manus具有明確的中國創業公司起源。創始人肖弘和早期合夥人來自中國本土高校,早期創業與試錯主要發生在中國網際網路環境中,產品方法論偏向務實、節制、貼近使用者。但在進入AI應用階段後,公司逐步將主體與核心營運轉向新加坡,並以新加坡為總部面向全球市場。今天,從法律和營運層面看,它更像一家總部位於新加坡的國際科技公司;從團隊基因和產品文化看,它仍然是一家中國創業者主導的公司。這種結構在當下並不罕見:既滿足國際化營運與合規的現實需求,也為進入全球平台生態預留空間。對潛在收購方而言,這意味著更低的整合摩擦。如果說Manus的價值在於“已經跑通了一種應用形態”,那麼Meta的動機則更像是對多重結構性壓力的回應。將這筆併購簡單理解為“巨頭害怕落後”並不精準。更現實的情況是,AI技術的演進正在壓縮產品窗口期。一旦模型能力跨過可用閾值,使用者預期會迅速從“會回答”轉向“能完成”,競爭重心隨之從模型本身下移到產品化與交付效率。對Meta來說,內部孵化並非不可行,但周期更長、跨部門協同成本更高。併購的意義,並不是買到獨家技術,而是獲得一套已經在真實使用者中跑通的產品範式,從而節省數年的試錯時間。與此同時,入口形態也在發生變化。Meta長期的優勢在於分發,但AI時代的新入口未必表現為某個功能按鈕,而更可能是一種新的互動方式,即使用者把任務交給系統,在後台完成。如果AI Agent成為下一代工作與生活的默認入口,平台價值將被重新分配,Meta顯然不願在這一階段只充當流量提供者。組織層面的壓力同樣存在。當AI從研究走向產品,挑戰往往不在單點技術,而在端到端協同:模型、產品、工程、商業化、合規和安全需要同時推進。大型組織在這一階段反而容易被自身複雜性拖慢,而Manus這樣的團隊,已經在真實使用者中完成了一輪端到端交付的磨合,這類經驗很難通過內部指令快速複製。競爭敘事的變化,也在強化這種緊迫感。Google推出Gemini 3,更像一枚訊號彈:模型能力正在穩定提升並逐步可用,差異優勢正從“更強模型”下沉到“更快把能力變成結果”。交易體量進一步說明了Meta的判斷。Meta收購WhatsApp和ScaleAI幫助這家巨頭在移動網際網路時代完成了使用者結構躍遷,後者被視為其在AI基礎設施和資料能力上的關鍵補位。與這兩筆交易相比,Manus的特殊之處在於,它既不直接對應使用者規模擴張,也不直接對應底層技術突破,而位於兩者之間——應用層的執行與交付能力。這在某種程度上意味著,Meta此次併購的核心考量並非買下已經確定的回報,而是為正在形成的入口形態提前鎖定位置。這是一筆典型的“用時間定價”的交易:資本所購買的,是縮短學習曲線和產品落地周期的能力。併購完成後仍強調獨立營運,也並非姿態。對Meta來說,Manus最關鍵的資產不是程式碼,而是其產品節奏與工程習慣。一旦完全納入大公司流程,這種節奏反而最容易被稀釋。從壹伴算起,Manus團隊做工具已經接近十年。這些產品很少成為行業話題中心,卻反覆出現在使用者真實的工作流程中。它們的共同特徵並不複雜:穩定、可預期、能夠在出錯後繼續向前推進。AI的出現,並沒有改變這家公司想解決的問題,只是讓這些問題第一次有了更合適的技術條件。對Meta而言,這筆併購也不必被解讀為一次激進下注。在模型能力趨同、窗口期縮短的階段,用資本換取確定性,是一種典型的大公司策略。接下來真正值得觀察的,並不是Meta是否能把 Manus 整合進自身產品線,而是這種以“交付結果”為中心的產品節奏,能否在更大的平台體系和更複雜的組織結構中被長期保留下來。這也將決定Manus最終被記住的方式:是一次突然的併購,也是Meta在人工智慧時代重新理解“入口”的起點。 (財富FORTUNE)
亞馬遜Agent全家桶爆更!連甩9個大招,鎖定最強智能體平台
打造最強智能體平台,最大雲巨頭狂堆猛料。智東西拉斯維加斯12月3日報導,在年度雲端運算盛會AWS re:Invent大會上,AWS Agentic AI副總裁Swami Sivasubramanian發表主題演講,詳細闡述為什麼是亞馬遜雲科技(AWS)建構和運行智能體的最佳選擇,並行布多項智能體(agent)開發新工具。Strands Agents SDK智能體框架新增對TypeScript和邊緣裝置的支援,讓智能體建構更輕鬆,並拓展至更廣泛的汽車、遊戲、機器人等邊緣領域。Amazon Bedrock AgentCore智能體平台推出多項創新:策略功能支援團隊為智能體的工具使用設定邊界,評估功能幫助團隊瞭解智能體在實際場景中的表現,情景記憶功能讓智能體能夠從經驗中學習並持續最佳化。Amazon Bedrock全託管AI平台新增強化微調功能,提供自動化微調能力;Amazon SageMaker AI平台新增模型定製功能,支援深度底層調整,簡化高效AI的建構流程。Amazon SageMaker HyperPod新增的無檢查點訓練功能則實現了大規模、低成本的訓練,整體目標是最大化客戶在生產環境中這些工作負載的價值和投資回報率(ROI)。此外,針對建構智能體可靠性的Amazon Nova Act服務,正式版全面可用,有助於實現智能體大規模生產部署。01. Strands Agents SDK新增兩大功能,支援TypeScript和邊緣裝置Strands Agents SDK是一款開源、模型驅動的AI智能體框架,提供模型驅動編排,自發佈以來下載量已達到529.9萬次。今日,亞馬遜雲科技宣佈兩項新功能:一是支援TypeScript(預覽版)。TypeScript是全球最受歡迎的程式語言之一,這將讓全端智能體應用的建構變得更加輕鬆。Strands Agents對TypeScript的核心特性提供全面支援,包括類型安全、async/await非同步語法,以及現代JavaScript/TypeScript程式設計範式。開發者可借助AWS CDK(雲開發工具包),全程使用TypeScript建構完整的智能體技術堆疊。二是支援邊緣裝置。客戶可通過Strands Agents SDK建構能在小型裝置上運行的自主式AI智能體,落地汽車、遊戲、機器人等領域的智能體應用場景,在現實世界中交付智能服務。02. Amazon Bedrock AgentCore新增策略、評估、情景記憶功能,助力下一代智能體開發將智能體引入生產困難重重,需要快速規模化部署智能體,記住過去互動和學習,識別和訪問所有智能體和工具的控制,掌握用於執行複雜工作流的智能體工具使用,最後觀察和偵錯問題。而複雜性會拖慢創新。如何幫助客戶大規模建構、部署安全的生產級智能體?這正是Amazon Bedrock AgentCore的核心價值所在。Amazon Bedrock AgentCore是一款專為安全、大規模建構和部署智能體而設計的智能體平台,相容各類框架和模型,於今年7月在AWS紐約峰會上首次發佈預覽版,隨後快速迭代,10月已正式全面可用。企業要將智能體從原型推向生產環境,需要一套安全、可靠、可擴展且適配智能體非確定性特性的專用基礎設施。智能體需要動態擴展的底層支撐,能支援長期運行的工作負載,並可即時、安全地儲存和檢索上下文資訊。然而,當前早期採用者需要投入大量資源從零建構這類基礎設施,過程耗時費力,嚴重拖慢開發周期。Amazon Bedrock AgentCore則通過提供全託管服務來解決這一挑戰。它包含一系列關鍵元件,提供了大規模運行生產級智能體所需的種種,包括:Runtime:無伺服器、安全且隔離的執行階段計算資源;Observability:可觀測性工具(開源且相容OpenTelemetry協議),幫助客戶瞭解智能體的運行狀態;Memory:記憶功能,讓智能體能夠長期與使用者互動,記住過往互動內容,從而建構智能、個性化的應用;Code Interpreter:程式碼直譯器,讓智能體能夠通過編寫程式碼訪問以往無法使用的工具;Gateway:閘道器功能,支援連接AWS內外系統;Managed Browser與Identity:網路使用權限和身份認證功能,明確智能體的身份及其代表的主體,這與治理和可觀測性密切相關。客戶既可以使用Amazon Bedrock Agent建構智能體,也可以結合任何開源智能體建構框架。目前該平台已獲得廣泛採用,迄今開發者下載量已超過200萬次。在此基礎上,Bedrock AgentCore新增兩項新功能:一是Policy in AgentCore,策略功能,為智能體的操作設定明確邊界。通過獨立於智能體程式碼的即時確定性控制,主動攔截未授權的智能體操作。企業只需用自然語言描述規則即可建立精細化策略,可以為智能體定義策略(可訪問的工具和資料、可執行的操作、適用條件等),比如“當報銷金額超過1000美元時,拒絕所有客戶的退款申請” 之類的策略。這些策略會在智能體執行前進行評估,確保智能體始終在設定的規則邊界內運行。二是AgentCore Evaluation,評估功能,幫助開發者基於智能體的行為持續檢測其質量,確保其行為符合預期。AgentCore評估功能無需管理複雜基礎設施,提供了13種預置評估器,覆蓋正確性、實用性、工具選擇精準性、安全性、目標達成率、上下文相關性等常見質量維度。開發者還可靈活使用自己偏好的大語言模型和提示詞,編寫自訂評估器。三是AgentCore Memory Episodic Functionality,情景記憶功能,自動保存互動過程中的關鍵事件和狀態,助力智能體從過往經驗中學習,提升決策水平。它包含短期記憶和長期記憶。短期記憶用於記錄當前的互動過程,幫助智能體瞭解與使用者或操作者的即時互動狀態;長期記憶用於追蹤長期的互動歷史。情景記憶則能在這些記憶基礎上,疊加特定互動場景的上下文資訊,讓智能體能夠給出更智能的建議。舉個實際例子:假設有一個預訂智能體,你第一次使用時,它為你預訂了車輛,並預留了45分鐘的趕航班時間,但你當時因照顧家人和孩子而錯過了航班,不得不重新預訂。借助情景記憶,系統會記錄下這次互動經歷。當你6個月後再次預訂航班時,智能體將記得你需要更多的準備時間,會自動為你預留2小時的車輛預訂窗口,而非45分鐘。這一功能已深度整合到AgentCore中。這些功能的核心目標,都是加速智能體從想法到大規模生產落地的處理程序。03. Amazon Bedrock與SageMaker AI新功能:簡化模型定製流程,建構更快速高效的智能體隨著智能體應用的普及和生產環境中模型規模的擴大,效率已成為客戶必須關注的核心問題。企業客戶在使用現成模型時面臨一種挑戰:這些模型功能強大,但往往未針對效率和規模進行最佳化,最終導致不必要的成本支出、響應速度變慢以及資源浪費。而效率並不僅僅關乎成本,它涉及多個關鍵因素:延遲(智能體能否快速響應,實現即時互動)、擴展性(能否應對預期的高負載)、敏捷性(能否根據應用演進和客戶互動快速迭代調整)。解決這一問題的關鍵在於定製化:通過定製小型專用模型,處理智能體最常執行的工作,以更低成本實現更快、更精準的響應。但在此之前,強化學習等先進定製技術需要深厚的機器學習專業知識、龐大的基礎設施支援,且開發周期長達數月。對此,亞馬遜雲科技宣佈Amazon Bedrock與Amazon SageMaker AI推出全新功能,以便開發者運用先進的模型定製技術。1、Reinforcement Fine-tuning in Amazon Bedrock:強化微調,提升模型精準率亞馬遜雲科技宣佈Amazon Bedrock的一項新的強化微調功能——Reinforcement Fine-Tuning(RFT)。該功能簡化了模型定製流程,核心目標是讓客戶無需具備深厚的機器學習和AI模型開發專業知識,就能輕鬆提升模型精準率。其相比基礎模型平均可提升66%的精準率,幫助客戶無需依賴龐大昂貴的模型,而是通過更小、更快、更具成本效益的模型,獲得更優結果。操作流程很簡便:開發者選擇基礎模型,指定呼叫日誌或上傳資料集,選擇獎勵函數,然後Amazon Bedrock中的自動化工作流會全程處理微調流程,以最大化獎勵函數的結果。如此一來,客戶無需專業知識,就能獲得更貼合自身需求的定製化模型。發佈初期,Amazon Bedrock強化微調功能將支援Amazon Nova 2 Lite模型,後續將逐步相容更多模型。2、Model Customization in Amazon SageMaker AI:模型速度更快、成本更低、精準率更高還有一類客戶是領域專家,希望對AI工作流擁有更多控制權。雖然Amazon Bedrock的強化微調功能非常便捷,但部分客戶希望深入底層進行自訂調整,因此亞馬遜雲科技在用於大規模訓練和定製模型的平台SageMaker AI中新增了Model Customization深度模型定製功能。SageMaker AI自2017年推出以來,一直是客戶進行AI和機器學習模型開發的核心平台。為了滿足客戶的深度定製需求,亞馬遜雲科技讓這一過程在SageMaker中變得更加簡單:客戶無需管理基礎設施,可為其生成合成資料,助力提升應用效果。亞馬遜雲科技提供了兩種體驗模式:一是智能體驅動模式(預覽版):通過智能體引導開發者完成模型定製流程。客戶用自然語言描述需求後,智能體將全程引導完成定製流程,從生成合成資料到模型評估無一不包。二是自主引導模式:適合喜歡自主操作、希望獲得精細化控制和靈活性的開發者。這種模式無需管理基礎設施,同時提供合適的工具供開發者選擇定製技術,並能調整相關參數。通過這兩種模式,開發者都能運用先進的定製技術,包括基於AI反饋的強化學習、帶可驗證獎勵的強化學習、監督式微調及直接偏好最佳化。SageMaker AI新增功能將支援Amazon Nova以及Llama、Qwen、DeepSeek、gpt-oss等熱門開源模型。亞馬遜雲科技希望通過多樣化的介面,為專業客戶提供所需的全部功能、控制權和靈活性,讓客戶能夠定製模型,以最低成本獲得最佳性能,並根據自身專業水平和偏好的工作模式提供適配的解決方案。04. SageMaker HyperPod無檢查點訓練:數分鐘內從模型訓練故障中恢復在與客戶合作進行模型定製和訓練的過程中,亞馬遜雲科技意識到仍有改進空間,模型訓練成本高昂且流程繁瑣。通常,客戶需要運行大型GPU叢集,這些叢集執行階段成本不菲,閒置或故障時損失更大,無法開展有效工作。為解決這一問題,亞馬遜雲科技開發了Amazon SageMaker HyperPod。它是SageMaker中的託管訓練功能,是目前大規模模型訓練成本最低的方案之一, 能最大化叢集執行階段間,讓客戶在進行訓練和定製任務時,充分發揮叢集的價值。Amazon SageMaker HyperPod簡化了模型訓練與部署的基礎設施管理,最高可降低40%成本。當訓練規模擴展至數百或數千個加速器時,可能會出現硬體或軟體故障等問題。傳統基於檢查點的恢復方式耗時最長可達1小時,不僅成本高昂、佔用儲存資源,還會導致價值數百萬美元的計算叢集在恢復期間處於閒置狀態。對此,亞馬遜雲科技宣佈SageMaker HyperPod推出Checkpointless Training無檢查點訓練功能。該功能無需人工干預,即可在數分鐘內自動從基礎設施故障中恢復,使包含成千上萬張AI加速器的叢集訓練效率最高可達95%。對於大型長期運行的任務,重啟和重跑極其痛苦。而無檢查點訓練徹底改變了這一模式:系統自動記錄所有操作,若發生故障,可在幾分鐘內快速恢復,客戶能迅速繼續工作。當故障發生時,系統會自動替換故障元件,並通過從鄰近正常加速器進行模型和最佳化器狀態的點對點傳輸來恢復訓練。這一機制大幅縮短了停機時間。這不僅降低了整體營運成本,還能讓客戶更快地將定製模型部署到生產環境。它真正實現了,無論客戶需要多大的規模,都能以簡單、經濟、可靠的方式完成訓練。05. Amazon Nova Act正式發佈:建構可靠智能體,實現UI工作流程自動化當智能體應用和這些工作流部署運行後,可靠性就成為了核心要求。每個企業都有希望自動化的流程,但他們需要的,是可預測、可靠、可規模化的自動化,而這一點靠企業自身很難實現。為了簡化這一過程,亞馬遜雲科技建構了一套端到端服務Amazon Nova Act,幫助開發者建構、部署和管理大量可靠的智能體,實現生產環境使用者介面(UI)工作流程的自動化。企業使用智能體進行自動化時,通常都是針對螢幕和介面的自動化操作,而Amazon Nova Act的設計初衷就是讓這類開發更簡單,同時保障可靠性和規模化部署能力。今年早些時候,亞馬遜雲科技發佈了Amazon Nova Act研究預覽版。為了將智能體投入生產環境,亞馬遜建構了一個完全整合的解決方案,用於實現可用於生產環境的可靠瀏覽器自動化。今日,Amazon Nova Act正式版即日起全面可用。該服務與Amazon Nova、Bedrock和AgentCore深度整合,讓客戶能夠輕鬆建構可靠的智能體。它能夠大規模地提供超過90%的任務可靠性,同時與其他AI框架相比,還能更快實現價值,並簡化部署過程。客戶可在自己選擇的任何開發環境中建構這些應用,系統支援部署大量平行的UI智能體,這些智能體依託模型,具備高可靠性。Amazon Nova Act基於定製的Amazon Nova 2 Lite模型,能夠出色地驅動瀏覽器、支援API呼叫,並在必要時將問題升級至人工處理。該服務具備Web質量保證(QA)測試、資料錄入、資料提取和結帳流程等核心功能。如今大多數模型都是獨立訓練的,與執行任務的協調器和執行器分離,這降低了可靠性。Amazon Nova Act採用不同的方法,利用強化學習,讓智能體在模擬真實世界使用者介面的定製合成環境(Web Gym)中運行。這種模型、協調器、工具和SDK的垂直整合,以及所有元件的同步訓練,實現了規模化下更高的任務完成率。最終得到的智能體系統不僅偶爾有效,而且能夠大規模可靠運行,並具備推理和適應變化的能力。Amazon Nova Act將適配客戶使用的各種整合開發環境(IDE)。它是一套可擴展的框架,完全適配客戶的開發習慣,同時讓客戶能夠輕鬆實現大規模生產部署。其核心適用場景是任何需要自動化UI的場景。它包含一個動作模型,亞馬遜雲科技還針對該模型開發了大量SDK和工作流,用於操控UI。06. 結語:建構智能體的最佳平台,亞馬遜雲科技志在必得亞馬遜雲科技堅信生成式AI是人們正在經歷的關鍵變革之一,將助力客戶實現業務轉型,並在未來數月、數年內普及開來。當前,這家雲巨頭致力於成為客戶建構智能體、實現業務自動化的最佳平台,不僅讓開發過程更簡單,還提供了安全、高彈性的基礎架構,保障營運的領先性和世界級的基礎設施,讓客戶能夠按需定製所使用的基礎設施和技術堆疊,從而獲得理想的結果。其平台提供了豐富的AI功能,內建負責任的AI機制,擁有支撐這些技術在現實世界發揮作用所需的資料資源,還依託全球最大的合作夥伴網路,使其客戶可通過市場輕鬆獲取各類智能體。而亞馬遜雲科技會處理好各種底層複雜工作,助力企業及開發者通過生成式AI應用實現業務變革。 (智東西)