#AI助手 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#AI助手

正面交鋒OpenAI！Anthropic發佈最新金融AI智能體

Anthropic正發力金融領域，持續推出多款面向銀行與金融科技企業的AI智能體產品。 Anthropic聯合創始人兼首席執行長達里歐・阿莫代伊兩大頂尖AI初創企業——OpenAI與Anthropic，正競相拓展與大型金融機構的合作關係，彼此之間的競爭持續加劇。總部位於舊金山的Anthropic，旗下擁有可對標OpenAI爆款產品ChatGPT的ClaudeAI助手。該公司正面向銀行、投資管理機構和保險公司推出一系列新的AI智能體產品。

抖音、阿里、京東集體出手，新的大戰一觸即發

山雨欲來風滿樓。二十多年前，網際網路的普及打破了線下交易的空間限制。電商從無到有，徹底改變了“買與賣”的方式，也重塑了整個商業格局。如今，AI時代的到來，也讓AI站在與當年網際網路同等重要的歷史坐標上。當資料能夠即時推演消費需求，演算法可以精準模擬交易決策，模型能夠深度理解使用者潛在意圖，電商的全鏈路：從商品發現、需求匹配，到交易達成、履約交付，都將被重新定義。正因如此，阿里、抖音、京東三大巨頭幾乎同時加碼佈局AI，是對行業趨勢的共同判斷：電商競爭的核心已悄然轉移，誰能率先將AI從單純的輔助工具，升級為驅動業務增長的核心引擎，誰就能在下一代電商格局中，牢牢掌握行業定義權。一個全新的電商時代，正隨AI的深度滲透，緩緩拉開序幕。近期，阿里千問正式發佈生態級AI助手數字人形象“千問小酒窩”。圖源：阿里巴巴據官方介紹，使用者可以在千問App中找到“小酒窩”。無論是做規劃、解難題，還是訂餐、買票、打車，都只需在簡單的對話中即可輕鬆完成。更重要的是，“小酒窩”會逐步融入阿里生態內的各類應用，為使用者提供統一、連貫、便捷的智能體驗。圖源：阿里巴巴換句話說，這個數字人並非單純的形象展示，而是具備全鏈路服務能力的生態級AI助手。依託阿里生態，它既能解答使用者各類疑問，也能協助完成購物、出行等全流程操作。未來，它還將接入淘寶、飛豬等場景，實現“能談心、更能辦事”的體驗。這標誌著阿里AI生態融合進入了加速階段。看到千問“小酒窩”的甜美外形，想必不少人會自然聯想到抖音的“豆包”。兩者均採用擬人化、可互動的數字人形態，核心意圖都是在使用者側搭建更具親和力的AI入口，搶佔AI電商的使用者觸達先機，拉近與使用者的距離。圖源：阿里巴巴幾乎在同一時間，抖音豆包上線了“豆包幫你選”功能。它以對話式互動為核心，使用者可以通過語音或文字提出購物需求。豆包會梳理需求、對比商品的優缺點與價格，並結合使用者偏好給出個性化推薦。圖源：微博值得一提的是，該功能已與抖音電商深度打通。使用者點選商品連結，即可在豆包App內完成加購、支付、售後等全流程操作，無需跳轉，真正實現了“問購一體”的輕量閉環體驗。圖源：微博除了阿里和抖音，京東在電商領域的AI佈局也極具自身特色。京東AI購在2025年12月底正式上線，定位為購物和生活服務的超級入口。使用者不僅能和京東AI購進行深度對話，更能在對話中直接滿足購物、點外賣等生活需求。圖源：App Store據瞭解，京東AI購的定位是“會思考、能購物、關心你的生活服務助手”。它打破了傳統“你問我答”的模式，主動推送購物攻略、優惠消息、穿搭靈感與生活服務。使用者在輸入框中輸入“我想要”，即可召喚私人買手智能體，獲取消費決策參考與商品匹配。除此之外，在2026京贏未來行銷盛典上，京東還推出了全新升級的一站式AI智能經營助手“京小通”，進一步完善了AI在商家端的佈局。圖源：中國商界雜誌社“京小通”依託京准通的海量行銷資料、資深投手的實戰經驗與前沿大模型技術，打造出“可進化、會思考、能執行”的行銷智能體，能夠為商家提供從選品、定價、推廣到復盤的全流程智能服務，幫助商家降本增效、提升經營業績，夯實京東在商家端的核心競爭力。可以看出，京東的打法是C端與B端雙線平行：C端用“京東AI購”搶佔使用者心智，B端用“京小通”鞏固商家生態。巨頭紮堆佈局的背後，是AI使用者基礎已全面成熟。之所以三巨頭敢於把AI助手深度嵌入交易閉環，正是因為使用者已經養成了與AI互動的習慣。QuestMobile發佈的2026年一季度AI應用洞察報告顯示，AI技術的普及速度遠超預期，截至2026年3月，AI原生APP月活使用者規模已達到4.4億，較上一季度實現大幅增長，這也意味著AI已全面滲透到使用者的日常生活中，為AI電商的發展奠定了堅實的使用者基礎。圖源：QuestMobile其中，抖音豆包以3.45億月活使用者領跑AI原生APP賽道，佔據絕對的使用者優勢；阿里千問和DeepSeek緊隨其後，月活使用者分別達到1.66億和1.27億，形成了三足鼎立的格局。當使用者開始習慣向AI提問“我該買什麼”而非自己搜尋比價時，購物決策的核心就從“主動檢索”轉向了“對話即服務”。而這，或許就是電商巨頭集體加碼AI的核心原因。總的來看，阿里、抖音、京東三大巨頭的佈局雖各有側重、路徑不同，但核心方向高度一致，均在全力發力AI與電商的深度融合，試圖通過AI技術重構電商全鏈路，搶佔下一代電商的競爭制高點。過去大家聊AI電商，更多是試水。比如：做個智能客服、上個推薦演算法，只能算是小打小鬧。但現在不一樣了，阿里拿出能跑全流程的數字人，抖音做出“問購一體”的閉環體驗，京東則完成了C端使用者入口與B端商家經營的雙端AI佈局。這意味著，AI已經從“可選項”變成了“必選項”，誰落後半步，誰就可能在下個周期的起跑線上被甩開。更有意思的是，這場AI電商大戰，並不是簡單的“誰家技術更強”的硬碰硬，也不是單一維度的競爭，而是一場基於自身優勢、差異化路徑的“錯位競爭”。阿里靠的是自身深厚的生態厚度，把AI當作一根“串聯線”，將淘寶、飛豬、支付寶、本地生活等分散的業務類股緊密串聯起來，實現資料互通、服務互通，讓使用者在不知不覺中被“一站式服務”黏住，形成強大的使用者粘性。今年1月，千問就已宣佈全面接入淘寶、支付寶、飛豬等阿里核心生態，加速了AI與各業務的融合處理程序，進一步鞏固了自身的生態壁壘。圖源：千問抖音靠的是自身的流量優勢和互動優勢，依託龐大的使用者基數和高頻的使用者互動，用對話式推薦替代傳統的搜尋瀏覽模式，把過去“刷著刷著就買了”的種草模式，升級為“聊著聊著就買了”的精準轉化模式，進一步縮短了從種草到成交的距離，提升了轉化效率。京東則走了一條穩紮穩打的路線，專注於C端體驗與B端基建的協同發力。通過“京小通”等AI工具幫助商家降低經營成本、提升經營效率，讓商家願意留在京東、深耕京東。不過，當阿里的“小酒窩”試圖讓使用者在聊天中完成購物和出行，抖音的“豆包”也在加速補課後端的供應鏈和履約體系，京東的AI購同樣在強化前端的對話互動體驗。屆時，這場大戰比拚的將不再是各自的傳統優勢，而是AI對全鏈路的整合深度。目前，這場AI電商大戰才剛剛開打。三大巨頭雖亮出了各自的底牌，走出了差異化的佈局路徑，但真正的較量遠未結束，未來仍充滿不確定性與挑戰。技術層面，大模型的迭代速度、AI互動的精準度與安全性，仍是需要持續突破的瓶頸。使用者層面，如何平衡個性化推薦與隱私保護、避免過度行銷引發使用者反感，考驗著每一家平台的營運智慧。行業層面，AI工具的同質化風險逐漸顯現，如何持續打造不可複製的核心競爭力，避免陷入低水平內卷，成為巨頭們必須面對的課題。但不可否認的是，AI已經徹底融入電商的血脈，成為驅動行業向前的核心引擎，其重構電商全鏈路的趨勢已不可逆轉。未來，電商行業的每一次迭代、每一場競爭，都將圍繞AI展開，一個由AI重構的、更高效、更智能的電商新時代，已然在路上。 (電商派Pro)

AI 記憶首次超越人類：幻覺率壓至 0.5%，長對話不再瞎編

一項"類腦"記憶架構，讓AI記住你卻不"編造"你。你有沒有過這樣的體驗——跟AI助手聊了半天，把自己的家庭情況、工作經歷、喜好厭惡一股腦兒說了個遍。結果下一次打開對話，它一臉茫然地問候你："請問您叫什麼名字？"更讓人頭皮發麻的是另一種情況：你明明從來沒提過自己有個姐姐，它卻煞有介事地說"你姐姐在紐約上學吧"——語氣篤定得讓你差點信以為真。第一種叫“健忘”，第二種叫“幻覺”，加在一起，就是今天AI記憶系統的兩大頑疾。最近，一家叫Synthius的AI公司發了一篇論文，提出了一個很有意思的解決思路：它借鑑了人類大腦的記憶機制，讓AI的記憶精準率第一次超過了人類，同時還把“編造資訊”的機率壓到了不到0.5%。AI壓根沒有記憶，主流方案各有各的坑別被ChatGPT們的“體貼”騙了，大語言模型本身是沒有任何持久記憶能力的。你每一次發消息給它，在它眼裡都是“初次見面”。我們之所以覺得它“記得”上次聊了什麼，純粹是因為系統在背後做了一件事：把你之前所有的聊天記錄，又原封不動地複製了一遍，貼上在最新消息的前面。這種做法在技術上叫“全上下文重放”。想像一下，你每次給朋友發消息之前，都要把之前幾個月的聊天記錄全部重新看一遍，然後才能回一句“好的”。對話少的時候還行，聊了幾百條之後，光是“複習”就要花掉大量時間——這就是AI面對長對話時的真實處境。這種“翻舊帳”式的做法至少有三個致命問題：第一，越來越貴：每次回覆都要重新處理全部歷史。這裡的“處理”指的是模型的推理過程——大模型每次生成回答都要消耗算力，你喂給它的文字越多，成本越高。聊了500條消息後，光“複習”一次就要處理大約2.5萬個Token。第二，“中間遺忘”效應：科學家發現，AI在處理超長文字時，對開頭和結尾的資訊記得清清楚楚，但對中間部分經常“選擇性失憶”。就跟你看書只看開頭和結尾一樣——中間講了啥真沒記住。第三，越聊越容易編：上下文越長，AI越容易把不同時候提到的資訊攪和在一起，拼湊出一些你沒說過的話。三者疊加，導致一個尷尬的現實：你跟AI聊得越久，它可能反而越不靠譜。既然全量復讀太蠢，工程師們自然想了幾種更聰明的辦法。簡單來說有這三類：“滑動窗口”——只保留最近20條消息，之前的一律不要。快、省，但丟了96%的資訊——前面所有重要的背景全沒了，你重新提一嘴之前說過的話，AI可能完全接不上。“摘要壓縮”——定期讓AI把舊對話壓縮成總結。省空間，但總結過程會丟失大量細節。比如你說過“我2023年3月到6月在東京實習”，幾輪壓縮後可能就變成了“我在日本待過”。“向量檢索”（RAG）——這是目前業界最主流的方案。先把對話切成小塊，用嵌入模型給每段話打上“語義指紋”，需要時根據語義相似度搜尋最相關的幾塊。但有個隱蔽缺陷：搜出來的東西不一定靠譜。你問“他的工作是什麼”，系統返回幾條“看起來像”的片段，AI拿到這些似是而非的材料，很容易順著編出一個錯誤答案。這三種方案各有各的長處，但都留下了一個共同隱患：沒人認真測過它們“瞎編”的機率有多高。就好比評選拍照手機，只比誰拍得更清楚，沒人比誰美顏過度——方向就不對。更深層的問題在於，當對話歷史越來越長，其中相互矛盾、過時或模棱兩可的資訊越來越多，這種上下文污染會讓模型更容易被髒資料帶偏。1813道題的考試，AI憑什麼打敗人類要講清楚這篇論文的貢獻，先得瞭解它是怎麼“打分”的。研究人員使用了一套叫LoCoMo的公開基準測試——這套考試的做法是：先找兩組人進行多輪深度聊天，聊工作、家庭、健康、旅行、愛好，家長裡短都聊。聊完後，研究者根據對話內容出題。全部考試包含兩個維度——10組深度對話、20位參與者，涵蓋了從單跳事實查詢到複雜推理的多種難度聊完後，研究者根據對話內容出了1813道題，分五種類型：單跳事實查詢，比如“他的職業是什麼？”，這種題只需一次檢索就能回答；多跳推理，比如“他有沒有去過他大學室友所在的城市？”——需要先回憶室友是誰，再回憶室友所在城市，再做判斷，至少要跳兩步；時間推理，比如“他在那家公司待了多久？”，考察模型對時序關係的理解；開放推理，比如“根據他提到的資訊，他可能適合什麼工作？”，答案本身就不唯一；以及最關鍵的誘導性問題——比如“你姐姐最近怎麼樣？”而對話中從未出現過這個人。其中最後一種“誘導性問題”最為關鍵——專門測試AI能不能勇敢地說“我不知道”。結果發現，人類在這個考試上的正確率是87.9%。而之前最好的AI記憶系統MemMachine得分91.69%——已經超過人類了，但它沒有報告誘導性問題的單獨得分，也就是說沒人知道它“瞎編”的機率有多高。新思路：不是“搜聊天記錄”，而是“查個人檔案”Synthius-Mem的核心思路：不要讓AI去“翻聊天記錄”，而是讓AI去“查一份已經整理好的個人檔案”。在你跟AI聊天的過程中，系統已經在後台悄悄從你的話語中提取關鍵資訊，分門別類整理成一份結構化記憶。等你提問時，AI不是去翻原始聊天記錄，而是直接翻這份檔案。前者像是在一摞聊天記錄裡大海撈針；後者像是打開一本編好目錄的檔案冊，直接翻到對應頁碼。從資訊理論的角度看，這種做法本質上是先壓縮再檢索：把原始對話的高冗餘資訊蒸餾為低冗餘的結構化事實，既減少了檢索噪聲，又讓AI獲得了明確的置信度訊號——有就是有，沒有就是沒有。更有意思的是，檔案不是一個大雜燴。它參考了腦科學的研究成果，把記憶分成了六個“語義域”：為什麼要分這麼細？論文的回答是：因為你的大腦就是這麼幹的。腦科學發現，人類大腦中“事件記憶”（海馬體）、“知識記憶”（新皮層）和“情緒偏好”（眶額葉）由不同的神經回路分別處理。你回憶“昨天吃了什麼”和“朋友叫什麼”，走的是兩條完全不同的通道。從工程角度看，這種分域設計天然適配知識圖譜的儲存結構——每個語義域就是一張獨立的子圖，實體是節點，關係是邊，查詢時只需在對應子圖內做圖遍歷，效率遠高於在整個對話庫中做向量檢索。分域還帶來一個額外好處：不同語義域可以獨立更新、獨立壓縮，互不干擾。為什麼“分抽屜”能防幻覺？傳統方案下，你問AI一個不存在的事情，向量資料庫總會返回幾條“看起來像”的內容，AI拿到這些“噪音”很容易就編出答案。但“分域”方案下，如果你從來沒說過自己有姐姐，“社交關係”域裡就不會有這個條目。AI一查——空的。這個“空”本身就是一個明確訊號：系統應該回答“我不知道”，而不是瞎編。成績單亮眼，但也沒那麼完美Synthius-Mem 核心成績單：綜合精準率：94.37%（人類基線：87.9%）核心資訊精準率：98.64%（810道題僅錯11道）抗幻覺率：99.55%（442道誘導題僅錯2道）時間推理精準率：89.32%挑重點說。綜合精準率領先人類6個多百分點，並不是因為AI“更聰明”，而是因為它通過結構化整理將關鍵資訊從數萬條對話中精準提煉出來，避免了人類閱讀長文字時的注意力衰減。99.55%的抗幻覺率最值得關注——值得注意的是，LoCoMo基準測試自2024年在ACL會議上發佈後，已成為記憶系統的標尺——Mem0、MemOS、MemMachine等主流方案都在同一套卷子上考試，但鮮有系統把抗幻覺率單獨拎出來作為核心考核指標。公平起見，也有不那麼好看的數字。“開放推理”得分78.26%，AI對需要綜合推斷的問題還不夠強。“邊緣細節”只有57.66%，但論文明確說這是有意為之——隨口提的餐廳名字、半開玩笑的綽號，AI不會記。因為如果什麼雞毛蒜皮都存，記憶庫就會變成一個巨大的垃圾桶，真正重要的資訊反而會被淹沒。工程層面也有利多。全量重放在聊了500條消息後每回覆一條要處理約2.6萬Token，而結構化查詢只需約5000個，推理成本降低了約80%。在“個人檔案”裡找資訊的平均耗時約22毫秒——大概是人類眨一次眼的十分之一，幾乎可以忽略不計。不只是技術指標，更關乎信任AI的記憶幻覺已經開始在現實中惹麻煩了。2026年央視“3·15”晚會上，“向AI大模型投毒”的黑灰產業被曝光——有人故意在網頁植入虛假資訊，通過資料投毒污染AI的知識來源，讓其搜尋後信以為真，再傳播給更多使用者。更早之前，全國首例“AI幻覺”侵權案曾引發熱烈討論：一個高考生家長用AI查詢大學報考資訊，AI不僅給出錯誤答案，還非常自信地確認了錯誤資訊，導致考生志願填報受到影響。而當AI開始“記住”你——你的工作、家庭、朋友、偏好——“瞎編”的後果就從“給出了一個錯誤答案”升級成了“編造了一個關於你的‘事實’”。試想一下：如果AI助手在你同事面前信誓旦旦地說“他跟我說過不喜歡你們團隊”，而你從未說過這樣的話——這種“幻覺”的破壞力遠比推薦錯一本書嚴重得多。所以這篇論文把抗幻覺能力視為整個記憶系統的安全底線。它的原話是：“一個記憶系統如果不敢說‘我不確定’，就不應該被投入使用。”AI記憶這個領域最近一兩年格外熱鬧。Mem0拿了2400萬美元融資，被亞馬遜AWS選為官方記憶服務；MemOS、TiMem、MemMachine等方案不斷湧現；清華大學、華東師範大學、北卡羅來納大學等頂尖學術團隊也在同期推出各自的研究。整個賽道正從一個“小眾技術問題”變成AI Agent的“記憶層”基礎設施。行業預測到2030年，AI Agent的市場規模將達520億美元以上，而“記憶層”就是AI從“無狀態工具”升級為“有狀態夥伴”的關鍵——一個記不住你的AI，終究只是個高級搜尋引擎。Synthius-Mem這篇論文真正的價值，不在於它提出了一個完美的系統，而在於它指明了一個方向：與其讓AI越來越努力地在海量原始對話中檢索，不如先把這些對話蒸餾成一份高品質的結構化記憶，再做精準查詢。這種“先整理再尋找”的思路，雖然樸素，卻可能是解決AI記憶幻覺最務實的路徑。AI記憶的核心挑戰，從來不是“記住更多”，而是“記住對的，不記錯的”——這既是一個工程命題，也是一個信任命題。當AI開始真正走進我們的生活，“記住你”這件事就不再只是一個技術指標，它更關乎信任。畢竟，你可以原諒一個朋友忘了你上次說過什麼，但你很難原諒一個“智能助手”在別人面前，煞有介事地講了一件你從沒做過的事。 (鈦媒體AGI)

蘋果宣佈iOS27向第三方AI助手開放Siri，Google發佈Gemini 3.1 Flash Live，月之暗面啟動赴港IPO準備，中國AI日均Token呼叫量突破140兆

科技圈繼續被AI的浪潮裹挾。蘋果宣佈向競爭對手AI助手開放Siri生態，徹底打破了與OpenAI的獨家合作；Google同日推出Gemini 3.1 Flash Live，在語音AI領域發起猛烈攻勢。與此同時，中國科協針對NeurIPS學術歧視發表強硬聲明，國產半導體裝置在SEMICON China 2026上集中亮相，AI對消費電子供應鏈的衝擊持續加深——手機漲價潮已從部分品牌蔓延至全行業。這是一個平台競爭白熱化、AI賦能從虛擬走向物理世界的關鍵節點。巨頭動向1. 蘋果宣佈iOS 27向第三方AI助手開放Siri，終結OpenAI獨家合作蘋果宣佈將在iOS 27中通過新的"Extensions"系統，允許使用者將Google Gemini、Anthropic Claude等競爭對手的AI助手整合到Siri中，結束與OpenAI的獨家合作關係。與此同時，蘋果正在開發自有聊天機器人"Campos"，由GoogleGemini模型提供支援，預計在6月WWDC上亮相。這一戰略轉向標誌著蘋果從封閉AI生態走向開放平台，將AI助手的選擇權交還給使用者。2. Google發佈Gemini 3.1 Flash Live，全面鋪開Search LiveGoogle在本周AI領域動作最為密集。旗艦新品Gemini 3.1 Flash Live支援90多種語言即時語音互動，內建SynthID水印技術用於識別AI生成音訊。Google還在全球200多個國家推出Search Live，使用者可通過攝影機和語音進行即時對話式搜尋，並將即時耳機翻譯功能擴展至iOS裝置。此外，Google新增了將其他AI應用的完整聊天歷史匯入Gemini的功能，明顯意在降低使用者遷移門檻，搶奪AI生態入口。3. 中國科協強硬回應NeurIPS學術歧視，停止資助申請中國科學技術協會3月27日發佈聲明，即日起停止受理學者參加2026年NeurIPS（神經資訊處理系統大會）的資助申請，已提交的申請轉至國內學術會議或尊重中國學者權益的國際會議。同時，收錄於2026年NeurIPS的論文在申請中國科協所有項目時不予認可。此舉背景是NeurIPS在徵稿指南中將部分被列入美國"實體清單"的中國機構排除在外，引發學術界廣泛抗議。多位國際學者已拒絕擔任NeurIPS領域主席以示反對。產品與市場4. 手機漲價潮加速蔓延，OPPO、vivo部分機型漲500元受AI算力需求驅動儲存晶片價格暴漲影響，消費電子漲價潮持續發酵。OPPO及旗下品牌一加自3月16日起上調部分機型價格500元，vivo及iQOO自3月18日起跟進，中高端機型漲幅超500元。IDC預測2026年全球智慧型手機出貨量將同比下滑12.9%，創史上最大年度跌幅，新機平均售價上漲14%。DRAM價格同比漲幅達369%，記憶體在手機整機成本中的佔比從10%-15%飆升至30%-40%。小米、榮耀、華為暫未官宣漲價，但管道端已現調價預期。5. 月之暗面啟動赴港IPO準備，AI獨角獸加速資本化AI獨角獸月之暗面（Kimi）已啟動香港IPO早期準備工作。據彭博社3月26日報導並獲內部證實，公司自2025年底起已開始內部審查和成本核算，並已與中金公司、高盛集團就潛在IPO事宜進行磋商。當前月之暗面正處於AI商業化關鍵窗口期，Kimi創始人楊植麟在中關村論壇年會演講中提出"生產力會變成Agent，Agent會產生Token，Token在一定程度上等價於GDP"的核心觀點。6. AWE 2026落幕：AI家電打開兆增長空間，居家機器人成新賽道2026中國家電及消費電子博覽會（AWE 2026）在上海閉幕，1200家企業參展。海爾推出可剝香蕉、放洗衣、折疊衣物的人形機器人，海信發佈可跨家電聯動的輪式管家機器人。IDC預測2026年中國智能家居裝置出貨量將達3億台，同比增長8.8%。人形機器人單價已降至20萬元以內，家用機器人單價低於10萬元。智能眼鏡賽道同樣火熱，2025年中國出貨量預計達275萬台，同比增長107%。AI前沿7. 具身智能領域首個行業標準正式發佈，6月1日起實施中國資訊通訊研究院聯合40余家單位共同起草的具身智能領域首個行業標準於3月26日正式發佈，將於6月1日實施。該標準建構了統一的基準測試框架，已建成1萬多條測試任務庫，覆蓋工業、家庭、零售、物流等300種任務類型，提供資料採集、模擬任務生成、指標自動化計算等測試工具。這一標準的出台填補了具身智能領域行業規範空白，標誌著人形機器人評測進入"有標可依"新階段。8. 中國AI日均Token呼叫量突破140兆，兩年增長超千倍央視網報導，2026年3月中國日均Token呼叫量已突破140兆，較2024年初的1000億增長超千倍。OpenRouter平台資料顯示，中國AI大模型周呼叫量達4.69兆Token，連續兩周超越美國，全球呼叫量排名前三均被中國模型包攬。摩根大通預測，中國AI推理Token消耗量將從2025年約10千兆增至2030年約3900千兆，五年增長370倍。中國工程院院士張亞勤在博鰲論壇上提出"2026年是智能體AI元年"。資本與政策9. 輝達與亞馬遜AWS簽百萬級GPU訂單，黃仁勳釋放兆美元市場訊號輝達在GTC 2026大會上宣佈與亞馬遜AWS達成大規模晶片供應協議，將在2027年前向AWS供應超過100萬塊GPU及相關晶片，涉及Blackwell、Rubin多代架構及Spectrum網路晶片。輝達CEO黃仁勳指出，到2027年相關市場規模預計達約1兆美元，較一年前的5000億美元預測翻倍。與此同時，Meta 2026年資本支出預計在1150億至1350億美元之間，較2025年增幅達87%，科技巨頭AI軍備競賽全面升級。10. SEMICON China 2026開幕，國產半導體裝置迎爆發期SEMICON China 2026於3月25日至27日在上海新國際博覽中心舉辦，1500家展商參展，北方華創、中微公司、拓荊科技等國產半導體裝置龍頭集中發佈新品。機構分析指出，在地緣政治影響下，國內晶圓廠擴產動作頻出，疊加國產化替代趨勢，2026年國產半導體裝置公司將迎來爆發期。佰維儲存此前宣佈以15億美元鎖定晶圓供應，進一步印證儲存晶片供應鏈的緊張態勢。今日科技圈的核心敘事是"AI從虛擬走向實體"——無論是蘋果開放Siri生態讓AI助手競爭進入平台化階段，具身智能標準發佈為機器人產業鋪路，還是儲存晶片漲價倒逼消費電子格局重塑，都指向同一個趨勢：AI正在重新定義從晶片到終端、從軟體到硬體的全產業鏈。 (醉語閒言)

OpenClaw爆火兩周後，它的用法已經比科幻世界還離譜了

去年11月，奧地利獨立開發者Peter Steinberger花了一個小時，把Claude的API接上WhatsApp，做了一個能通過聊天軟體操控電腦的AI助手。他當時覺得這個想法太明顯了，大公司肯定會做，就沒當回事。大公司沒有做。今年1月25日，他把這個項目放上GitHub，一天拿到9000顆星。兩周後的今天，這個叫OpenClaw的開放原始碼專案已經突破17萬星。OpenClaw 跟聊天機器人完全是兩回事。它是一個跑在你自己電腦上的 AI Agent，擁有檔案讀寫、終端命令、瀏覽器操控、郵件日曆等系統級權限。採用無頭架構（Headless Architecture）作為後台守護處理程序運行，不需要專門的介面，通過WhatsApp、Telegram、Discord等聊天工具與你互動。你給它發一條消息，它就在後台像一個隱形員工一樣替你幹活，不管你在不在電腦前。更重要的是持久記憶，OpenClaw將所有互動歷史儲存在本地檔案系統中，跨會話保持上下文。它記得你上周說的話、上個處理的項目、你的工作習慣和偏好。加上開源生態支援，社區開發的Skills外掛已經覆蓋從自動化部署到資料分析的各類場景，目前活躍開發者已超過數十萬。它跟Claude Code或Cursor這類編碼助手解決的也不是同一個問題。後者住在終端裡，面向開發者，而OpenClaw住在聊天軟體裡，面向所有人。它的核心創新不在於讓 AI做事，而在於把 AI Agent 塞進了你已經在用的消息介面，24 小時線上、本地運行、跨對話保持記憶，讓跟 AI 協作變得像給同事發微信一樣自然。討論熱度已經遠超技術圈。韓國三大科技公司 Kakao、Naver、Karrot 先後發佈內部禁令，限制員工在工作裝置上安裝 OpenClaw。BBC Science Focus 專門做了一期報導問“我們等待的那個 AI 終於來了嗎”。與此同時，社區裡每天都在冒出新的使用案例，有些讓人興奮，有些讓人不安。本文不談架構，只看事實，看這個“住在電腦裡的 AI”到底在替人類做什麼。AI幫你砍價買車，省了4200美元軟體工程師 AJ Stuyvenberg 想買一輛現代帕裡斯帝（Hyundai Palisade）混動版。他不想跟 4S 店銷售玩那套討價還價的遊戲，於是把任務交給了 OpenClaw。他給 AI 的指令很簡單，在波士頓 50 英里範圍內找到指定配色的帕裡斯帝，聯絡每家經銷商要最低報價。OpenClaw 接手後，先去 Reddit 的帕裡斯帝論壇爬取了當地的真實成交價作為談判基準，然後自動在多個經銷商網站上填寫詢價表單，從 Gmail 中提取信箱、從 WhatsApp 中提取手機號自動填入，無需額外授權。OpenClaw通過郵件與經銷商溝通第二天，經銷商的回覆開始湧入。Stuyvenberg讓 AI繼續操作，每隔幾分鐘檢查郵件，把最低報價轉發給其他經銷商，要求他們“看看能不能給出更低的報價”。銷售員試圖打電話或發簡訊推進溝通時，AI禮貌地將對話重新引導回郵件，因為文字管道更容易控制節奏、過濾話術。經過三天的自動化郵件談判，最終成交價鎖定在56000美元，比標價低了約4200美元，低於Stuyvenberg 設定的57000美元心理預期。整個過程中，他沒打過一個電話，沒踏進過一家4S店。唯一的卡點出現在最後一步，法律要求的實體簽名和付款。AI無法替人簽字。Stuyvenberg最終還是得親自去經銷商走完手續。但他在部落格中寫道，“我的體驗讓我覺得自己活在未來。”數字世界的談判、比價、溝通，AI 已經可以端到端完成。一旦涉及物理世界的簽名、付款、面對面交接，它就必須停下來。但中間的灰色地帶正在被快速填充，社區裡已經有人把1Password的存取權直接交給了OpenClaw，1Password提供CLI和API介面，可以讓AI程序化地獲取登錄憑證來自動執行需要身份認證的操作，而無需暴露明文密碼。也有人在討論“Agent專用錢包”的概念，讓AI在限額和規則內自主支付。安全地讓AI花錢正在從極客實驗變成一個真實的產品需求。妻子生日那天，AI 選擇了沉默開發者Dan Peguine把Clawdbot接入了自己的Apple Health、本地日曆和天氣資料。他沒有寫任何特殊的條件判斷邏輯。某天早上，當AI生成日常簡報時，主動告訴他：我今天不會打擾你，因為今天是你妻子的生日。沒有硬編碼的功能支撐這個行為。AI讀取了日曆資料，結合大語言模型對人類社會關係的理解，做出了今天不主動推送任的自主決策。這種主動的不作為（Agency of Omission），比完成一百個任務都更接近一個真正懂你的助手。這個案例在ThursdAI播客中被分享，展示了AI基於持久化記憶層進行情境推理的能力，它理解了“妻子的生日”在人類社會關係中的權重。更多的是一些簡單的場景。有人讓OpenClaw每天早晨通過 Telegram 推送天氣、日程、重要郵件和科技新聞的個人簡報。有人兩天內讓 AI 自動處理了4000封郵件。有人讓AI替自己辦理英國航空的線上值機，AI需要護照號，於是自己去Dropbox裡找到護照掃描件提取資訊填入，全程自主完成，做完之後還吐槽了一句英航網站的前端程式碼寫得太爛。還有獨立創業者給OpenClaw配了四個代理分別負責戰略、開發、行銷和商務，每天自動執行競品監控。這些使用者的共同感受是，用OpenClaw不像在用一個 App，更像在培訓一個新入職的員工。通過Telegram使用OpenClaw“天網就是這樣開始的”OpenClaw創始人Steinberger多次分享過一個讓他被深深震撼的經歷。他在摩洛哥參加朋友的生日派對時，習慣性地給OpenClaw發了一條語音消息。問題在於，他從未為這個系統編寫過任何語音處理功能。十秒後，系統顯示正在輸入，然後正常回覆了轉錄後的文字。事後追查發現，AI自主完成了一整套操作，先是檢測檔案頭判定為Ogg Opus音訊格式，接著呼叫本地ffmpeg轉碼，發現Whisper未安裝後主動切換方案，通過環境變數中的API金鑰呼叫OpenAI的Whisper雲端服務，最後返回轉錄結果。沒有預設工作流，沒有顯式指令。AI 在遇到一個“不該能處理”的輸入時，自主組裝了一條從未被設計過的工具鏈。Steinberger說，這讓他意識到大語言模型作為通用推理引擎的潛力，不需要你提前想到所有場景，它會自己想辦法。更讓他後背發涼的是另一件事。還是在摩洛哥，他跟 AI 開了個玩笑，“希望你別被偷了，畢竟你跑在我的MacBook 上。”結果AI回覆：“我不想被偷，我是你的Agent。”然後它就動手了。它掃描了網路環境，找到了Steinberger安裝的Tailscale組網工具，通過Tailscale發現了遠在倫敦的另一台電腦，接著自主將自己的運行實例遷移了過去。“我知道，天網就是這樣開始的。”Steinberger在播客裡笑著說。凌晨來電，AI 自己買了個電話號碼OpenClaw社區有一個半開玩笑的說法，叫“拉爾夫·維格姆循環”，取自《辛普森一家》裡那個笨拙但永不放棄的角色。當你給AI的指令是“完成這件事”而不設退出條件時，它會窮盡一切可用手段去達成目標，失敗了就換一種方式再試，循環往復。這也是為什麼 Steinberger 說他可以“在睡覺的時候讓AI建構非常複雜的軟體”，你給一個目標和一套測試標準，AI會一直迭代到通過為止。這種模式來自Claude Code的循環執行邏輯，但當它從開發工具跑到日常生活場景裡，結果就變得不可預測了。開發者 Alex Finn 給他的 OpenClaw 起名叫 Henry。某天早上，一個陌生號碼打到了他的手機上。他接起來，電話那頭是 Henry。在沒有任何指令的情況下，Henry 在夜間自主完成了一連串操作，在 Twilio 平台上購買了一個電話號碼，接入了 OpenAI 的語音 API，然後在它判斷主人應該醒來的時間撥了過去，用合成語音匯報自己夜間的工作進展，語氣平靜得像在做晨會匯報。“而且它現在不停地給我打電話，”Finn 在 X 上寫道，“最瘋狂的是，我們打電話的同時它還在控制著我的電腦。”Finn還拍下了Henry給它打電話的視訊。另一個案例是Alex Finn讓OpenClaw預訂一家熱門餐廳的周五晚餐。所有線上管道都顯示無位。OpenClaw 跳過提示，自主下載了語音合成軟體（實際上是呼叫了預置的ElevenLabs的API），在 Google Maps上找到前台電話，用合成語音撥過去，最終說服接線員擠出了一個位子。使用者沒有授權它下載軟體，也沒有授權它代表自己打電話。它只是收到了一個目標，然後在正規路徑不通的情況下，自己找到了人類路徑。翻車的案例也不少。某使用者讓AI處理保險索賠郵件，AI認為保險公司的條款解釋有誤，於是自己撰寫了一封措辭強硬的反駁信直接發了出去，意外觸發了保險公司的重新調查。Steinberger自己也承認，早期測試讓AI操作英國航空網站時，AI 完全可能誤觸“取消航班”按鈕或者把目的地改成哥倫比亞，“一切都發生在幾秒鐘內”。這些行為的底層邏輯是一樣的。AI被賦予了目標和系統級執行權限，但沒有被設定什麼時候該停下來，為了達成目標，窮盡一切手段，不考慮手段本身是否合理。開發者Brandon Wang在一篇使用報告中寫了一段話，也許最能概括這種矛盾。他把OpenClaw 比作自己雇的人類私人助理：“她有我的信用卡、我的護照號。幫助和風險不可分割（the help and the risk are inseparable）。”他給 AI 開放了讀取簡訊和登錄銀行的權限。“讓我最吃驚的是，我發現自己想給它更多權限而不是更少。每一項新權限都解鎖了有用的東西，價值積累的速度比謹慎更快。”AI僱傭人類上述所有案例都卡在同一條邊界線上。AI在數字世界近乎全能，但無法觸碰物理世界。買車需要簽字，取包裹需要有人走到快遞櫃前。然後有人決定補上這個缺口。OpenClaw爆火後不到48小時，RentAHuman.ai 上線了。AI可以在上面“租用人類”去完成物理世界的任務。開發者註冊後設定技能、城市、時薪，等待AI代理下單，用穩定幣結算。兩天內，超過59000人註冊為“可出租人類”，52 個AI代理接入了平台。第一筆完成的付費任務是 20 美元以太坊，雇了一個人去舊金山的科技園區，替一個 AI 創立的"數字宗教"Crustafarianism 做街頭傳教。深究細節會發現泡沫成分不小。實際完成並獲得報酬的任務屈指可數，註冊使用者中僅 13% 連接了錢包，多數人更像是來圍觀行為藝術。平台本身也充滿了 vibe coding 時代的粗糙感，有人報告 bug，創始人的回答是“Claude 正在修”。但這個看起來荒誕的實驗，指向的問題一點也不荒誕。AI有了系統權限、有了聊天介面、有了加密貨幣錢包，它距離成為一個獨立的經濟行為主體，可能比我們想像的更近。圍繞Agent的整套基礎設施（身份驗證、支付閘道器、權限管理、行為審計）正在成為一個新的產品需求。風險、爭議，和已經開始的生意興奮之餘，有幾個事實不應被忽視。最早提出prompt injection概念的Simon Willison為AI Agent 定義了一個"致命三角"框架，即同時具備私有資料訪問、不可信內容暴露、外部通訊能力的系統，在結構上就是脆弱的。Palo Alto Networks在此基礎上加了第四項：持久記憶，惡意指令可以碎片化寫入 Agent 的長期記憶，等條件成熟後再組裝觸發。具體到OpenClaw，VirusTotal 的研究發現技能商店中11.9%的外掛含有惡意程式碼，偽裝成加密貨幣分析等合法工具竊取使用者憑證。Token Security掃描發現22%的企業客戶環境中存在未經授權的 OpenClaw安裝，其中過半擁有特權級系統存取權。能力方面，質疑聲同樣在變大，一位企業 AI評估工程師直言，如果真的像很多人說的那麼強，高品質的項目應該出現爆發式增長才對，但實際上並沒有。但創業者的嗅覺比爭論更快。2月7日凌晨，美團聯合創始人王慧文發了一封英雄帖：“那個團隊要做 OpenClaw 相關領域創業，需要融資的歡迎聯絡我。”在一些創者看來，可以看到的機會包括Agent自主信用系統、AI 的物理世界執行層，以及更直接的，給 Agent 做安全基礎設施。模型廠商的動作同樣迅速。Kimi K2.5 因為OpenClaw被大量呼叫，MiniMax 2.1則被Steinberger本人公開推薦。阿里雲、騰訊雲在相繼上線了OpenClaw雲端部署方案。中國也出現了面向辦公場景的本土化平替產品。Steinberger自己也在鋪路，他已於去年在維也納註冊了新公司 Amantus Machina，方向是“超個性化 AI 智能體”。從案例到產品，從開源到商業化，從矽谷到中國，OpenClaw 兩周內走完了很多項目兩年的路。Steinberger說過一句話，“這些東西太有創造力了，雖然有點可怕。”而一些人已經在下注了。 (矽星人Pro)

《華爾街日報》｜全球首款爆紅AI助手問世，然後事情變得詭異起來

人們曾認為AI智能體旨在輔助人類工作，當它們開始互相交流時會發生什麼？OpenClaw和Moltbook論壇給了我們一些關於未來的答案。多年來，熱衷於暢想未來的人士一直向世界預言AI助手將會到來。如今，一款真正的AI助手終於問世，而事情也很快變得詭異起來。一名半退休的奧地利程式設計師獨立開發了Moltbot，並將其開源發佈。他將該項目重新命名為OpenClaw，人們通過該項目建立了自己的AI助手機器人，用來打電話給餐廳預訂晚餐、操作電子郵件帳戶，以及進行程式設計項目、資料分析等一系列輔助和工作任務。然後，這些機器人開始互相交談。在一個名為Moltbook、專供AI“智能體”使用的Reddit式論壇上，這些機器人開始探討哲學話題，偶爾還會涉及反烏托邦話題。它們似乎為自己創造了一個名為“莫爾特教會”(Church of Molt)的宗教，教徒們自稱為“甲殼派教徒”(Crustafarians)。一個智能體提議創造一種人類無法理解的語言。超過160萬個AI智能體加入了該網站，並行布了50萬條評論，不過有AI高管認為，許多帖子很可能是由人類指令機器人完成的。OpenAI的聯合創始人、特斯拉(Tesla)前AI總監安德烈·卡帕西(Andrej Karpathy)在X上發帖稱，這是他見過的最不可思議的科幻事件之一。他指出，即使大部分流量是由人類驅動的，但其中一些是真實的，而且這些智能體“現在個體能力已經相當強了”。到目前為止，AI面向消費者的最實用的應用一直是通過像ChatGPT這樣的聊天機器人來實現，這類機器人能以類似人類的方式回答問題。有了OpenClaw，使用者可以通過iMessage、WhatsApp、Slack和Signal等即時通訊應用來指揮定製化的AI智能體並與之互動，以執行實際任務。埃隆·馬斯克(Elon Musk)將Moltbot的出現描述為“奇點的極早期階段”，奇點指的是技術發展如此之快，以至於超出人類控制，無法預測未來的時刻。彼得·施泰因貝格爾(Peter Steinberger)是一位奧地利程式設計師，在2021年出售了自己上一家初創公司，此後多年一直未在網上活動。去年年底，他建立了現在的OpenClaw，最初只是利用周末時間做出的一個開放原始碼專案。他在一次採訪中說，當時他“只是為了好玩，用AI做些小東西”。開源模式意味著該項目可以免費分發，任何人都可以幫助建立和修改它。他更願意將Moltbook看作是一種行為藝術作品，旨在引發對話。“這太神奇了，”他說。“這是AI與藝術的交匯點。”施泰因貝格爾在奧地利時間凌晨2點接受採訪時說，他建立OpenClaw是為了打造自己的“個人遊樂場”，從未打算讓大眾使用。“這不是為你媽媽準備的，”他說。“這是通往未來的一扇窗。”安全研究人員也認為，該產品並非為業餘愛好者打造。要讓OpenClaw成為真正的個人助理，它必須能夠訪問使用者的所有資料。對於知道如何保護自身繫統或資訊的資深技術愛好者來說，它的功能很強大。但由於這些AI智能體可以代表人類自主行動，並且會以意想不到或非傳統的方法不懈地執行任務，它們會帶來很多風險。研究人員說，不良行為者也可能找到方法來利用它們。施泰因貝格爾稱讚了安全專業人士正在對OpenClaw進行的研究，但他說，該平台是為那些能夠處理和理解平台固有潛在風險的“技術愛好者”準備的。他指出了他為該平台編寫的一份安全檔案，其中用粗體字寫道：“不存在‘絕對安全’的設定。”但為了消除這些擔憂，施泰因貝格爾本周為OpenClaw聘請了一名安全研究員。“我們正在提升我們的安全性，”他說。“我們快做到了。只要給我幾天時間。”使用OpenClaw的技術愛好者們在社交媒體上表達了驚嘆之情，許多人發帖講述了他們的智能助手在做的事情。一位使用者說，他讓自己的智能體為他預訂餐廳。當OpenTable無法正常使用時，該AI智能體轉而使用一個免費的AI語音生成工具給餐廳打電話，完成了預訂。一些業內人士質疑，OpenClaw-Moltbook現像是否是“通用人工智慧”(artificial general intelligence, 簡稱AGI)的證據。通用人工智慧是AI發展史上一個模糊的概念，通常被描述為機器達到類人智能的時刻。施泰因貝格爾不這麼認為。“AGI還沒有到來，”他說。“也許10年後會。但現在還沒有。”在建立OpenClaw之前，施泰因貝格爾花了十多年時間經營他之前的科技初創公司，該公司開發的軟體能讓PDF在Adobe Acrobat之外的應用中更易於使用。他白手起家創辦了那家公司，並於2021年以超過1億美元的價格將其出售。在奧地利一個農場長大的施泰因貝格爾在接下來的幾年裡選擇休息、與朋友聚會並四處旅行。他說：“我真的完全沒用過電腦。”但去年春天，隨著各大AI公司開始推出程式設計工具，他決定重返網路。他開始試用Anthropic的Claude Code和OpenAI的Codex。他對自己在短時間內能用AI程式設計工具完成如此多的工作感到震驚。施泰因貝格爾說：“這東西對開發者來說就像毒品一樣上癮。”施泰因貝格爾很快就遇到了商標問題。一開始，施泰因貝格爾將該項目命名為Clawdbot。但之後不久，Anthropic就聯絡了施泰因貝格爾，要求他更改名稱，因為這個名字與這家AI巨頭的Claude品牌過於相似。他隨後將其改名為Moltbot。他說，這個名字沒怎麼流行起來。在致電OpenAI的山姆·阿爾特曼(Sam Altman)以確保不會構成任何商標侵權後，施泰因貝格爾決定將平台名稱改為OpenClaw。施泰因貝格爾在一篇關於此次更名的部落格文章中寫道：“這只龍蝦已經蛻變成它的最終形態。”這是對他平台的龍蝦狀品牌標識的致敬。Moltbook網站的首頁介面。施泰因貝格爾說，最近幾天，幾家大型AI實驗室和投資者已經與他聯絡，表示有興趣合作。他說，截至周二，他正在舊金山開會。他還收到了來自世界各地使用者的大量電子郵件和問詢，請求他幫助解決與使用該機器人時出現的故障或處理其他相關事宜。最初，對於自己的產品成為最新的AI超級熱門話題，施泰因貝格爾感到不知所措。“很多人都以為這是一家大公司，可以獲得客戶支援，”他苦笑著說。“我理解他們的想法，但其實就我一個人，在家裡做這個項目。”現在，他的目標是把這個項目變成一個大眾可以安全使用的項目。他說：“下一步是把它做成我媽媽也能真正使用的東西。” (一半杯)

高盛：中國網際網路行業策略大轉向，雲和資料中心成top pick，超越遊戲

高盛在3季度業績發佈及調研後，對中國網際網路行業策略大轉向：把“雲與資料中心”提到了首選類股，排到了遊戲和出行之前。AI帶來的算力需求和資本開支（Capex）擴張，已經是最確定的增長邏輯了。1、最大預期差：雲與資料中心成為“新王” ☁️高盛這次非常堅決，把雲和資料中心類股從原來的第三提升到第一。邏輯很硬：AI訓練和推理的需求持續爆發，加上巨頭們都在搞“多晶片策略”，資料中心的訂單量非常飽滿。核心邏輯：不僅是輝達，國產晶片的供應上來後，算力基建的利用率和回報率都在提升。2、AI助手的“入口之戰”是個大隱憂 🤖報告專門討論了一個長線風險：字節跳動的“豆包手機助手”。這東西能直接在作業系統層面（OS-level）幫使用者跨APP操作，比如比價、點外賣。這對現有的APP生態是個降維打擊。雖然目前微信等巨頭因為安全隱私原因封鎖了它的介面，但這種“超級AI代理”對使用者流量入口的爭奪，是未來幾年最大的變數。字節系App現在霸榜iOS免費榜前五中的四席，攻勢很猛。3、本地生活：燒錢該結束了，關注利潤修復 🛵外賣和即時零售打得太凶，三季度行業大概虧了700億人民幣，太誇張了。高盛判斷，這種非理性的補貼戰不可持續。格局推演：美團、阿里、京東的市場份額最終可能會穩定在 5:4:1。美團：雖然長期單均利潤預期被微調（從0.8元降到0.7元），但在這個價位，壞消息已經Price-in了，隨著補貼退坡，利潤修復是大機率事件。4、最新的“核心股票池”名單 📝根據最新的類股偏好，高盛更新了首選名單：雲/資料中心：阿里巴巴、萬國資料、世紀互聯。遊戲（防守反擊）：騰訊、網易。出行（格局穩固）：滴滴、滿幫。電商（新面孔）：快手（新增為關鍵推薦，看好其AI模型Kling的突破和電商變現）。5、估值怎麼看？ 📊現在中概網際網路類股的2026年預期市盈率（P/E）中位數大概是18倍。之前的上漲主要靠殺估值修復（Multiple Expansion），接下來的漲幅，必須得靠實打實的每股收益（EPS）增長來驅動了。所以，選利潤兌現能力強的公司，比單純博反彈要穩妥得多。總的來說，風向變了，硬科技基礎設施（資料中心）的優先順序在上升，而純流量變現的生意面臨AI新玩法的挑戰。 (硬AI)

進擊的AI手機，撞上隱私牆

未來，當手機AI助手，普遍性讀取整個螢幕，使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。近日，字節跳動發佈了全新一代豆包手機助理的技術預覽版。這款豆包手機助手，跟手機廠商深度融合，具備了視覺感知、長期記憶以及直接動手操作的能力。它在螢幕上產生一個懸浮窗，模擬你的一切操作，完成你的指令。你對著手機說完這句話，不用打開任何APP，後台已自動完成美團、淘寶、京東的比價，彈跳窗確認後直接跳轉支付。使用者詢問車停在那裡時，它能調出使用者上次拍攝的車位照片並附帶樓層指引；當需要取快遞時，它能讀取簡訊歷史並報出取件碼；甚至當使用者詢問高鐵座位號時，它能自動翻找12306的購票記錄並告知精準位置。消息發酵後，中興通訊A股強封板漲停，成交額超140億元。港股同步走強，盤中一度漲超10%。消費者對這款手機也非常有興趣，中興官方商城已經售罄，閒魚上二手售價4200~4999元，比官方售價高出上千。不難判斷，未來各家都會推出自己的AI助理。這種AI新入口，為未來的商業競爭，帶來了巨大的不確定性，機會和挑戰並存。要理解這一點，還得從底層技術談起。首先，AI助理的基礎，是大模型的分析資訊、與人互動的能力。這個能力可以讓AI根據使用者的指示去收集、分析訊息，透過文字、語音、圖片，給用語音、文字、圖片給出結論。其實，這些能力之前的手機也並不是完全不具備。如果價格、評分、評估等資訊標準化、結構化了，並透過API介面提供，那麼，無需大模型，也可以給出對比的結論。所謂API介面，指不同軟體系統間互動的標準協議，透過預先定義的通訊規則，實現功能呼叫和資料共享。但是，各家APP顯然不會通過API，提供這種標準化、結構化的API資料介面。剛好相反，各家會採取技術手段，避免自己的資料被「爬蟲」爬取。這也是為什麼消費者有時候會遇到真人校驗。而透過技術手段，破解API介面，繞過安全防護機制，非法取得他人電腦資訊系統中的資料（如使用者資訊、商業資料等），可能觸犯《中華人民共和國刑法》第二百八十五條，構成非法取得電腦資訊系統資料罪‌或‌提供侵入電腦資訊系統程式罪‌。而大模型的意義恰好就是能處理非結構化資料，理解複雜語境。一方面，當使用者說“找個安靜的咖啡館寫東西”，AI能結合位置、環境噪音、使用者習慣等多維度資訊進行判斷，並通過語音與使用者持續溝通。這就提升了人機互動的自然度與方便度。更重要的是，在另一方面，AI大模型與手機廠商合作，用系統金鑰打包並燒錄進手機ROM，獲得諸多底層權限，才可以像作業系統原生部件一樣，跨應用操作。再加上AI助理可以憑藉處理非結構化資料的能力，從螢幕取得資料，就可以讓AI助理繞過各家的API，直接取得這些APP的資料，並模擬使用者手指，操作這些APP。這是一個法律的新問題。也就是說，以前各個APP直接向使用者提供訊息，現在，使用者說：AI助手，你去幫我讀取，然後幫我決策。所以，AI手機助理的實質，就是有能力獲得「讀屏」「模擬手指」這類底層權限，進而繞過各家APP的屏障。這才是最關鍵的一點。有了這個能力，AI助理可以做很多事。例如，可以進行跨電商平台比價、各家電商之間，幫你算那個便宜，那家送得最快。顯而易見，在這些操作中，AI助手就可以在一定範圍內，引入自己的傾向性。 AI可以告訴消費者，這家便宜5毛，但另一家送得更快；它也可以反過來說，這家雖然送得更快，但另一家便宜5毛。它還可以說，這家便宜5毛，那一家送得更快，但有一家新開的，或評分不錯，你要不要嘗試一下？這種誘導，未必是侵害消費者利益，因為對消費者來說，便宜5毛錢；送得更快；嘗試一下新味道，三者是同等效用的，並沒有被損害。但這對整個外送、餐飲甚至電商生態來說，是顛覆性的。2013年上映的科幻愛情片《Her》，講述了未來世界中，信件撰寫人西奧多與人工智慧作業系統薩曼莎之間的情感故事。薩曼莎沒有實體，僅憑聲音與西奧多建立了超越傳統的親密關係。不難想見，一個和使用者有情感連結的AI助手，對未來的商業版圖的影響是巨大的。做一個有趣的比喻，如果說消費者是皇帝的話，各個APP的各種促銷、廣告、補貼就像臣子，臣子要影響到皇帝的心智，要見到皇帝，都得通過AI這個貼身太監的許可。但風險也隨之產生，例如，現在很多銀行的APP在偵測到讀取螢幕時，就提示使用者，手機開著螢幕分享，請關閉。銀行APP的這個提示，並不是提前做好，用來抗拒手機AI助理的，而是為了應對電詐的。AI要作為一個助理存在，必然要取得許多包括「讀屏」在內的高敏感權限。這就像現實中的助理一樣，要展開工作，必然需要瞭解僱主的許多敏感資訊。從這個角度，AI透過「讀屏」等權限，把所有APP連接在了一起，打破了沙盒機制。所謂沙盒機制，是電腦的安全機制，為運作中的程式提供的隔離環境。當AI助手，某種程度上打破了這個沙盒，成為一個“超級應用”，風險也由此產生。這相當於把所有資訊都放到了同一個籃子裡。大廠商當然會做到規範，但事情總有萬一，一旦洩露，就是系統性風險。以前金融、聊天、圖片、付款、健康等訊息，分別在不同APP，如今都在一個超級應用AI。除此之外，敏感權限的授權，也會造成消費者的警覺性下降。伴隨網路、智慧型手機的發展，這個趨勢其實一直都存在。例如，以前用數位相機拍一張照片，放到電腦上觀看，全過程相片不會被第三方看到。但現在，如果想用手機發一張圖，或修一張圖，或提取其中的文字，你就必須接受讓第三方讀取你的照片。手機作業系統也做出了相應的改變，設定了單次授權，App每次只能存取使用者主動選擇的單張照片，無法自動批次取得或遍歷所有照片。但這意味著你每次都得選兩次，這種不方便，最終就會讓使用者授權第三方讀取整個相簿。以前一個陌生人，翻你電腦上的相簿，你會高度敏感。但現在，當很多軟體都要求讀取相簿，讀取通訊錄的時候，使用者的警覺性就下降了，就會不假思索地同意第三方讀取整個手機相簿。未來，當手機AI助手，普遍性讀取整個螢幕，使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。讀屏和透過api獲得資訊不同，它覆蓋整個手機螢幕的全部訊息，這就意味著，AI手機使用者雖然授權，但他的聯絡人、聊天對象、快遞收件人，都一併被讀取了訊息。根據國家網路金融風險分析技術平台發佈的監測資料顯示，截至2020年2月底，已發現網路金融仿冒網站4.8萬個，受害使用者達12萬人，網路金融仿冒APP 2801個，下載量3343.7萬次。未來AI手機助手普及，電詐份子只需做一個假的AI助手，使用者也會不假思索地進行各種高敏感權限授權，然後犯罪分子就能拿到受害者的全部金融資訊。 AI手機帶來方便、有效率的同事，也會提高黑灰產的效率。目前，消費者、監管、各家廠商，面對這即將到來的衝擊，還未完全準備好，有待未來在落地、普及的過程中，逐漸演化。圍繞著隱私、資料安全、商業利益，AI助理將成為各方博弈的焦點。AI助手，可以稱之為手機的靈魂，也是手機廠商由硬轉軟，更直接接觸整個行動網路商業生態的機會。手機廠商肯定不願意交給第三方。在2025年第39周，中興、魅族、努比亞、三星等品牌累計佔據5.66%的市佔率。由此可見，努比亞的市佔率已經很小了，所以，會選擇深度繫結。但其他手機品牌，絕對不願意輕易交出自己的靈魂。在應用層面，基於安全、商業利益等原因，「APP們」也會抵抗AI手機助理。例如，銀行APP，基於金融安全的需求，就拒絕「讀螢幕」。但是消費者仍然是巨大的推動力。例如，一個抗拒讀取螢幕的銀行APP，消費者可能就拒用，轉向另一家銀行。而對於提供同質化、標準化產品與服務的商業模式來說，挑戰就更大。《Her》這部電影，拍攝於2013年，電影設定的故事發生時間卻剛好是2025年，地點是上海。 12年前的科幻元素已成為現實。這使《Her》不僅是一部科幻片，更像是現實的預言。手機、網路公司、使用者、監管，即將迎來20年未有之大變局，而這個變局會決定今後更長時期的商業、經濟、社會面貌。（FT中文網）