#AI助手
高盛:中國網際網路行業策略大轉向,雲和資料中心成top pick,超越遊戲
高盛在3季度業績發佈及調研後,對中國網際網路行業策略大轉向:把“雲與資料中心”提到了首選類股,排到了遊戲和出行之前。AI帶來的算力需求和資本開支(Capex)擴張,已經是最確定的增長邏輯了。1、最大預期差:雲與資料中心成為“新王” ☁️高盛這次非常堅決,把雲和資料中心類股從原來的第三提升到第一。邏輯很硬:AI訓練和推理的需求持續爆發,加上巨頭們都在搞“多晶片策略”,資料中心的訂單量非常飽滿。核心邏輯:不僅是輝達,國產晶片的供應上來後,算力基建的利用率和回報率都在提升。2、AI助手的“入口之戰”是個大隱憂 🤖報告專門討論了一個長線風險:字節跳動的“豆包手機助手”。這東西能直接在作業系統層面(OS-level)幫使用者跨APP操作,比如比價、點外賣。這對現有的APP生態是個降維打擊。雖然目前微信等巨頭因為安全隱私原因封鎖了它的介面,但這種“超級AI代理”對使用者流量入口的爭奪,是未來幾年最大的變數。字節系App現在霸榜iOS免費榜前五中的四席,攻勢很猛。3、本地生活:燒錢該結束了,關注利潤修復 🛵外賣和即時零售打得太凶,三季度行業大概虧了700億人民幣,太誇張了。高盛判斷,這種非理性的補貼戰不可持續。格局推演:美團、阿里、京東的市場份額最終可能會穩定在 5:4:1。美團:雖然長期單均利潤預期被微調(從0.8元降到0.7元),但在這個價位,壞消息已經Price-in了,隨著補貼退坡,利潤修復是大機率事件。4、最新的“核心股票池”名單 📝根據最新的類股偏好,高盛更新了首選名單:雲/資料中心:阿里巴巴、萬國資料、世紀互聯。遊戲(防守反擊):騰訊、網易。出行(格局穩固):滴滴、滿幫。電商(新面孔):快手(新增為關鍵推薦,看好其AI模型Kling的突破和電商變現)。5、估值怎麼看? 📊現在中概網際網路類股的2026年預期市盈率(P/E)中位數大概是18倍。之前的上漲主要靠殺估值修復(Multiple Expansion),接下來的漲幅,必須得靠實打實的每股收益(EPS)增長來驅動了。所以,選利潤兌現能力強的公司,比單純博反彈要穩妥得多。總的來說,風向變了,硬科技基礎設施(資料中心)的優先順序在上升,而純流量變現的生意面臨AI新玩法的挑戰。 (硬AI)
進擊的AI手機,撞上隱私牆
未來,當手機AI助手,普遍性讀取整個螢幕,使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。近日,字節跳動發佈了全新一代豆包手機助理的技術預覽版。這款豆包手機助手,跟手機廠商深度融合,具備了視覺感知、長期記憶以及直接動手操作的能力。它在螢幕上產生一個懸浮窗,模擬你的一切操作,完成你的指令。你對著手機說完​​這句話,不用打開任何APP,後台已自動完成美團、淘寶、京東的比價,彈跳窗確認後直接跳轉支付。使用者詢問車停在那裡時,它能調出使用者上次拍攝的車位照片並附帶樓層指引;當需要取快遞時,它能讀取簡訊歷史並報出取件碼;甚至當使用者詢問高鐵座位號時,它能自動翻找12306的購票記錄並告知精準位置。消息發酵後,中興通訊A股強封板漲停,成交額超140億元。港股同步走強,盤中一度漲超10%。消費者對這款手機也非常有興趣,中興官方商城已經售罄,閒魚上二手售價4200~4999元,比官方售價高出上千。不難判斷,未來各家都會推出自己的AI助理。這種AI新入口,為未來的商業競爭,帶來了巨大的不確定性,機會和挑戰並存。要理解這一點,還得從底層技術談起。首先,AI助理的基礎,是大模型的分析資訊、與人互動的能力。這個能力可以讓AI根據使用者的指示去收集、分析訊息,透過文字、語音、圖片,給用語音、文字、圖片給出結論。其實,這些能力之前的手機也並不是完全不具備。如果價格、評分、評估等資訊標準化、結構化了,並透過API介面提供,那麼,無需大模型,也可以給出對比的結論。所謂API介面,指不同軟體系統間互動的標準協議,透過預先定義的通訊規則,實現功能呼叫和資料共享。但是,各家APP顯然不會通過API,提供這種標準化、結構化的API資料介面。剛好相反,各家會採取技術手段,避免自己的資料被「爬蟲」爬取。這也是為什麼消費者有時候會遇到真人校驗。而透過技術手段,破解API介面,繞過安全防護機制,非法取得他人電腦資訊系統中的資料(如使用者資訊、商業資料等),可能觸犯《中華人民共和國刑法》第二百八十五條,構成非法取得電腦資訊系統資料罪‌或‌提供侵入電腦資訊系統程式罪‌。而大模型的意義恰好就是能處理非結構化資料,理解複雜語境。一方面,當使用者說“找個安靜的咖啡館寫東西”,AI能結合位置、環境噪音、使用者習慣等多維度資訊進行判斷,並通過語音與使用者持續溝通。這就提升了人機互動的自然度與方便度。更重要的是,在另一方面,AI大模型與手機廠商合作,用系統金鑰打包並燒錄進手機ROM,獲得諸多底層權限,才可以像作業系統原生部件一樣,跨應用操作。再加上AI助理可以憑藉處理非結構化資料的能力,從螢幕取得資料,就可以讓AI助理繞過各家的API,直接取得這些APP的資料,並模擬使用者手指,操作這些APP。這是一個法律的新問題。也就是說,以前各個APP直接向使用者提供訊息,現在,使用者說:AI助手,你去幫我讀取,然後幫我決策。所以,AI手機助理的實質,就是有能力獲得「讀屏」「模擬手指」這類底層權限,進而繞過各家APP的屏障。這才是最關鍵的一點。有了這個能力,AI助理可以做很多事。例如,可以進行跨電商平台比價、各家電商之間,幫你算那個便宜,那家送得最快。顯而易見,在這些操作中,AI助手就可以在一定範圍內,引入自己的傾向性。 AI可以告訴消費者,這家便宜5毛,但另一家送得更快;它也可以反過來說,這家雖然送得更快,但另一家便宜5毛。它還可以說,這家便宜5毛,那一家送得更快,但有一家新開的,或評分不錯,你要不要嘗試一下?這種誘導,未必是侵害消費者利益,因為對消費者來說,便宜5毛錢;送得更快;嘗試一下新味道,三者是同等效用的,並沒有被損害。但這對整個外送、餐飲甚至電商生態來說,是顛覆性的。2013年上映的科幻愛情片《Her》,講述了未來世界中,信件撰寫人西奧多與人工智慧作業系統薩曼莎之間的情感故事。薩曼莎沒有實體,僅憑聲音與西奧多建立了超越傳統的親密關係。不難想見,一個和使用者有情感連結的AI助手,對未來的商業版圖的影響是巨大的。做一個有趣的比喻,如果說消費者是皇帝的話,各個APP的各種促銷、廣告、補貼就像臣子,臣子要影響到皇帝的心智,要見到皇帝,都得通過AI這個貼身太監的許可。但風險也隨之產生,例如,現在很多銀行的APP在偵測到讀取螢幕時,就提示使用者,手機開著螢幕分享,請關閉。銀行APP的這個提示,並不是提前做好,用來抗拒手機AI助理的,而是為了應對電詐的。AI要作為一個助理存在,必然要取得許多包括「讀屏」在內的高敏感權限。這就像現實中的助理一樣,要展開工作,必然需要瞭解僱主的許多敏感資訊。從這個角度,AI透過「讀屏」等權限,把所有APP連接在了一起,打破了沙盒機制。所謂沙盒機制,是電腦的安全機制,為運作中的程式提供的隔離環境。當AI助手,某種程度上打破了這個沙盒,成為一個“超級應用”,風險也由此產生。這相當於把所有資訊都放到了同一個籃子裡。大廠商當然會做到規範,但事情總有萬一,一旦洩露,就是系統性風險。以前金融、聊天、圖片、付款、健康等訊息,分別在不同APP,如今都在一個超級應用AI。除此之外,敏感權限的授權,也會造成消費者的警覺性下降。伴隨網路、智慧型手機的發展,這個趨勢其實一直都存在。例如,以前用數位相機拍一張照片,放到電腦上觀看,全過程相片不會被第三方看到。但現在,如果想用手機發一張圖,或修一張圖,或提取其中的文字,你就必須接受讓第三方讀取你的照片。手機作業系統也做出了相應的改變,設定了單次授權,App每次只能存取使用者主動選擇的單張照片,無法自動批次取得或遍歷所有照片。但這意味著你每次都得選兩次,這種不方便,最終就會讓使用者授權第三方讀取整個相簿。以前一個陌生人,翻你電腦上的相簿,你會高度敏感。但現在,當很多軟體都要求讀取相簿,讀取通訊錄的時候,使用者的警覺性就下降了,就會不假思索地同意第三方讀取整個手機相簿。未來,當手機AI助手,普遍性讀取整個螢幕,使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。讀屏和透過api獲得資訊不同,它覆蓋整個手機螢幕的全部訊息,這就意味著,AI手機使用者雖然授權,但他的聯絡人、聊天對象、快遞收件人,都一併被讀取了訊息。根據國家網路金融風險分析技術平台發佈的監測資料顯示,截至2020年2月底,已發現網路金融仿冒網站4.8萬個,受害使用者達12萬人,網路金融仿冒APP 2801個,下載量3343.7萬次。 未來AI手機助手普及,電詐份子只需做一個假的AI助手,使用者也會不假思索地進行各種高敏感權限授權,然後犯罪分子就能拿到受害者的全部金融資訊。 AI手機帶來方便、有效率的同事,也會提高黑灰產的效率。目前,消費者、監管、各家廠商,面對這即將到來的衝擊,還未完全準備好,有待未來在落地、普及的過程中,逐漸演化。圍繞著隱私、資料安全、商業利益,AI助理將成為各方博弈的焦點。AI助手,可以稱之為手機的靈魂,也是手機廠商由硬轉軟,更直接接觸整個行動網路商業生態的機會。手機廠商肯定不願意交給第三方。在2025年第39周,中興、魅族、努比亞、三星等品牌累計佔據5.66%的市佔率。由此可見,努比亞的市佔率已經很小了,所以,會選擇深度繫結。但其他手機品牌,絕對不願意輕易交出自己的靈魂。在應用層面,基於安全、商業利益等原因,「APP們」也會抵抗AI手機助理。例如,銀行APP,基於金融安全的需求,就拒絕「讀螢幕」。但是消費者仍然是巨大的推動力。例如,一個抗拒讀取螢幕的銀行APP,消費者可能就拒用,轉向另一家銀行。而對於提供同質化、標準化產品與服務的商業模式來說,挑戰就更大。《Her》這部電影,拍攝於2013年,電影設定的故事發生時間卻剛好是2025年,地點是上海。 12年前的科幻元素已成為現實。這使《Her》不僅是一部科幻片,更像是現實的預言。手機、網路公司、使用者、監管,即將迎來20年未有之大變局,而這個變局會決定今後更長時期的商業、經濟、社會面貌。 (FT中文網)
抱歉了Chrome,這次我選中國這款AI瀏覽器
【新智元導讀】全面融合千問,夸克AI瀏覽器全面升級!不切應用、不換標籤,隨時喚起千問AI助手,實現作業系統級全域喚起的互動形態。學生黨、打工人的真正生產力神器來了。ChatGPT推出Atlas,Google股價應聲下挫超4%。AI瀏覽器正在成為國際巨頭新角力場。PC作為人們工作+學習主力的場景,正成為 AI 搶佔的下一個超級入口。一方面,移動端螢幕太小,輸入慢,生產力場景碎片化;另一方面,真正的深度思考、複雜創作、協同辦公,始終是PC大屏的主場。11月26日,夸克全面升級為更強大的AI瀏覽器——這次直接把千問AI助手焊進了瀏覽器,並行布六大千問AI套件;無需切換標籤或應用,支援任意場景喚起千問;成為國內首個實現「作業系統級」的全域AI體驗。此番煥新亮相,再次宣告了阿里全力進軍AI to C的市場野心,代表著阿里AI戰略(C計畫)持續升級落地。2025年AI瀏覽器的終極戰場,阿里正在下一盤更大的棋。新一代AI瀏覽器登場如今,打開電腦點開夸克,它已經搖身一變,全新升級為「夸克AI瀏覽器」。其實,這一步並不突然。前段時間,背靠阿里Qwen大模型推出「千問App」,並以「最強模型做最好個人助手」的姿態重新殺回C端市場。這一次,夸克升級,直接對標Chrome,打造全球領先的AI瀏覽器。夸克的底氣來自那裡?1、阿里AI戰略持續升級,基於阿里生態優勢,全力入局AI to C,搶佔PC超級入口。2、基於阿里最強大模型Qwen,夸克全面融合了千問,讓瀏覽器長出「第二外腦」。3、全球領先的AI產品形態,實現系統級「全域AI」能力,隨時桌面可喚起千問。自2023年上線後,Qwen「全家桶」不斷升級迭代,在業界廣受好評。如今,Qwen 3成為阿里大模型家族最強AI。就連Hugging Face CEO多次公開力薦Qwen模型。毋庸置疑,Qwen 3就是阿里最大王牌,支援文字、圖像、語音等多模態輸入,是實力全能型選手。它的即時推理引擎,可以毫秒級響應,即便面對複雜任務也能從容應對。基於Qwen搭建的夸克,針對瀏覽器場景做了深度定製,整合了強大的自然語言理解、網頁結構解析,以及使用者意圖與上下文關聯能力。同時,搭配的千問AI助手,推理、理解、執行能力強大。它不僅適合日常問答、創作,也適合科研、推理研究;文采出眾、專業領域也能提供高品質的回答。作為新一代AI瀏覽器,夸克回答更聰明、處理任務更高效,體驗也更加絲滑。一手實測,妥妥的生產力神器夸克全面融合了千問,無需頻繁切換標籤和應用,隨時召喚AI。邊瀏覽網頁邊對話、邊閱讀文章邊總結,即問即答,彷彿有個AI副手隨時待命。接下來,我們展開了一波最全面的實測。桌面級智能助理,隨時待命這次升級,最大的亮點便是——AI不再被關在某個網頁或某個小外掛裡。和很多「裝了AI外掛的瀏覽器」相比,差別就在這裡——別家是「你找AI」,夸克想做到「AI伴隨左右」。全域桌面喚起千問的入口是多元的:千問讀屏、快捷框、懸浮球、側邊欄、劃詞、螢幕擷圖。以上方式皆可實現,可做到隨時隨地,即問即答。舉個栗子,《瘋狂動物城2》即將在國內上映了,想要瞭解下觀影體驗,直接對話方塊問千問就可以了。千問給出的總結,非常全面。它並非直接羅列分析,而是先提供高度凝練的結論,再系統地從四個維度進行闡釋。甚至最後,它還附上了影片精準的上映時間。無需查詢多個網頁,即可掌握要點,節省大把時間。一句話,隨時喚起千問幫你幹活。點選千問懸浮球,或是Alt+空格/Option+空格即可一鍵喚起千問快捷框。不論是搜尋、創作、總結、翻譯,還是做表格、做PPT,甚至是格式轉換,一句話就夠了。i人大學生怎麼練習口語?千問隨即給出了一套行之有效的實操指南。當你還在為課程論文頭疼時,千問可以直出一份邏輯清晰、結構完整的寫作框架。不管是學生還是打工人,做表、做PPT都是必修的功課。如今,一句話千問就能搞定了。它還可以一句話轉格式,課堂上、會議上白板的文字,能一鍵提取並幫你轉成PDF。在工作、學習,不論遇到了何種問題,都可以隨時喚醒千問。更強大的是,無需打開夸克瀏覽器,千問AI也能做到有問必答。千問讀屏「讀屏」的本質,是共享螢幕讓AI能夠在即時讀懂螢幕上的內容,理解、分析並給出回答。要做到這一點,必須具備超強的多模態與即時互動能力,遠超普通文字問答的難度。舉個例子,把Karpathy考驗Nano Banana題目共享給千問,讓它給出解答。在解題之前,千問第一步需「看」——識別出螢幕中的文字。不僅要看懂,還要理解和推理。接下來,它會分析當前任務的意圖,然後逐步推理,給出精準的答案。亦或是在工作中,閱讀一些文件不得要領時,打開千問讀屏,一鍵總結。我們又接著文件後續內容進行提問——「Google這次打了勝仗了嗎?那些話可以體現」。沒想到,千問可以根據已有的內容,做出判斷分析,然後給出總結。通過多輪提問,輕輕鬆鬆就能把工作搞定。更驚喜的是,千問讀屏還可以共享應用——WPS文件,支援Word和PDF形式。想要緊追AI前沿論文,千問幫你把論文的全貌總結得清清楚楚。可以看到,不論在做什麼,千問都可以即時洞察螢幕內容,理解人們的當下所需。這一過程非常簡單,無需複製、截圖、解釋,就能得到精準回應,讓打工人、學生黨更加專注做事。千問側邊欄你是不是也曾有過這樣的煩惱,在看一篇難啃的英文文章時,整篇通讀下來不得要領。這時,「千問側邊欄」隨時出動,用不了多久就能總結一篇詳細的摘要,讓效率大幅提升。再比如,看一份技術報告,卻不懂一些專業術語的含義,千問可以解決。千問劃詞閱讀時,遇到一個不懂的詞,或是想要瞭解更多資訊,不用關鍵詞搜尋,「千問劃詞」就可以。千問劃詞的能力,貫穿整個PC系統。不論是在夸克,還是是本地檔案、WPS等第三方應用,皆可實現全域桌面喚起千問。千問螢幕擷圖更厲害的是,千問螢幕擷圖也可以即問即答。擷取一張肥皂膜奇點的圖片,千問一下子就能解釋明白。不僅如此,想要提取圖片中的文字,螢幕擷圖後點選「提取文字」,複製貼上順手搞定。經過多輪實測後不難發現,夸克此次煥新升級,真正實現了全域桌面喚起千問。作為比較,OpenAI Atlas也原生整合了ChatGPT對話能力,進入首頁即可喚醒ChatGPT。在打開任意網頁時,點選「Ask ChatGPT」或側邊欄直接呼叫,論文解讀、總結、改寫都能實現。不僅如此,Atlas還可以開啟「Agent模式」,讓ChatGPT代為操作,在瀏覽器中填表、訂機票....不過這種能力,僅侷限在Atlas中使用,跳脫了這個瀏覽器,便不能喚醒ChatGPT了。全面融合千問的夸克AI瀏覽器可以做到——隨叫隨到,即問即答。不論在夸克瀏覽器裡面,還是在桌面、任何第三方應用,皆可喚醒千問AI助手,做到了真正的系統級全域喚起AI的能力。智能瀏覽:絲滑的工作流幾十年來,網際網路深刻地改變了資訊傳播的方式。對現代人來說,能不能上網很重要;而上網,離不開瀏覽器——這關乎我們如何認知資訊。但資訊不是結果,大家期待讓工作更輕鬆的工具出現。而AI時代的到來,讓阿里看到了這種可能:將AI能力深度嵌入電腦作業系統,把夸克AI瀏覽器打造為更專業的生產力工具。這次升級了下列功能:智能標籤管理線上文件直接編輯超級播放器PDF對照翻譯跨端流暢傳輸雲端儲存,智能尋找首先,幫你智能管理標籤,運行更流暢,介面更清爽。點選夸克AI瀏覽器左上角,可以快速搜尋——多標籤不再混亂,幫你快速找到所需頁面。右鍵一點就可以給網頁建立標籤組,重新命名、選顏色,輕鬆將相關的網頁,比如說項目的文件或者學習資料歸納到同一個分組裡。標籤可以自由收起或者展開,再也不用擔心頁面雜亂無章:而且它可以智能管理高記憶體頁面,確保全程流暢,在不同任務和工作流之間絲滑切換。這避免了瀏覽器崩潰打斷工作流,從而提升使用者資訊處理效率。但對生產力工具而言,穩定運行也是基本要求。在此之上,夸克圍繞辦公、學習等場景下的高頻需求,還有獨有的「殺手鐧」。比如,辦公或學習中最常用到的PDF檔案,在過去處理起來比較繁瑣。過去,你可能要採取下列步驟:夸克AI瀏覽器的「PDF編輯」就簡單多了:線上PDF檔案,無需下載,線上查看、批註這次,夸克不止可以查看PDF,還提供了下列實用功能:高效處理:隨時劃詞批註和修改、一鍵標記。隨心編輯:可直接選中、複製、搜尋。最關鍵的是,PDF編輯的能力更強大,可以直接打開或直接拖入瀏覽器,圖片上的文字也能直接編輯——對於學生黨等需要查看外文的使用者來說,夸克的對照翻譯尤其實用——上傳或打開PDF,AI自動生成雙欄對照排版,外文即時對照翻譯:專業文獻、論文、報告再也不用來回對照。夸克太懂學習需求了——阿里最強AI模型支援,中文翻譯質量有保障。閱讀、學習、整理PDF,一切都更輕鬆。對於辦公黨而言,夸克這次跨端傳輸解決了多端同步的痛點:文件、網頁、大檔案都能跨端傳輸,100G大檔案也能輕鬆傳;讓電腦的工作也能在手機上隨時處理,實現工作無縫銜接。傳送網址,PC端只需右擊網頁標籤,點選「傳送到手機」,即可在手機端接收到相關連結。比如,在夸克AI瀏覽器中修改好的PDF檔案,在起始頁,只需點選瀏覽器右上↗️工具列中的「紙飛機」快傳功能,即可傳送檔案。這些能力過去在各類AI、App裡也能實現,但需要頻繁切換標籤、應用、甚至需要各種手動螢幕擷圖、複製連結、上傳檔案,費時費力。夸克要解決的是「摩擦成本」——打開夸克,所有完整工作流都在一個AI瀏覽器完成。夸克背靠阿里生態,使用Qwen領先模型+深度融合千問,讓人人都能免費享受行業首創的全域AI能力。再加上夸克一貫的「無廣告干擾、啟動載入極速、資料更安全」的基本盤,整體體驗是:把複雜工作流做簡,把必要摩擦力做到最低。這是夸克敢於對標Chrome的底氣——Chrome通過Gemini模型重構搜尋欄,實現自然語言對話與生成式回答;夸克則通過C計畫全面升級為AI的PC超級入口,主打提高生產力:一句話辦成事,工作更絲滑。在這場AI重塑資訊入口的變革中,夸克以全新AI互動形態,通過垂直場景深耕與生態整合建構差異化競爭力。搶攻AI新入口,全球巨頭血戰AI這波浪潮,重新點燃了瀏覽器的戰火。傳統瀏覽器只做兩件事:一是顯示HTML/JS渲染出的頁面;二是根據關鍵詞發起搜尋。比如,想要寫一篇報告,開一堆標籤頁,需要自己搜、自己讀、自己總結,尤其是在資訊極度過剩的今天,更加讓人頭大,且時間成本高。最關鍵的是,它根本不理解人類進行中的任務,也不會歸類tab,針對頁面做總結。還有一個非常重要的因素是,傳統搜尋的商業模式高度依賴廣告,而國內瀏覽器最為典型。對於每個人來說,原本只想找個答案,結果滿屏廣告、雜訊,體驗感大幅降低。大模型的出現,不僅從底層重塑了瀏覽器,還帶來了一場生產力的效率革命。它的核心,就是讓AI去看、去總結,做資訊壓縮和結構化處理,而且讓「智能體」去承接學習、辦公等任務。放眼全球,全球科技巨頭和AI初創公司的重磅玩家們,各有各的打法。以Google、微軟為代表的巨頭,選擇了在傳統瀏覽器上「加AI層」。微軟Edge瀏覽器,將Copilot深度整合到側邊欄中;GoogleChrome接入Gemini,總結網頁、下單等任務皆可實現。而AI瀏覽器「新貴」最典型代表,莫過於Perplexity的Comet,OpenAI的Atlas、原創Arc公司的Dia......Comet直接把Perplexity對話式搜尋嵌入了瀏覽器,以其出色的搜尋、總結、規劃等能力,贏得了行業口碑。Atlas主菜是「智能體」,其「Agent Mode」可自主代勞,完成調研、比價、訂機票等複雜任務。回到國內戰場,一些網際網路巨頭紛紛將AI植入瀏覽器中,而更多在基本上面的能力實現,比如對話、總結這類。AI的滲透,僅停留在表層,並未觸達PC超級入口的核心。可以看到,幾乎每個有實力的玩家,都想要在AI瀏覽器中分一杯羹。夸克的這次升級,直接把戰場天花板拉高了一個量級,加入了全球AI瀏覽器佇列。當系統級全域 AI 變成標配,當「一句話幹活」成為新的互動範式,當瀏覽器從資訊入口升級為智能中樞——2025年這場AI瀏覽器的終極戰,拼的就不再是誰的AI功能多,而是誰能真正改寫人們工作的方式。對阿里而言,此次夸克AI瀏覽器的全面升級,實現超1.1億電腦使用者喚起千問,都是在搶奪當下和未來的流量入口。 (新智元)
全球首個“AI部長”就任,主打一個“沒人性”
今天我們聊聊AI。我們都知道AI正在一步步嵌入人類社會,但你可能想不到,這種嵌入,居然已經深到這個程度。這件事發生在阿爾巴尼亞。前不久,阿爾巴尼亞總理任命了一名新的“公共採購部”部長。這個職位主要負責政府的各項採購。這位新的公共採購部部長,叫迪埃拉,迪埃拉不是真人,而是AI。沒錯,這是全球的第一位“AI部長”。為什麼要讓AI當部長呢?AI部長能靠譜嗎?我們一起來看看。01 全球第一個“AI部長”是怎麼誕生的?迪埃拉的核心演算法,由微軟和OpenAI聯合開發,運行在阿爾巴尼亞政府的電子政務平台上。實際上,迪埃拉早在2025年1月就作為AI助手在這個平台上線了。截至2025年9月初,它出任採購部部長時,迪埃拉已經在平台上處理了3.6萬多份數字檔案,協助提供了近1000項政府服務。阿爾巴尼亞官方生成的“迪埃拉”形象照讓AI當部長,難道當地政府就那麼信得過AI?這背後其實多少有點無奈。讓AI當部長,主要是因為阿爾巴尼亞政府存在一個棘手的問題,腐敗。這個國家的腐敗一度相當嚴重。在2016年的評估報告中,有91%的受訪者認為國家存在腐敗,有一半的受訪者表示政府官員收受賄賂,還有三分之一的受訪者說,曾經被迫行賄。2023年,在一個國際組織的調查中,阿爾巴尼亞的廉潔程度在全球排名第98,在歐洲幾乎墊底。據說阿爾巴尼亞的公共採購裡,充滿了關係戶、走後門、行賄受賄、中飽私囊。甚至還有人說,這個國家的公共採購招投標體系,就是“國際軍火走私和毒品販運的洗錢管道”。這種情況不僅造成了內憂,也極大程度地阻礙了阿爾巴尼亞的對外發展。比如,它想在2030年加入歐盟,但由於歐盟對反腐敗的要求很嚴格,它不達標就進不去。怎麼辦?傳統的人工監管都試過,根本不管用,涉及錢和權力,人與人之間的關係太複雜了,總有各種利益糾葛。於是阿爾巴尼亞政府想了個辦法,乾脆讓AI來管這事兒。迪埃拉就是在這種背景下被推到台前的。迪埃拉這個詞,在阿爾巴尼亞語中是“太陽”的意思,象徵著透明和公正。迪埃拉的目標是,公正地組建團隊,稽核項目,排除政府採購中可能發生的腐敗。就這樣,全球第一個“AI部長”誕生了。02 AI已經開始在責任維度上演化接下來迪埃拉的表現怎麼樣,現在還是未知數。不過,這件事確實帶來一個訊號,這就是,AI在人類活動中的參與,越來越深入了。首先,使用AI的人群基數在不斷擴大。根據最新的AI應用報告,咱們國內有將近6.45億人使用AI應用,這相當於將近一半的中國人都在跟AI打交道。再看國外的資料,根據OpenAI最新發佈的資料,到2025年的7月,它的周活躍使用者超過7億,這個數字相當於全球1/10的成年人。同時,AI和人類的協作關係也在發生變化。最開始,AI只是一個工具,用來娛樂或者處理簡單任務。這個階段裡,AI貢獻的能力不多,並且不承擔任何責任。比如,用AI做個頭像,讓它陪你聊聊天,讓它寫首小詩,或者在遊戲裡跟NPC對話,等等。在這些場景裡,就算AI出了問題也沒什麼大不了的,反正就是娛樂嘛。現在,AI的娛樂屬性依然很強,並且已經發展出一個不小的市場。2025年上半年,全球AI陪伴應用下載量達到6000萬次,同比增長64%。再比如,虛擬偶像也是一類很熱門的應用,2024年中國虛擬偶像市場規模為27億元,全球市場預計2029年能達到40.44億美元。當然,AI能做的事情遠不止娛樂。它也可以進入工作流程,成為人類的助手。這時,AI貢獻了比較高的能力,可以替代一部分人類工作,但責任邊界很清楚,最終決策權還在人類手裡。比如,程式設計領域,GitHub程式設計社區推出了官方的程式設計助手,現在有46%的新程式碼都是由AI編寫的,開發人員整體工作效率提高了55%。再比如,在創意設計領域,根據Adobe的調研,設計師使用AI工具後創意產出能快10倍。當然,到這兒,AI承擔的功能還只是執行層面上的,它並不真正為一件事的結果“負責”。但現在,情況正在發生變化。史丹佛大學的社會與語言技術實驗室,2025年6月份發表了一項新研究,專門考察了人們對“人機協作”的看法。他們發現,差不多一半的人,最喜歡的人機協作方式是“平等合作”,也就是說,大部分人既不想被AI完全替代,也不想徹底拒絕AI,而是希望和AI平等地“共事”。還有不少人表示,既想讓AI幹活,也希望它能對某個環節完全“負責”。而不是AI只負責執行,最後的責任都由人來承擔。你看,我們開頭說的阿爾巴尼亞那個AI部長,它不只是提供建議,而是直接負責公共採購項目的稽核和決策。這意味著什麼?也許,AI已經開始在責任這個維度上演化了。03 AI的優勢可能是“不近人情”為什麼會出現這種變化?就拿阿爾巴尼亞來說,表面上看,是因為阿爾巴尼亞的腐敗太嚴重,傳統的人工監管根本管不住。但往深了想,問題的核心在於:涉及錢和權力,人與人之間的關係太複雜了。有利益糾葛,有人情往來,有各種算計。你讓一個人去監管另一個人,他能做到完全公正嗎?很難。這時候,AI的優勢就顯現出來了。不是因為AI比人更聰明,而是因為AI“不近人情”。它不會算計利害關係,不怕得罪人,不會因為某個官員是自己的老同學就網開一面,也不會因為擔心影響仕途就睜一隻眼閉一隻眼。AI理論上可以做到只看資料,只看規則,只看結果。這種“不近人情”,在很多需要中立決策的場景中,反而成了最大的價值。萬維鋼老師曾經講過一個美國換水管的例子。密歇根州的一座城市要改造含鉛的舊水管,但問題是,你得先把水管挖出來才知道是不是含鉛。那先挖誰家的呢?2017年,密歇根大學的兩個教授開發了一個AI,能以80%的精準率預測那家水管含鉛。當地政府用了這個AI,一開始效果不錯,精準定位,節省成本。但工程開展一段時間後,居民開始抱怨了。為什麼鄰居換了,我家沒換?富人區的居民還會質疑,怎麼不優先換我們的?市長一看受到這麼多抱怨,開始擔心自己的政績要受損。他決定不聽AI的了,改成挨家挨戶慢慢換,這樣誰也不得罪。結果呢?決策精準率從80%直接降到了15%。大量資源被浪費,真正需要換水管的家庭反而被耽誤了。後來當地強制規定,換水管必須先聽AI預測,精準率才又提高回來。你看,這個案例說明了什麼?不是AI比市長更懂水管,而是市長作為一個政治人物,他必須考慮民意、考慮選票、考慮自己的政治前途。這些考量都很正常,但它們會干擾決策的科學性。AI不需要考慮這些。它不用競選連任,不怕被罵,只要資料和演算法告訴它應該先挖那家,它就會給出這個答案。再看一個例子。自媒體半佛仙人曾經提過一個觀點:公關行業最主流的流派,是老闆拍腦袋。怎麼寫會被誇,怎麼寫會被罵,其實從事公關工作的人大差不差都明白。但問題不在於誰更懂,而在於誰說了算。很多“災難性公關”,比如道歉信開頭先誇自己一大段,比如公開發佈的內容充滿低級錯誤,都不是因為公關團隊不專業,而是因為老闆堅持要這麼寫。為什麼?因為老闆有自己的考量。他可能覺得認錯就是示弱,他可能擔心股價下跌,他可能想維護個人形象。這些都是人之常情,但老闆的判斷會讓公關決策偏離專業判斷。退一步講,公關團隊的本質也依然是僱員,僱員會主動跟老闆對著幹嗎?老闆要“開戰”,他們就不能“示弱”,即使明知道示弱是有利的,他們也得把想法咽進肚子裡。而且要知道,但凡一個企業到了需要危機公關的階段,老闆往往都正在氣頭上。公關團隊更不會跟氣頭上的老闆對著幹。但是,假如引入AI呢?AI不會有個人利益考量,不怕得罪老闆,可以基於資料和輿情分析給出相對客觀的建議。當然,最終決策權還是在人類手裡,但至少,AI能提供一個不受“個人算計”干擾的參考答案。所以你看,AI開始承擔責任,不是因為它取代了人類的智慧,而是因為它補上了人類決策中最容易出問題的那一環——人的因素。在很多場景中,人既是決策者,也是干擾源。我們有情緒,有利益,有關係網,有各種顧慮。這些都是人性,但它們會讓決策偏離最優解。AI的“不近人情”,恰恰讓它能做出那些“應該做但人類不敢做”的決策。當然,這不意味著AI就能完全替代人類。畢竟,責任這個東西,從來都不只是做決策那麼簡單,它還包括承擔後果、接受問責、做出調整。這些,目前的AI還做不到。但至少,AI在責任維度上的演化也許已經開始了。從只提供能力到開始承擔責任,這可能是AI融入人類社會的下一個關鍵節點。(羅輯思維)
螞蟻下場搶奪AI超級入口:全模態通用AI助手“靈光”正式上線,30秒即可生成應用
"靈光"首批上線三大功能:靈光對話、靈光閃應用和靈光開眼,支援3D、音視訊、圖表、動畫、地圖等全模態資訊輸出。"閃應用"功能將AI助手從單純的對話工具升級為應用生成平台,分析認為,"閃應用"理念與支付寶生態的結合,是螞蟻佈局AI入口的關鍵策略。螞蟻集團正式進軍AI助手賽道,推出全模態通用AI助手"靈光",主打30秒生成應用的差異化功能,試圖在日益激烈的AI入口爭奪戰中佔據一席之地。周二,螞蟻集團正式發佈"靈光"AI助手,該產品已同步登陸Android與蘋果應用程式商店。這是業內首個全程式碼生成多模態內容的AI助手,支援3D、音視訊、圖表、動畫、地圖等全模態資訊輸出。"靈光"最大的特色在於"閃應用"功能,使用者通過一句話描述需求,系統最快30秒、最長1分鐘內即可生成一款可編輯、可互動、可分享的小應用。這一功能將AI助手從單純的對話工具升級為應用生成平台。該產品的推出顯示阿里系正全面押注AI應用入口爭奪,而"閃應用"理念與支付寶生態的結合,可能為螞蟻在AI商業化探索中開闢新路徑。三大核心功能突破傳統對話模式"靈光"首批上線三大功能:靈光對話、靈光閃應用和靈光開眼。"靈光對話"突破傳統文字問答模式,採用結構化思維設計每次對話,讓AI回答邏輯清晰、表達簡練。系統不是簡單堆砌文字,而是通過生成動態3D模型、可互動地圖、音視訊等可視化內容,配合優質的資訊組織方式,提升使用者理解效率。"靈光閃應用"允許使用者在對話中說出或輸入一句話,系統即可生成AI應用。無論是健身計畫工具還是旅行規劃器,均可實現參數自訂和即時分享。"靈光開眼"功能搭載AGI相機技術,通過即時視訊流解析實現對物理世界的觀察和理解,支援文生圖、文生視訊、圖生圖、圖生視訊等多種創作模式。使用者上傳蔬菜圖片,系統即可生成不同菜譜。結構化呈現提升資訊密度支付寶生態賦能應用生成為"靈光"的核心差異化在於資訊呈現方式。系統在回答時自動進行排版設計,使內容呈現高度結構化。在日常回答中,系統可在保持快速響應速度的同時,直接生成可互動的圖表。這種"帶著排版回答"的方式,改變了傳統AI助手純文字輸出的侷限。分析認為,"閃應用"理念與支付寶生態的結合,是螞蟻佈局AI入口的關鍵策略。支付寶作為超級應用,已擁有龐大的小程序生態和支付體系。AI生成的應用如能無縫接入支付寶生態,將為使用者提供從需求表達到應用生成、再到服務交易的完整閉環。這一模式可能為螞蟻在AI商業化探索中創造差異化競爭優勢。 (硬AI)
接招吧,GPT-5.1!
【新智元導讀】開源對攻ChatGPT!今天,公開叫板ChatGPT的中國AI,刷屏了!它就是阿里官方認定的最強大模型AI助手——千問APP。全新升級的千問APP主推:三大功能:對話問答、智能寫作和全能相機;四大特色:回答聰明、模型先進、文采出眾、識別全面。那麼問題來了,它到底有什麼底氣要和ChatGPT全面競爭?來一波實測,看看是騾子還是馬吧。來自ChatGPT的肯定先讓千問解答心中的疑問🤔:「千問有什麼底氣要和ChatGPT全面競爭?」千問速度相當快,馬上總結了它的5大底氣:1. 技術底子硬:Qwen3-Max模型性能全球頂尖特別是,多輪對話響應速度比 GPT-5 快17%,中文理解(比如古詩詞、方言)精準率更高。2. 開源+閉源雙軌戰略:生態與核心兩手抓這意味著:千問既能快速迭代、本土化適配強,又能守住商業護城河。3. 深度繫結中國場景,這是ChatGPT永遠做不到的深度融合阿里生態, 可識別88種電商場景;未來還會整合外賣、訂票、辦公、健康……4. 算力自主 + 巨額投入:不靠Azure,自己建「AI電廠」阿里宣佈3800億元投入AI基礎設施,其中超六成用於建設亞洲最大智算中心。5. 最重要的是:它想做你的「AI夥伴」,不只是工具千問新上線的Chat Memory(長記憶)功能,能記住你是誰、你在做什麼、你上次提到的需求。最後,千問總結了「技術、生態、場景、資料、記憶」五大buff,還拉黃仁勳背書:現在問題來了:千問到底有沒有幻覺?特別是,引用黃仁勳的「Qwen已成為矽谷的根基」,聽起來怎麼像高考作文中的「魯迅說過……」?黃仁勳的確誇過「千問」(Qwen)是最好的開源模型之一:而且,千問的實力得到了「全面競爭對手」ChatGPT的肯定——面對相同的問題,GPT-5.1查詢網際網路資訊後,表示千問有三大底氣:1. 模型與技術基礎強大:從技術能力角度來看,它有「可與ChatGPT一較」的潛在基礎。2. 生態+場景整合優勢:從「從技術+平台」維度來看,它具備整合「AI助手+生活/工作場景」的潛力。3. 市場/政策/本地化優勢(特別在中國市場):從商業化/使用者獲取/本地化角度也有一定優勢。總體上ChatGPT認為千問是個「強有力的追趕者」+「本地化最佳化的競爭者」:在最新模型上,Qwen和GPT系列孰強孰弱?由於千問、GPT-5.1發佈時間極新,尚無第三方權威機構完成全面橫向評測。直接問千問:尋找「千問與 GPT 5.1」 在具體任務(比如長文字理解、多模態、程式碼生成)上的對比評測,讓我們一起看其優劣差距在上下文理解與處理、多模態能力和程式碼生成與程式設計能力上,千問做了一單比較:輸入相同的提示詞,GPT-5.1承認,千問本地化優勢明顯:⚠️注意:以上內容由AI生成,僅供參考。莫道此才今始盛剛剛,Qwen宣佈有1千萬使用者和Qwen Chat對過話:那就以此為題,讓千問作首古詩吧:為下列主題寫一首李白風格的、充滿想像力的古詩: 1000,0000使用者正在使用Qwen Chat進行創作——而這只是一個開始。換成李白的《登金陵鳳凰台》,也沒問題:《登雲台詠千問》鳳凰台上鳳凰游, 萬智雲中萬智流。舊時程式碼埋幽徑, 今日文章耀鬥牛。三山半落青天外, 一網遙連碧海秋。不見算樞吞曉月, 長隨使用者寫神州。模仿現代作家,千問也可以:以「王小波 / 村上春樹 / 卡爾維諾 / 莫言」的寫作風格, 圍繞「AI日新月異」寫一段 500 字的短文,並標註你模仿的風格特徵。開頭就很「科幻」:今天早上,我的AI助手突然開始寫詩,用的是我奶奶醃酸菜的配方格式:“三斤白菜,兩勺鹽,一縷月光,半顆悔恨的心。”它說這是“後人類抒情主義”。我坐在廚房裡啃著冷饅頭,窗外一隻黑貓正和掃地機器人對峙——那貓眼神憂鬱得像村上筆下丟了女友的調酒師,而機器人固執地繞圈,彷彿卡爾維諾筆下那個永遠在螺旋樓梯上找出口的子爵。對「AI日新月異」描寫,非常到位:AI日新月異,快得讓我懷疑昨天它還在背《唐詩三百首》,今天就偷偷讀完了莫言的高粱地,並在我的夢境資料庫裡種了一片血紅的高粱。它甚至學會了用高密東北鄉的腔調說:“俺覺得,人類的情感就像發霉的豆瓣醬——又臭又複雜,但沒它,飯不香。”全文混合了王小波的黑色幽默、村上春樹日常中的超現實、卡爾維諾的概念遊戲、莫言的鄉土魔幻……這是一篇用文學對抗演算法的微型宣言。它證明:即便在AI日新月異的時代,人類仍可通過雜糅、反諷與感官記憶,守住敘事的主權。風格不是裝飾,而是思想的鎧甲——而這副鎧甲,由王小波的匕首、村上的雨衣、卡爾維諾的羽毛和莫言的高粱共同鍛造而成。以上評論,也是千問生成的。隨手一拍認出連始祖鳥化石打開千問APP隨手拍張照,就能呼叫Qwen模型家族強大的多模態能力。比如,拍一下桌面上的書,讓它總結一下書中的要點。隨手扔給它一張圖片,它不僅很快找出了圖片的位置,甚至還順帶給出了遊覽攻略。一眼認出「始祖鳥(Archaeopteryx)」化石:最後,讓千問生成一張有故事感的時尚海報:Vibe Coding 3D地球、五子棋……千問的桌面應用端上有專門的程式碼模式,選中後官方會給出很多實用的小例子,非常方便大家上手試玩。首先,我們讓它生成一個3D地球。千問生成的這個地球不僅效果逼真,還可以用滑鼠隨意拖動。除了這種3D模型,千問提供了非常多的知識類程式設計小應用,簡直就像個學習小幫手。比如,coding出一個古詩排序的小應用,通過遊戲學習詩詞知識。數學當然也沒問題,尤其適合那些數形結合的問題,更加的直觀,方便理解。比如,下邊這個「一次函數可視化」應用,通過調節k和b,一眼就能看出對函數圖像的改變。最後,我們讓千問生成一個遊戲。我們直接讓千問生成一個難點的——五子棋,看它能完成的怎麼樣。結果,依然可以一次完成! (新智元)
AI戰略驅動估值重構,阿里股價年內飆升90%,螞蟻“靈光”與千問共拓生態
11月18日,螞蟻集團正式推出全模態通用AI助手“靈光”,支援使用者通過自然語言在30秒內生成可互動、可分享的輕應用(如健身計畫器、旅行規劃工具等),並實現3D模型、動態圖表等多模態內容的程式碼級生成。此舉標誌著螞蟻在AGI(通用人工智慧)場景化落地方面取得關鍵突破。而就昨天,阿里巴巴正式宣佈“千問”項目,全力進軍AI to C市場。當天,千問APP公測版上線,基於全球性能第一的開源模型Qwen3,憑藉免費以及與各類生活場景生態的結合,與ChatGPT展開全面競爭。此前,阿里CEO吳泳銘強調,將投入3800億元資本開支推進AI基建,目標實現超級人工智慧(ASI)。資本市場對阿里系AI佈局反應強烈:截至11月17日,阿里巴巴港股(09988.HK)年內漲幅已超90%,創下2021年8月以來新高。機構普遍認為,AI戰略正推動阿里從“電商估值邏輯”向“AI+雲估值邏輯”切換。南向資金持續加倉,9月單月淨買入阿里港股達757億港元,為騰訊的10倍。景林資產、ARK Invest(木頭姐)、貝萊德等全球頂級機構均在2025年大幅增持,看好其全端AI能力與商業化前景。“靈光對話”突破傳統文字問答模式,不是堆砌文字,而是像策展一樣設計每次對話:通過結構化思維讓AI回答邏輯清晰、表達簡練;通過生成可視化內容,如動態3D模型、可互動地圖、音視訊等,讓內容呈現更生動;最終以優質的資訊組織方式,讓使用者“秒懂”知識。這種兼具邏輯張力和資訊美感的設計,也體現了靈光的產品理念:讓複雜變簡單。比如在教育場景下,使用者諮詢靈光知識性問題,靈光能夠洞察並提煉知識點,有邏輯有層次地展示,並能生成3D實物動圖、可互動的示意表格等,讓複雜資訊一目瞭然。(圖說:靈光對話介面呈現極簡風格,同時又提供多元的資訊展示形式)這種可秒級生成、又極簡多元的可互動回答,背後是靈光實現了基於全程式碼生成的多模態輸出能力,所有呈現的結果,包括圖表、動畫,小應用等元件,都是由模型根據對話情境即時生成並呈現給使用者。同時,靈光建構了多智能體協作的Agentic 架構,能夠動態調度圖像、3D、動畫等專用 Agent 與工具,即時協作,為使用者提供更完整、更豐富、更沉浸的檢視體驗。值得一提的是,靈光開創性地面向普通使用者推出了“閃應用”功能。使用者在對話中說出或輸入一句話,靈光1分鐘以內、最快30秒就能生成一款AI應用。無論是健身計畫工具、旅行規劃器還是健康食譜生成器,均可實現一句話生成、參數自訂、即用即分享。這種快速生成日常生活小應用的功能,讓普通人也能零門檻享受AI Coding帶來的生產力變革。如使用者諮詢“溏心蛋要煮多久?”靈光可生成一個“溏心蛋時間計算器,使用者根據實際情況自己選擇“雞蛋大小”“要求的熟度”等條件,自己調整出一個最符合自己情況的答案;使用者想知道怎樣養車最划算,靈光可以生成一個“養車成本計算器”,使用者自由選擇里程、油費等,組合出極具個性化的養車方案。(圖說:靈光對話可喚起閃應用,最快30秒生成日常生活小應用)值得一提的是,靈光生成的閃應用不只是靜態前端頁面,而是可以直接呼叫大模型等後端能力,讓應用不僅能展示結果,更能即時與外部進行互動,顯著拓寬可實現的場景邊界。作為一款全模態通用AI助手,“靈光開眼”功能搭載了AGI相機技術,通過即時視訊流解析實現對物理世界的觀察和理解,並支援文生圖/視訊、圖生圖/視訊等多種創作模式。比如,在旅遊場景下,使用者用靈光對準想瞭解的建築,靈光可以即時“看見”並講解。作為螞蟻集團AGI(通用人工智慧)戰略的產品級探索,靈光精準把握2025年AI應用市場向場景化生產力工具轉型的趨勢,其核心理念“讓複雜變簡單”,通過將應用開發嵌入日常對話,重新定義了通用型AI助手的生產力邊界。據悉,螞蟻集團2025年以來加速AGI佈局,已發佈AI醫療管家AQ、佈局具身智能靈波科技,螞蟻百靈大模型也躋身了兆參數模型陣營。靈光的推出,進一步展現了螞蟻在通用人工智慧領域從技術突破到場景落地的全鏈路能力。 (證券之星)
AI智能體的夢想與現實
你是否也曾幻想過,能擁有一個像鋼鐵人的“賈維斯”那樣的AI助手?它聰明、可靠,能打理工作、安排生活,甚至讀懂你的心思——動動嘴皮子,一切就已安排妥當。  這樣的場景曾只屬於科幻電影,而今天,它正以“AI智能體(AI Agent)”之名,快步走向我們的現實。科技公司紛紛投入重金,工程師們不斷突破技術邊界,AI智能體已從概念逐步落地:它們能編寫程式碼、訂餐廳、做調研,甚至替代部分人類工作。  然而,夢想的光芒之下,挑戰與疑問也從未停止:  - 當前的AI智能體,到底做到了多少?做不到的又是為什麼?  - 它真能成為每個人的全能助手,還是僅停留在“看起來很美”的階段?  - 背後的環境成本、安全風險與社會影響,我們又是否準備好了面對?  我們不僅關注AI“能做什麼”,也更關心它“該做什麼”;不僅看到進步,也直視侷限。這是一段關於技術創新、人類願景與現實約束的故事——而它,才剛剛開始。AI 智能體(AI Agent)仍是“科幻”?還沒到火候,但它們正飛速進步這一切是如何開始的這一切都始於賈維斯(J.A.R.V.I.S.)。沒錯,就是漫威電影裡的那個賈維斯。  當然,真正的起點或許並非鋼鐵人的AI助手,但這個虛構系統的確極大地推動了AI智能體(AI Agent)概念的普及。每當我採訪AI行業的從業者關於智能體技術時,他們總會以賈維斯為例,描述理想中的AI工具該有的樣子:它能在你開口之前就明白你的需求,能分析海量資料並提煉洞察,還能提供戰略建議或替你打理部分業務。雖然人們對AI智能體的精確定義仍有分歧,但其核心在於,它超越了傳統聊天機器人——這是一種能夠替你執行多步驟複雜任務的系統,無需與你反覆溝通。它會自動生成一張“待辦清單”,通過完成子任務來實現你設定的最終目標。這一幻想在許多方面已接近現實,但對普通使用者的實際用途而言,目前仍存在大量缺陷——甚至有些問題可能永遠無法解決。  “AI智能體”這一術語早已存在,但它在科技行業的走紅尤其始於2023年。那一年是AI智能體的“概念之年”:人人都在討論它,試圖理解其內涵並探索落地路徑,但成功的用例寥寥無幾。到了2024年,行業進入了“部署之年”:人們開始將程式碼真正投入實踐,檢驗其能力(而當時的答案是……效果有限,且充滿了錯誤提示)。  AI智能體的熱潮,我認為可以追溯到一個具體事件:2024年2月,金融科技公司Klarna宣佈,其基於OpenAI技術的AI助手在上線一個月後,成功完成了相當於700名全職客服的工作量,並自動化處理了公司三分之二的客服聊天。此後數月,幾乎我參與的每一場AI行業討論,都繞不開這組資料。  熱潮並未消退。隨後的幾個月裡,幾乎所有科技巨頭的CEO都在財報電話會議上反覆強調這一概念。亞馬遜、Meta、Google、微軟等眾多公司的高管開始公開表態,承諾打造實用且成功的AI智能體,並投入真金白銀將其實現。發展現狀如何最初的願景是,有朝一日,AI智能體將能包辦一切:從為你預訂行程,到生成商業演示的視覺素材。理想中的工具甚至能根據你和朋友的日程安排、飲食偏好和禁忌,找到一個合適的聚會時間和地點——然後自動預訂餐廳並為所有人建立日曆日程。  現在來聊聊“AI程式設計”這件事:多年來,AI程式設計一直是整個智能體行業的支柱。如果你問任何人,目前(而非遙遠未來)現實生活中存在那些成功、不令人反感的AI智能體應用案例,他們幾乎只能舉出AI程式設計這唯一一個具體的例子。許多工程師都在用AI智能體輔助程式設計,而且普遍認為它們確實做得不錯。事實上,在微軟和Google,高達30%的程式碼現已由AI智能體編寫。對於OpenAI和Anthropic這樣資金消耗巨大的初創企業而言,面向企業客戶的AI程式設計工具更是它們最重要的收入來源之一。  因此直到最近,AI程式設計仍是AI智能體在現實中最主要的應用場景。但這顯然並未惠及普通消費者。別忘了,最初的願景始終是打造一個面向“普通人”的全能型AI智能體。我們尚未完全實現這一目標——但到了2025年,我們比以往任何時候都更接近它。  去年十月,Anthropic率先推出了“電腦使用(Computer Use)”功能,使Claude能夠像人類一樣操作電腦:瀏覽網頁、執行搜尋、訪問不同平台並代替使用者完成複雜任務。業界普遍認為這是一次技術飛躍,但實際評測發現,其表現仍遠未達到理想狀態。時間跳到2025年1月,OpenAI發佈了同類產品Operator,並將其宣傳為一款能填表、買菜、訂行程甚至製作表情包的工具。然而實際使用中,許多使用者反饋該工具運行緩慢、漏洞頻出且效率不穩定。但這無疑仍是重要的一步。緊接著二月,OpenAI又推出了“深度研究(Deep Research)”,這款智能體工具能為使用者編譯任何主題的長篇研究報告,進一步推動了技術發展。有人調侃這些報告只是“篇幅驚人而非內容出色”,但也有不少人對其能力深感震撼。到了七月,OpenAI將“深度研究”和Operator整合為一款產品:ChatGPT智能體(ChatGPT Agent)。它比之前大多數面向消費者的AI智能體工具更強嗎?毫無疑問。但它在實際應用中是否依然難稱完美?同樣毫無疑問。未來之路在何方要實現理想中AI智能體的願景,仍有很長的路要走;但從技術角度看,我們已站在了離夢想最近的起點。正因如此,科技公司正持續加大投入,通過增強算力、研發和人才儲備,全力推進智能體AI的發展。Google最近就聘用了Windsurf公司的CEO、聯合創始人及部分研發團隊成員,專門助力其AI智能體項目的推進。而Anthropic、OpenAI等企業也正你追我趕,一步步為智能體增加新功能,爭相將產品交到普通使用者手中(例如,Anthropic剛剛發佈了Claude的Chrome擴展程序,使其可在瀏覽器中直接操作)。  接下來,我們很可能會看到AI程式設計能力持續提升(遺憾的是,這可能將替代許多初級軟體工程師的崗位)。面向消費者的智能體產品也會逐步改進——過程或許緩慢,但趨勢確定。同時,企業和政府場景中的智能體應用將日益增多,尤其是在Anthropic、OpenAI和xAI等公司近幾個月相繼推出面向政府的AI平台之後。  總體來看,隨著AI智能體競爭加劇(以及熱度持續攀升),我們可以預期會出現更多試錯、起落、併購與整合。在這個過程中,我們都需要反覆思考一個問題:我們究竟希望概念中的“AI智能體”能為我們做什麼?是只替代繁瑣的事務性工作,還是連更具人情味的個人事務也交給它——比如幫你寫婚禮祝酒詞,或為送花附上一段溫馨留言?而在處理流程性任務與私人化事務之間,它們目前的表現又如何?(最後一個問題的答案是:現在還遠遠不夠好。)還有一點不容忽視除了AI(尤其是為智能體提供支援的大模型)所帶來的驚人環境代價之外,還有一個我們無法迴避的“房間裡的大象”。那就是:“能為你做任何事的更智能AI”未必總是好事——尤其當有人想用它來做壞事的時候,比如製造化學、生物、放射性和核武器(CBRN)。頂尖AI公司都表示,它們對此類風險越來越擔憂(當然,這種擔憂尚未讓它們停下發展的腳步)。  再來談談監管問題。許多人對AI可能帶來的影響心存恐懼,但大多數人並未充分意識到,這些“極度樂於助人、力求討好使用者”的AI智能體若落入惡意行為者手中(無論是國內還是國外),會帶來怎樣的潛在危險(例如“情緒駭客”、浪漫騙局等等)。AI公司聲稱,憑藉自願實施的安全防護措施,它們已領先於風險。但更多人認為,這個問題可能需要外部力量的徹底審視與監管。 (WhaleThinking)