#io
巴倫周刊—OpenAI聯手蘋果傳奇設計師造AI硬體:能復刻iPhone奇蹟嗎?
資金雄厚且聲名顯赫的合作往往以失敗告終,蘋果前員工的創業成功率也不高。周三,OpenAI首席執行官山姆·奧特曼(Sam Altman)宣佈,該公司將收購由蘋果前首席設計師喬尼·艾夫(JonyIve)創立的初創公司“io”。這場併購將頂尖AI公司與全球頂級設計師組成的硬體團隊結合,目標是:為AI時代打造一款全新裝置。這項合併消息迅速引發了關於「智慧手機終結」的討論,蘋果股價周三收盤下跌2.3%。 (截至周四盤中交易,蘋果股價持平。)然而,投資者應退一步,回顧歷史。資金雄厚且聲名顯赫的合作往往以失敗告終。而且,除了少數例外,從蘋果離職的員工在離開後並沒有出色的成功案例。艾夫於2019年離開蘋果,創立了自己的設計公司LoveForm。LoveForm的所有作品都屬於超豪華等級。到目前為止,其產品設計包括起價2,000美元的夾克、6萬美元的限量版唱片機,以及為法拉利訂製設計。LoveForm還為英國國王查爾斯設計了徽標和徽章,並與愛彼迎(Airbnb)建立了合作關係。在此次交易中,OpenAI並未收購LoveForm主體,而是其分拆出的硬體團隊io——由艾夫與三位蘋果前員工領導,專注於軟硬體整合產品開發。目前,他們的新裝置將以何種形式出現仍是個謎,但io確實已存在原型機。艾夫在聲明影片中表示:“我們一直在研發的第一個產品,我認為它完全激發了我們的想像力。”“有一天喬尼打電話來說'這是我們團隊有史以來最出色的作品',”不以溫和推銷著稱的奧特曼在視頻中高調表示,“喬尼最近第一次給了我一個裝置原型帶回家體驗,我覺得這是全世界前所未見的最酷的技術產品。”兩人並未透露更多關於該產品外觀或功能的細節。我們可以進行一些猜測,猜所謂"AI裝置"可能是取代智慧手機的下一代終端。Meta、Alphabet以及Snap都在研髮帶有增強現實鏡片並支援語音指令的眼鏡。Meta和Snap已經推出了功能有限的同類產品。 Google則在其I/O開發者大會上,首次展示了實驗版AI眼鏡,雖然現場示範中出現了不少Bug。蘋果的版本則類似於Vision Pro,但價格和體積都大大降低。事實上,蘋果深知AI對其硬體構成的威脅。本月初,蘋果高層艾迪庫(Eddy Cue)在Google反壟斷審判中作證時表示,由於AI的發展,“10年內你可能就不再需要iPhone了。”然而到目前為止,AI硬體普遍表現不佳。在該領域中的一個嘗試——Humane AI Pin,已經宣告失敗。Humane由兩名前蘋果員工於2018年創立,並獲得了微軟、軟銀、高通、Tiger Global、Salesforce創始人馬克·貝尼奧夫( Marc Benioff)、LG以及奧特曼本人的投資。2024年推出的這款穿戴裝置透過語音指令操作,將大部分功能解除安裝到雲端AI處理。但知名產品測評人馬克斯布朗利(Marques Brownlee)稱其為"迄今最差產品",並且已經因技術缺陷被召回並停產。艾夫和奧特曼無疑清楚Humane的失敗,他們可能正研發一種並非眼鏡或別針的新形態裝置,但他們將面臨同樣的一系列挑戰,至少在初期,AI功能必須基於雲端,這意味著裝置在離線時將停止工作,即使連接到網絡也可能出現延遲。AI硬體廠商常常鼓吹:我們花了太多時間低頭看手機,而沒有融入周圍環境,我們需要從螢幕中解放出來。但銀幕之所以有黏性是有原因的:使用者可以快速瀏覽郵件、簡訊和亞馬遜購物車;它們能即時播放孩子最新的搞怪影片;還能充分展現TikTok和Instagram的魅力。沒有螢幕,奧特曼和艾夫的產品就需要不同的使用者介面。它會不得不是非圖形化的,就像智慧眼鏡上的語音功能和失敗的AI Pin一樣。奧特曼和艾夫有可能拿出完全不同的東西,但目前,無人知曉。奧特曼和艾夫的視頻結尾說:“我們期待明年分享我們的工作成果。”當然,「工作成果」不一定就是產品,到那時,AI領域可能已經徹底改變。 (Barrons巴倫)
不到1個月,豪擲100億美元!OpenAI掀起了一場新的AI範式遷移
突然之間,OpenAI就開始了“買買買”模式。5月6日,據彭博社等多家外媒報導,OpenAI已同意斥資約30億美元收購Windsurf,成為公司成立以來最大規模的收購。不到一個月,這個記錄再次被刷新。美國當地時間5月21日,OpenAI又在官網宣佈,將以65億美元收購前蘋果首席設計師喬納森·艾維(Jony Ive)創辦的AI硬體初創公司io。也就是說,在短短1個月的時間裡,OpenAI就花了接近100億美元。又是收購AI程式設計公司,又是收購AI硬體公司,OpenAI正在急切擴張自身的業務版圖。這背後隱藏著AI行業的一個重大變化:在模型迭代放緩的當下,大模型的競爭正在從單點模型能力,走向“全端式服務體系”。/ 01 / “最強模型”不再是唯一終點當模型能力逐漸逼近一個“體驗上限”,使用者和企業的需求正在開始發生變化:光有一個聰明的大腦不夠,AI需要被塞進真正“能做事的身體”和“能理解人類的介面”。這也解釋了OpenAI最近的兩筆收購:Windsurf,這家最初名為 Codeium。最初是一家ToB的GPU虛擬化平台,後來轉型AI程式設計賽道,並很快在AI 輔助程式設計領域嶄露頭角。簡單來說,Windsurf(原Codeium)是一個AI程式設計平台,提供了Supercomplete(AI程式碼自動補全)和Cascade(工作流自動化)等產品。據報導,Windsurf 已吸引了超過80萬開發者使用者,並擁有約1000家企業客戶。今年4月,公司ARR收入約為1億美元,相比一月份的4000萬,收入翻倍。而在本輪籌集超過2.43億美元的資金後,Windsurf的估值達到了28.5億美元。OpenAI之所以收購Windsurf,主要看重兩個方面:一是AI程式設計已經成為AI應用最重要的場景之一。相較於GitHub Copilot 和 Claude,OpenAI在這個場景缺乏足夠的控制力。核心場景的缺位,是OpenAI不能接受的。二是Windsurf 不僅擁有產品,還有資料(數百萬開發者使用的資料習慣、反饋、程式碼流),這對訓練更優秀的程式設計模型極為關鍵。OpenAI收購Windsurf的本質,是在買“AI寫程式碼的使用路徑”和“使用者行為資料”。比起Windsurf,OpenAI收購io目的就好理解得多——不是買硬體,是要接管“人機互動入口”。io由蘋果前首席設計官Jony Ive創辦,還未發佈任何產品,但其目標是打造一種“螢幕之後的AI裝置形態”。據說,io的第一款產品將在2026年發佈。雖然現在ChatGPT很成功,但仍然有一個問題始終沒有得到解決:AI產品缺乏“自然入口”。正如The Browser Company 的創始人 Josh Miller 在其 AI 瀏覽器產品 Dia 的開發歷程時寫道:Chat 實際上是一個絕佳的介面,並非權宜之計。具體來說,大部分AI產品,不是自然場景下的剛需,使用者必須主動思考“我要用AI”,打開一個獨立頁面或工具(比如ChatGPT、Claude、Notion AI),這本身就是一種強行為切換成本。這意味著,未來AI需要從“目標觸發”轉向“場景嵌入”。而硬體之所以能成為天然的入口,因為它控制了人類行為的起點,天然承載“零思考”的觸發方式,具備最低互動成本和最高響應能力。比如,你說一句話,AI耳機或智能穿戴裝置可以立即響應,不用打開App或輸入Prompt。在AI時代,誰擁有最自然的使用路徑,誰就能成為下一代平台。所以,從OpenAI到蘋果、Meta、Google,都不約而同地瞄準AI硬體,自然不是為了賣裝置本身,而是:“誰掌握入口,誰就掌握平台級控制權”。除了自身業務的考慮,無論是補程式設計場景,還是提前卡位AI硬體,OpenAI還有著更深層次的產業邏輯考慮。/ 02 / 大模型走向“全端戰爭”其實,加速擴張的不止OpenAI,還有Google。在正在進行的I/O大會上,Google一次性發佈了十餘款新產品,幾乎就是把能更新的全做了一遍,甚至還全面上線AI搜尋引擎。在不少人看來,這場發佈會後,Google正在重新拿回AI競爭中的領先。原因在於,Google擁有在AI領域獨一無二的佈局——領先的模型+最大的流量矩陣。對比之下,有流量的蘋果模型不斷延期,有模型的OpenAI也只跑出了ChatGPT一個入口。借用闌夕總結的一句話:全端式的服務體系,可能才是AI當下的最優解。這背後的邏輯不難理解。一方面,在模型升級的邊際收益遞減,AI全面走嚮應用的過程中,大家發現,過去錨定月活流量的玩法玩不轉了。從豆包到年後的DeepSeek再到元寶,使用者遷移一個比一個快。另一方面,單點場景的“含金量”也在下降。過去,AI產品可以憑藉某個爆款功能切入市場。但如今,客戶對AI的期望正在發生本質性轉變:他們不再滿足於“一個功能軟體”,而是希望AI能夠全面融入現有系統,自動完成更完整的任務閉環。用紅杉資本的話說,下一階段的競爭,將從“功能比拚”進入“結果交付”階段。AI應用將從“功能導向”走向“任務導向”和“流程整合”。這也就意味著,通用型AI助手的戰略價值正在上升。相較於專注單一功能的工具類產品,通用助手具備天然的橫向拓展能力——它足夠瞭解的偏好、習慣、工作語境,同時還不受場景限制,可以跨品類整合多種子能力,從而去完成更多更複雜的工作。當AI從“工具”變成“助手”,交付的是結果,爭奪的是關係。正因此,Sam Altman才會不斷強調ChatGPT的“長期記憶能力”——因為記憶構成了AI與使用者之間最核心的關係鏈。一旦這種關係形成,就意味著使用者的任務流、行為路徑和工作語境都繫結在AI之中。某種程度上說,上下文就是AI時代的人機關係鏈。AI對使用者的熟悉程度,就是AI時代的網路效應:越用越懂你,越懂你越離不開。這也是為什麼Sam Altman會認為,10億使用者比SOTA模型更有吸引力。/ 03 / 總結不到30天,花了接近100億美元,OpenAI不是簡單的業務擴張,而是一次對AI產業“重心”的重新定義:從單一追逐模型極限,轉向建構可持續交付能力、使用者關係和平台控制權。在這條全端化的戰線上,模型只是入場券,真正決定勝負的,是“誰能掌握使用者的起點,貫穿使用者的全程”。未來的AI競爭,不只是“誰更強”,而是“誰更近”、“誰更懂你”、“誰更離不開”。OpenAI已經率先出手,下注路徑、入口和閉環。而它的對手們,很快就會意識到:只有從“做AI產品”進化到“成為AI作業系統”,才有資格定義下一代科技範式。 (烏鴉智能說)
剛剛,OpenAI 官宣收購前蘋果首席設計官團隊!劇透「最酷的科技產品」
就在剛剛,OpenAI 正式官宣,將以接近 65 億美元(折合人民幣 468.16 億元)的價格收購由 OpenAI CEO Sam Altman 與前蘋果首席設計官 Jony Ive 聯合創辦的 AI 裝置初創公司 io。這筆收購將是 OpenAI 歷史上最大的一筆交易,預計在今年夏季完成,仍需獲得監管部門批准。交易完成後,OpenAI 將獲得一個由約 55 名硬體工程師、軟體開發者和製造專家組成的團隊,其中包括多位曾參與 iPhone 等標誌性產品設計的前蘋果設計師。「非常激動能夠與 Jony 合作,在我看來,他是世界上最偉大的設計師。」Altman 在社交平台上寫道,「我很興奮能嘗試創造全新一代由 AI 驅動的電腦。」Jony Ive 在 2019 年離開蘋果後創辦了設計公司 LoveFrom。據 Altman 表示,但由於意識到要開發、設計和製造一系列全新的產品,必須成立一家全新的公司。因此,一年前,Jony 與 Scott Cannon、Evans Hankey 和 Tang Tan 共同創辦了 io。在接受《紐約時報》採訪時,Ive 表示,正是對現有智慧型手機體驗的失望,促使他投身於與 Altman 的合作。「我對我們創造的這些裝置帶來的後果負有不小的責任。」Altman 在採訪中亦曾表達了類似觀點:「我對自己與科技的關係並不感到舒適。」他表示,他們的目標是通過人工智慧幫助人們在日益嘈雜的資訊環境中尋找意義。據外媒報導,io 首款產品將是一種全新形態的 AI 裝置,旨在將使用者從傳統螢幕中「解放」出來,預計將於 2026 年發佈。目前,他們正探索包括耳機、搭載攝影機的可穿戴裝置以及支援 AI 的家用裝置等多個方向。在今天的官宣視訊中,Altman 也透露「最近,Jony 給我一個原型裝置,讓我帶回家,我有機會使用它,我覺得它是世界上最酷的科技產品。」去年據紐約時報報導稱,Altman 曾與和 Ive 共進晚餐商討硬體合作事項。在米其林餐廳裡,Altman 和 Ive 探討了生成式 AI 如何推動新型計算裝置的發展。這種技術能提供超越傳統軟體的功能,例如總結和優先處理消息、識別植物等物體,甚至處理預訂旅行等複雜任務。在《紐約時報》的報導裡,提到一個值得注意的細節。據悉,在 LoveFrom 工作室裡,椅子上擺放著紙張和紙板箱,上面記錄著他們對產品的初步設想:「這款產品將利用 AI 技術,營造一種比 iPhone 更少打擾社交環境的使用體驗。」不過,Altman 和 Ive 都不認為這一新裝置會立即取代智慧型手機。「智慧型手機不會消失,就像它們沒能取代筆記型電腦一樣。」Altman 說。Ive 則補充道:「我們將以全新的方式與 AI 互動。」新硬體部門將由 OpenAI 產品副總裁 Peter Welinder 負責,他將直接向 Altman 匯報工作。未來,該團隊將繼續在舊金山 Jackson Square 的 io 總部及 OpenAI 現有辦公空間中開展工作。除了硬體方面的合作,Altman 在 OpenAI 官網的聲明中透露,LoveFrom 今後將承擔 OpenAI 及其子公司 io 在設計和創意上的更大責任。Altman 回憶說,兩人的第一次交流並非圍繞硬體展開,而是從如何改進 ChatGPT 的介面開始的。LoveFrom 將繼續獨立於 OpenAI,儘管繼續與法拉利、Airbnb 等現有客戶合作,但今後將不再接受新的大型客戶項目。而據知情人士透露,這支設計團隊將深入參與 OpenAI 幾乎所有產品線的設計,包括未來版本的 ChatGPT 應用程式、語音互動功能以及更多面向消費者的創新產品。對於未來,Ive 表示充滿期待。「我一直相信,我最重要、最有意義的工作還在前方。」他將這次合作比作蘋果 iPod 與 iPhone 問世前的那個時代,「我真的很感激,我們找到了彼此。」附 OpenAI 公開信原文:這是一個非凡的時刻。如今,電腦不僅能看見、思考、理解世界,它們的能力前所未有。儘管具備了這種前所未有的能力,我們的體驗依然受到傳統產品和介面的影響。兩年前,Jony Ive 和創意團隊 LoveFrom 悄然開始與 Sam Altman 和 OpenAI 團隊展開合作。這段建立在友誼、好奇心和共同價值觀基礎上的合作,迅速在雄心壯志中發展壯大。最初的構思和探索,逐漸演變為切實可行的設計。這些創意看起來重要而有用,它們充滿了樂觀與希望,充滿了啟發。它們讓每個人都露出了笑容,彷彿回到了那個我們慶祝人類成就的時代,感激著那些幫助我們學習、探索與創造的新工具。隨著合作的深入,我們逐漸意識到,開發、工程化並製造全新系列產品的雄心,註定需要一個全新的公司。因此,一年前,Jony 與 Scott Cannon、Evans Hankey 以及 Tang Tan 一同創立了 io。我們匯聚了最頂尖的硬體和軟體工程師、最出色的技術專家、物理學家、科學家、研究人員以及產品開發與製造領域的專家。我們中的許多人已經攜手共事了幾十年。如今,專注於開發能啟發、賦能並推動創新的產品的 io 團隊,將與 OpenAI 合併,深入合作,攜手舊金山的研究、工程與產品團隊。隨著 io 與 OpenAI 的合併,Jony 和 LoveFrom 將肩負起 OpenAI 與 io 之間深度的設計和創意責任。我們無比激動,難以言表。Sam & Jony「人工智慧是一項令人難以置信的技術,但偉大的工具需要在技術、設計以及理解人類和世界的交匯處進行工作。沒有人能像 Jony 和他的團隊一樣做到這一點;他們在每個環節投入的關懷和心血令人震撼。」—— Sam Altman「使用技術的意義可以發生深刻的變化。我希望我們能夠帶來我 30 年前第一次使用蘋果電腦時所感受到的那份喜悅、驚奇和創造力。」—— Sam Altman「我越來越感覺到,過去 30 年所學到的一切,最終都指向了這一刻。雖然我既緊張又興奮,面對即將到來的重大責任,我仍然非常感激能成為如此重要合作的一部分。Sam 和 OpenAI、io 團隊的價值觀和願景,都是一種難得的啟發。」—— Jony Ive「我想起了 30 年前我移居美國的時候。作為一名設計師,我被矽谷那種激動人心和純真樂觀的精神所吸引,想要與那些致力於創造能夠提升人類的偉大產品的人們一起合作。」—— Jony Ive (APPSO)
重磅!OpenAI聯合蘋果傳奇設計大佬Jony Ive官宣新公司「io」:劍指全新AI互動硬體
太炸裂了!半小時前OpenAI官網悄然發佈了一則重磅消息:蘋果公司的前首席設計官、設計界傳奇人物Jony Ive,將與OpenAI CEO Sam Altman深度聯手,共同打造一個名為“io”的全新公司,旨在革新我們與AI的互動方式!OpenAI官網發了一個官方的文章,還是一個大餅,沒有特別具體的內容,但是Jony Ive說了,要整合他三十年的功力搞事情,Sam 已經用上了原型機文章地址:https://openai.com/sam-and-jony/Sam和Jony在博文中是這樣說的:“這是一個非凡的時刻。電腦如今已具備視覺、思維和理解能力。” 然而,一個不容忽視的現實是:“儘管AI取得了前所未有的能力進步,我們的體驗很大程度上仍被傳統產品和介面所塑造。”新公司“io”:兩年醞釀這次合作並非一時興起。早在兩年前,Jony Ive及其創辦的創意機構LoveFrom,便已低調地開始與Sam Altman及OpenAI團隊展開合作,將初步的想法和探索孵化為具體的設計方案隨著願景的清晰,一個挑戰也隨之而來:要開發、設計並製造一個全新的產品家族,需要一個全新的公司架構。於是,一年前,Jony Ive與Scott Cannon、Evans Hankey和Tang Tan共同創立了新公司“io”。這支團隊匯聚了頂尖的軟硬體工程師、技術專家、物理學家、科學家、研究員,以及在產品開發和製造領域擁有數十年緊密合作經驗的專家強強聯合:“io”併入OpenAI,Jony Ive主導設計現在,這個專注於開發“能啟發、賦能並實現使用者潛力”產品的“io”團隊,將正式與OpenAI合併!這意味著“io”將與OpenAI在舊金山的研究、工程和產品團隊進行更深度的融合。隨著“io”併入OpenAI,Jony Ive和LoveFrom將在OpenAI及“io”的整體項目中,承擔起核心的設計和創意職責。對於這次合作,Sam Altman表示:“AI是一項令人難以置信的技術,但偉大的工具需要在技術、設計以及對人和世界的理解三者交匯處下功夫。沒有人比Jony和他的團隊更擅長此道;他們對流程中每個方面所投入的心血是超乎尋常的。” 他還補充道:“技術的意義可以發生深刻的改變。我希望我們能帶回一些我30年前初次使用蘋果電腦時感受到的那種愉悅、驚奇和創造精神。”Jony Ive也感慨萬千:“我越來越感覺到,過去30年所學的一切,都引領我來到了這一刻。雖然我對未來艱巨工作的責任感到既焦慮又興奮,但我非常感激能有機會參與到如此重要的合作中。Sam以及OpenAI和io團隊的價值觀與願景,是一種罕見的啟示。” 他回憶道:“這讓我想起了三十年前我移居美國時的情景。作為一名設計師,我被矽谷那種令人振奮且純粹的樂觀主義所吸引,渴望與那些致力於創造能提升人類福祉的卓越產品的人們合作。”AI互動的下一個十年,從“io”開始?蘋果前任設計師要革了水果的命嗎?哈哈哈,不過還是很激動的,希望這個io硬體早日推出啊,兄弟們,等著看好戲吧 (AI寒武紀)
驕傲藏不住!Google CEO劈柴哥5.20深夜開大:15項重磅炸彈,兩大Gemini前沿方向!中國隊Xreal成為GoogleXR原型機代表
台北時間5月21日凌晨1點,Google CEO Sundar Pichai 準點走進坐落於加州山景城的著名露天圓形劇場 Shoreline Amphitheatre,發表了 Google IO 2025 大會的主題演講。全程一部定影的時間, 115 分鐘,可謂是給 5.20 的深夜奉上了一場別樣的Google之聲。先說整體感受,整體上如大部分媒體所預料的:Android 已經退出焦點,AI 可以說是全部。與去年不同,今年的 IO 大會可以說主打的就是“智能代理與個性化AI”,簡單理解,就是Google開始強調大模型的行動能力與個性定製上,正如Sundar 開場總結的:我們正處於 AI 平台變革的新階段。幾十年的 AI 理論和基礎研究,正在快速走進現實,融入人們日常生活和工作中,從搜尋、助手、視訊通訊、開發者工具到應用生態,全面落地。這正是 Gemini 時代的意義所在。全程跟下來,多達 15 項重磅更新和發佈。 雖然許多有關Gemini模型、Agent、A2A 協議等其實早在一周甚至更早之前,Google已經等不及搶先發佈,但仍有許多新官宣可圈可點。比如:Gemini 2.5 Pro 新增“深度思考模式”、可主動多模態感知和響應的下一代 AI 助理 Project Astra,以及具備“教與復現”功能、可以同時管理多達 10 項任務的智能網頁任務代理 Project Mariner。再比如在全面 AI 升級上面,不得不提的Google搜尋 AI 模式、Google瀏覽器融合 Gemini 按鈕,將會化身可智能總結網頁內容、協助瀏覽的 AI 瀏覽器;還有前不久被 YC 合夥人吐槽的 Gmail 信箱的智能回覆也迎來了個性化升級。再有,就是原來的多模態工具如 Imagen 和 Veo 大升級,並上線了一款 AI 影視創作 App Flow。最後,值得一提的是,在智能眼鏡方面,Xreal 攜手 Google 打造了一款基於 Android XR 平台的智能眼鏡 Project Aura。話不多說,開始為大家獻上精彩內容。在 Google,每一天都是雙子座季節過去的半年,可以說是Google反擊 OpenAI 強有力的半年。Sundar 非常自豪地把 Gemini 最新的進展放到了演講中最開始的部分。“我聽說今天是雙子座季節的開始。我真的不太清楚這有什麼大不了的。在Google,每一天都是 Gemini 季節。”的確,自去年以來,Google已經宣佈了超過12個模型和研究突破,並行布了超過20個主要的人工智慧產品和功能。而且 Gemini 的性能也取得了階梯式變化。Sundar介紹道,“Elo分數,作為進步的一個衡量標準,自第一代 Gemini Pro以來,已經上升了超過300分,而今天的Gemini 2.5 Pro在所有類別的LM排行榜上都名列前茅。”從倉皇應戰 OpenAI 到如今的全面“屠榜”,也許感嘆一句Google:“斗宗強者,強悍如斯”也不為過。簡單幫劈柴哥秀一下 Gemini 在許多基準測試中的 Sota 成績。就以現下最火的編碼方為例。更新後的 2.5 Pro 在 Web Dev Arena 上達到了第一名,現在比之前的版本高出 142 個Elo分數。同時,它在頂級編碼平台上受到了很多歡迎,比如在 Cursor上,Gemini 是今年增長最快的模型,每分鐘產生數十萬行被接受的程式碼。甚至前不久,Gemini 完成了《精靈寶可夢藍》的通關,獲得了所有 8 個徽章,穿越勝利之路,擊敗了四天王和冠軍。劈柴哥很調皮地表示:這標誌著我們向“API(Artificial Pokémon Intelligence)”又邁進了一步。對於過去一年的成績,劈柴哥信心爆棚:“世界採用人工智慧的速度比以往任何時候都快。 去年此時,我們通過我們的產品和 API 每月處理 9.7 兆個token。  如今,這個數字是480兆。一年之內就增長了50倍。”兩個 Gemini 的前沿研究方向不過小編不慣著Google的小傲嬌情緒,還是直接奔重點要緊。Google DeepMind 宣佈在Gemini 2.5 Pro 中引入了一種新的模式——深度思考(Deep Think Mode),它將模型性能推向了極限,帶來突破性的成果,專為複雜數學、程式設計問題設計,可在回應前先考慮多種假設,而且由於 Gemini 從一開始就具有多模態的特性,所以它在主要基準測試中也表現出色。據悉深度思考模式使用了Google最新的思考和推理研究,包括平行技術等。但由於尚需前沿安全評估方面還需要得到專家反饋,所以目前只能以 API 的形勢進行定向邀測。不過一個利多大眾的消息是,輕量版 Gemini 2.5 Flash 也已面向所有 Gemini 應用使用者開放。除了“深度思考”,有關Google在模型方面的另一個前沿研究,則是世界模型。據 DeepMind 首席執行官 Demis Hassabis介紹,“我們正在努力將其擴展為一個世界模型,這是一個能夠通過模擬世界的某些方面來制定計畫和想像新體驗的模型,就像大腦所做的那樣。這是我一直以來的熱情所在。”Hassabis 表示遊戲領域是 AI 模擬世界的不錯的場景。Google正在通過開創性的工作,讓代理掌握複雜的遊戲(如圍棋和星海爭霸)來朝著這個方向邁出了一步,最近我們推出了 GE2 模型,能夠從單個圖像提示生成 3D 模擬環境,你可以與之互動。而這些能力正在 Gemini 中出現,它利用其世界知識和推理來表示自然世界中的事物。此外,Google最先進的視訊模型對直觀物理有深刻的理解,比如重力、光和材料的行為。它在跨幀保持精準性方面非常令人難以置信。即使提示變得有點創意,比如這個人是由救生圈組成的,它也知道該怎麼做。Hassabis 認為,對物理環境的理解也將對機器人技術至關重要。人工智慧系統將需要世界模型,以便在現實世界中有效地運作。因此,Google還基於 Gemini 進行了微調了一個專門的模型,讓它教機器人做有用的事情,比如抓取、遵循指令,並在飛行中調整到新任務,人類可以在 AI 沙盒中與之互動。使 Gemini 成為一個完整的世界模型,是解鎖一種新人工智慧的關鍵一步,這種人工智慧在你的日常生活中是有幫助的,它智能且理解你所處的環境,並且可以代表你在任何裝置上採取行動。“這是我們對Gemini應用程式的最終願景,將其轉變為一個通用的人工智慧助手,一個個性化的、主動的、強大的人工智慧。這是我們通往通用人工智慧道路上的一個關鍵里程碑。”在這方面, AI 助理 Project Astra 則是Google從去年開始一直在探索的項目。AI 助理 Project Astra 此前能呼叫手機攝影機識別物體,現在升級版原型還能在無需你發問的情況下,主動完成任務或指出錯誤,比如作業中發現計算錯誤便直接提醒。據悉,Google對 Astra 還升級了語音輸出,使其更加自然,加入了原生音訊,並改進了記憶並增加了電腦控制能力。關於 Astra,會上還給出了一個非常親民的用例:幫助一位美國小夥兒修理自行車。Project Mariner:智能網頁任務代理Project Mariner 是 Google 推出的 AI 代理工具,旨在幫助使用者自動化處理網頁上的多項任務,提升線上工作效率。主要功能包括:多工處理:Mariner 現在可以同時管理多達 10 項任務,幫助使用者在瀏覽網頁時實現更高效的操作 。“教與復現”功能:使用者只需演示一次任務流程,Mariner 就能學習並在未來自動執行類似任務,減少重複操作,提高工作效率。Gemini 應用中的“代理模式”:在 Gemini 應用中引入的“代理模式”允許使用者分配複雜任務給 AI 代理獨立完成,例如在 Zillow 上尋找符合特定條件的公寓列表等 。即將推出:Mariner 的實驗版本將很快向訂閱使用者開放,預計在今年夏季更廣泛地向公眾發佈 。搜尋體驗全面重塑AI 模式面向美所有使用者開放對於Google搜尋業務,會上劈柴哥宣佈推出了全新的 “AI 模式”,這是一個全新標籤頁,也是Google對傳統搜尋體驗的一次重大升級。主要亮點包括:AI 生成的搜尋摘要:AI 模式能夠為使用者提供由 AI 生成的搜尋結果摘要,幫助使用者更快速地獲取所需資訊 。更自然的互動體驗:通過引入對話式的搜尋介面,使用者可以像與助手對話一樣進行搜尋,提升使用體驗。廣泛的使用者覆蓋:AI 模式現已在美國上線,預計將逐步推廣到更多地區 。今年夏天,Google 還將在 AI Mode 中測試深度搜尋、財經/體育查詢圖表生成功能,以及購物助手等新功能。那這裡小編再劃一個重點,在搜尋體驗升級方面,Google再次強調了 Search Live 即時互動搜尋的概念。結合 Project Astra,Google推出了 Search Live,使用者可在 AI Mode 或 Lens 中,開啟“Live”模式,對準相機畫面與搜尋助手即時對話。就在上月,Google已向 Android 使用者免費開放 Gemini Live 螢幕共享功能,本月起 iOS 使用者也可免費使用。Google多模態產品:Imagen 和 Veo 大升級,影視創作工具上線這次主題演講上,Google還發佈了全新 Imagen 4,在文字生成圖像表現更佳,支援多種圖片比例匯出(正方形、橫版等)。同時,下一代 AI 視訊生成器 Veo 3,將支援視訊和音訊同時生成,Veo 2 也新增了攝影機控制、物體移除等功能。值得注意的是,Google還上線了一款名為 Flow 的 AI 影視創作應用,結合 Veo、Imagen 和 Gemini,使用者可通過文字或圖片提示生成 8 秒 AI 視訊短片,並通過內建場景編輯器拼接成更長影片。(是不是想到了快手和抖音的視訊剪輯工具~)這還沒完,作為全面手,在3D方面,Google將 Project Starline(一款 3D 視訊通話艙)正式更名為 Google Beam。Google Beam 使用一種新的視訊模型將 2D 視訊流轉換為逼真的 3D 體驗,劈柴哥 X 上表示,近乎完美的頭部跟蹤,精確到毫米,每秒 60 幀,全部即時, 最終呈現的是沉浸式對話體驗。未來,它將內建於 HP 品牌裝置中,配備光場顯示器和 6 個攝影機,即時生成通話對象的 3D 圖像,包括 Deloitte、Duolingo 和 Salesforce 在內的企業,已計畫將 Beam 部署到辦公環境中。那些已經不太新鮮的AI產品發佈當然,強如Google,同樣也免不了俗,也做到款款都是炸裂的精品。一些 AI 發佈都是市面上常見的 AI 應用。比如發佈了 Stitch,一款 UI 介面的 AI 生成工具,只需提供主題、描述,或上傳線框、草圖、UI 截圖,即可自動生成介面原型。現已上線 Google Labs。再比如購物中的 AI 試穿的功能,使用者上傳全身照後,可預覽不同上衣、褲子、裙子等穿在身上的效果,由 AI 模型精準識別人像與服飾細節。這不都是淘寶/京東玩剩下的嘛。不過還是要提醒,Google有一種玩法還挺不錯:即上文提到的 AI Mode 中購物,甚至通過 agentic checkout 功能,自動幫使用者下單。Chrome整合Gemini AI,自動更新被洩漏的密碼對於一直被傳言有被分拆危險的 Chrome 而言,Google也有了一些不錯的升級動作。從 5 月 21 日起,Google AI Pro 和 Ultra 訂閱使用者可在 Chrome 中啟用 Gemini 按鈕,智能總結網頁內容、協助瀏覽。目前支援同時管理 2 個標籤頁,年底前將擴展更多。第二塊令人叫好的則是 Chrome 將自動更新被洩露密碼。Chrome 今年內將推出新功能,檢測到密碼洩露時,自動生成強密碼並更新至支援的網站,操作前會徵求使用者確認。Gmail 智能回覆再升級以使用者個人風格回覆郵件此前,Gmail 智能回覆功能被 YC 合夥人吐槽為“無馬的馬車”,現在Google很聽勸,已經對其進行了更新。更新後,AI 將從使用者收件箱和 Google Drive 中提取資訊,自動撰寫更符合使用者個人風格的郵件內容。還能識別對話對象語氣,像給老闆郵件就自動建議更正式措辭。主打一個私人定製!新版將於 7 月在 Google Labs 登陸網頁版、iOS 和 Android。Android XR: 將 Gemini 帶入眼鏡和耳機中國隊 Xreal 展示 Project Aura 原型這次大會,有關智能眼鏡的概念研發也是一大看點。Google表示:“Android XR 的推出,讓我們向前邁出了一大步。”值得一提的是,這次居然是中國隊實力出場了!Xreal 攜手 Google 打造了 Project Aura,一款基於 Android XR 平台的智能眼鏡,預計內建 Gemini AI,具備廣視場、攝影機和麥克風。此外,Google 還將與三星、Gentle Monster、Warby Parker 合作開發其他 Android XR 智能眼鏡。這款眼鏡配備攝影機、麥克風和揚聲器,可與您的手機協同工作,無需掏口袋即可訪問應用程式。此外,可選配的內建螢幕可在需要時提供私密的實用資訊。眼鏡與 Gemini 配對後,能夠看到和聽到使用者的一舉一動,從而瞭解主人的處境,並記住其重要事項,並全天候提供幫助。今天的搶先體驗展示了 Android XR 眼鏡在實際場景中的運作方式,包括向好友傳送消息、預約、查詢路線、拍照等等。在演示中,兩人之間的即時語言翻譯,展現了這款眼鏡打破語言障礙的潛力,可以說是即時提供現實世界的字幕。AI Ultra 訂閱上線,每月250刀至於訂閱上,Google推出全新 AI Ultra 訂閱計畫,提供最高等級 AI 模型和更高使用額度,適用於 Gemini、NotebookLM、Flow 等應用,還包含 Project Mariner。寫在最後:亮點不是很多,但這不怪GoogleDeep Thinking、World Model、Action Intelligence、網頁智能體、AI瀏覽器、影視創作工具、AI Web UI、Android XR、Gemini+智能眼鏡,可以說這次大會是一個Google在全熱門賽道秀肌肉的大會。但憑個人看法而言,Google的優勢依舊是在多模態的進展上,不管是模型還是應用方面,都有不錯的性能和沉澱。而不足之處,則在於對於通用場景下的應用,明顯滯後於 OpenAI,比如 browser use 方面,將 Gemini 融入 Chrome 本可以更早一些。此外,應用的創新性沒有特別驚豔之處。通場看下來,一半以上都是已經發佈或預告過的產品。但這也不能怪Google,如果真的什麼都讓Google做了,AI創業者還有什麼機會可言呢?你說是嗎,劈柴哥?哦對了,今天晚上我們邀請了兩位技術大咖來到我們T前線的直播間一起來聊一聊今年的GoogleIO大會,這兩位大咖分別是:NETSTARS首席技術官陳斌、一汽大眾首席企業架構師武豔軍。 (51CTO技術堆疊)