#智慧眼鏡
《和亞智慧突破光學對位技術 搶進全球AR眼鏡供應鏈》今年4月掛牌興櫃的和亞智慧科技(股票代號:7825),市場傳出已接獲美系客戶國際訂單,由和亞智慧(7825)自主開發的自動化光學對位(Active Alignment, AA)系統, 為AR眼鏡實現高解析度、亮度均勻與沉浸式體驗,據悉該美系客戶已在日前發表新一代的智慧眼鏡,並計畫自2026年起,每年生產1000萬副智慧眼鏡。AR智慧眼鏡開始吹起消費市場新一波浪潮,為近期消費性電子產品上的創新突破,這類產品不僅能將虛擬影像疊加於現實世界,還結合即時互動、語音控制與環境感知功能,能為使用者帶來沉浸且直覺的數位體驗,而其中微型投影是AR眼鏡的關鍵核心技術。自動化光學對位突破 搶攻全球AR眼鏡供應鏈目前市場上的AR眼鏡多採用微型投影技術,核心在於將影像精準投射至眼前的光學模組,任何細微誤差都可能造成影像模糊、亮度不均、色彩偏差,甚至投影錯位,進而影響產品品質與使用體驗。而和亞智慧的自動化光學對位(Active Alignment, AA)解決方案,能透過多軸高精度平台與即時光學回饋演算法,主動修正組裝過程中的微小誤差,確保光源、LCOS或uLED面板與光學組件達到最佳匹配,並已累積多項發明專利,進一步鞏固了和亞智慧在 AR領域的光學檢測以及精密對位技術的技術壁壘。和亞智慧長期深耕光學、影像與AI領域已逾20年,自動化光學技術已取得多項專利,並成功應用於AR眼鏡,近期陸續接獲國際AR產品專案訂單,再次驗證其技術實力與市場信任,和亞智慧預計於2026年申請上櫃,隨著虛實融合應用生態系逐步擴展,公司在AR光學技術領域的深厚實力與持續創新,將有望在新興科技市場中扮演更加關鍵的角色。
GoogleI/O超全總結:AI搜尋大變樣,AR眼鏡復活,大模型全家桶升級,史上最貴訂閱費1800元
Google升級全系模型,展現通用AI助理終極形態。智東西5月21日報導,今日凌晨,在一年一度的GoogleI/O開發者大會上,Google的AI大戲連番上演!在長達2小時的主題演講上,GoogleCEO桑達爾·皮查伊攜一眾Google高層總共提到95次「Gemini」、92次「AI」。模型升級方面:Gemini 2.5 Pro新支援原生音訊輸出、Project Mariner的電腦使用功能、深度思考、高安全防護;視訊模型Veo 2新增原生音訊產生功能、Gemini 2.5 Flash在推理、程式設計和長上下文等關鍵指標上升級。全新發布模型包括:擴散語言模型Gemini Diffusion、視訊生成模型Veo 3、影像生成模型Imagen 4。谷歌也推出全新Gemini訂閱計畫:AI Pro用戶月付19.99美元(折合人民幣約144元),可使用Veo 2、Gemini 2.5 Pro等入門級產品;AI Ultra用戶月付249.99美元(折合人民幣約1804元),可擁有Veo 33的無限存取權模式。這都指向一個目標:建立通用AI助理。谷歌DeepMind創辦人兼CEO戴密斯‧哈薩比斯(Demis Hassabis)稱,他們將Gemini打造成一個世界模型,是開發一種新型、更通用、更有用AI助理的關鍵一步。谷歌展示了其通用AI助理的最新研究原型。在自行車維修場景中,Gemini可以幫助用戶查詢維修手冊、滾動到特定頁面、搜尋影片教學、主動提供實用信息,還可以撥打電話,查詢零件庫存情況,並幫助用戶下單。其餘更新包括顛覆用戶搜尋體驗的AI Mode:根據用戶需求動態調整包含圖表、店鋪列表等的答案生成界面,在購物場景,AI Mode可根據用戶購買意圖定制購物界面,提供虛擬試穿、追踪用戶預期價位、代理結帳功能,其還集成了視覺搜索,用戶可以通過手機攝像頭實時搜索提問。 AI Mode現已向所有美國用戶推出。同時,Google先前三大研究計畫獲得重大進展:Project Starline引進全新3D視訊通訊體驗、Project Astra能利用Gemini和攝影機來解決問題、Project Marina支援多工處理。大會尾聲,谷歌也現場示範了重量級安卓XR智慧眼鏡。翻譯能力是這款眼鏡的亮點之一,不過測試時,可以明顯感覺到工作人員減慢了語速,谷歌安卓XR智能眼鏡僅正確翻譯了對話中的前半部分,之後出現了無法識別的問題。根據XREAL新聞稿披露,Google將與XREAL合作打造第二款安卓XR裝置Project Aura。皮查伊透露,Gemini應用程式目前已經擁有超過4億月活用戶,超過700萬名開發者透過Gemini API進行開發。谷歌今天放出的諸多AI大招,智東西帶你一文看盡。01.Gemini系列模型屠榜谷歌產品每月處理token數一年增長50倍Gemini時代,Google的模型和產品發布速度都比以往更快。上屆I/O大會至今,Google已經宣布10餘款模型重大突破、20餘款重大AI產品。自第一代Gemini模型發布以來,Gemini模型的Elo分數已提升300多分。程式設計方面,Gemini 2.5 Pro成為程式設計平台Cursor上年度成長最快的模型,每分鐘產出數十萬行被採納的程式碼。在LMArena排行榜中,Gemini系列模型包辦了每秒產生輸出token數最高的前三名,且模型價格也在下降。在全端基礎設施方面,Google第七代TPU Ironwood是首款專為大規模AI思考和推理工作負載而設計的TPU,其效能是上一代的10倍,每個Pod的運算能力達到42.5 exaFLOPS。皮查伊提到谷歌大模型相關的幾組數據:去年同期Google每月透過產品和API處理的token數量為9.7兆,目前其每月處理的token數達到480兆,一年內增長了約50倍;超過700萬名開發者透過Gemini API進行開發,涵蓋GoogleAI Studio和Vertex AI兩大平台,較去年同期成長超過五倍,同時Vertex AI平台上的Gemini使用率較去年成長40倍;Gemini應用程式目前擁有超過4億月活用戶,在Gemini應用程式中使用2.5 Pro版本的用戶使用量成長了45%;在搜尋方面,AI概覽功能的每月用戶超15億。皮查伊認為AI Mode是搜尋領域的下一個重大進展,我們正處於AI平台轉型的新階段。皮查伊也提到,Gemini已經通關精靈寶可夢,集齊8枚徽章獲得冠軍,「距離人工寶可夢智慧更進一步」。02.Gemini程式設計、語音、深度思考迎升級DeepMind CEO揭秘終極願景哈薩比斯提到,Gemini 2.5 Pro是Google迄今為止最聰明的模型,也是全球最強大的基礎模型。兩周前,Google發布了Gemini 2.5 Pro的預覽版,開發者用它實現了許多創意:例如將草圖轉化為互動應用、模擬完整3D城市等。新版的Gemini 2.5 Pro在WebDev Arena程式設計排行榜登頂。谷歌也將他們去年發布的LearnLM(專為學習場景微調的模型)連接到Gemini 2.5 Pro模型,讓後者在解題等學習場景的能力進一步提升。今天谷歌推出了輕量級車型Gemini 2.5 Flash的升級版。這款模型在推理、程式設計和長上下文等關鍵指標上實現提升,在大模型競技場的排名僅次於Gemini 2.5 Pro。升級版模型將於6月初全面開放,Pro版本隨後跟進,目前開發者已經可以在AI Studio搶先體驗。Gemini也引進了更多的功能。增強版安全防護的可抵禦間接提示注入攻擊;思維摘要功能將模型思考過程可視化,便於調試;Gemini 2.5 Pro即將新增「思考預算」控件,開發者可控制模型思考的長度,從而平衡品質與成本。Gemini 2.5 Pro和Gemini 2.5 Flash的文字轉語音功能支援多角色對話,可實現語調微妙變化、切換耳語模式、跨24種語言切換。谷歌Gemini產品負責人Tulsee Doshi展現了Gemini 2.5 Pro的程式設計能力。現場,Gemini 2.5 Pro僅參考一張草圖就產生了完整的3D互動網頁,用時37秒就在原始網頁程式碼上完成修改。Gemini 2.5 Pro現已在多款AI IDE平台(如Cursor等)中可用。谷歌昨天開啟公測的程式助理Jules也接入了Gemini 2.5 Pro,能獨立處理GitHub程式碼庫的複雜任務,將原本耗時數小時的工作縮短至分鐘級。▲谷歌Jules用戶介面在模型架構創新方面,Google將擴散模型技術應用於文字生成。全新的Gemini Diffusion實驗模型(擴散語言模型)的產生速度比Gemini 2.5 Flash快5倍。這款模型不僅能依序從左到右產生內容,還可以產生過程中快速迭代解決方案,並在生成過程中進行錯誤修正。Google打造了Gemini 2.5的「深度思考(Deep Think)」模式,運用類AlphaGo的平行推理技術。這一模式已經在美國數學奧林匹克2025測試和Live Codebench編程測試取得不錯的效果,但由於需要額外安全評估,谷歌將先向可信測試者開放API。哈薩克斯稱,Google未來的重點是將Gemini模型擴展為一個「世界模型」。模型對物理世界的理解能力,不僅對影片、3D生成至關重要,也是機器人技術突破的關鍵。為此,Google也特別微調了Gemini Robotics模型,能讓機器人學習抓取物件、遵循指令等任務,並且能夠即時適應新任務。谷歌的終極願景是將Gemini打造成真正的通用AI助理(Universal AI Assistant),具備個人化、主動性和強大能力。03.Veo 3一次性生成超真實有聲視頻每月花1800元才能體驗多模態模型方面,Google發布了最新影像生成模型Imagen 4。 Imagen 4可以逼真地刻畫出複雜的織物、水滴和動物毛皮等物體。這款模型最高支援2K分辨率,圖片縱橫比和自由定制,其文字生成和排版能力也有明顯提升,給海報製作、PPT製作等生產級應用提供了更好的支持。谷歌影片生成模型Veo 2新增了影片參考、相機控制、物件添加與刪除等功能,而最新發布的Veo 3實現了有聲影片的直接生成,能直接給城市街道場景的影片配上自然的噪音,或是直接生成人物之間的對話。此外,Veo 3在文字和圖像提示、現實世界物理和口型同步方面都表現出色。Google為Veo打造了配套的AI電影製作工具Flow,此工具整合了Veo、Imagen和Gemini三款模型,可用於電影片段、場景和故事的創作。音樂生成方面,Google進一步擴大了配套的音樂創作平台Music AI Sandbox的訪問權限,由Lyria 2音樂生成模型提供技術支援。谷歌還打造了互動式音樂生成模型Lyria Realtime,讓用戶可以即時互動地創建、控制音樂。在大量AI生成內容出現之後,此類內容的識別也成為關鍵挑戰。谷歌於2023年推出了SynthID浮水印,迄今已為100億份AI生成的圖像、視訊、音訊和文字內容添加浮水印。今天,Google進一步發布了SynthID檢測器,這項驗證入口網站能幫助人們更方便地識別AI生成內容。Gemini將推出Canvas功能,支援互動性的使用者協作。使用者描述需求後,Canvas可自動產生可分享的互動式內容,其他使用者也可以對此內容進行修改。谷歌也推出了Gemini in Chrome,這是一款Chrome瀏覽器中內嵌的個人化助手,即時理解當前網頁內容與用戶所處的上下文。例如,在購物場景中,Gemini in Chrome可以幫助使用者快速比較商品評論、輔助決策。這項功能將於本周對美國用戶開放。Gemini App中將內建上述一系列Google的媒體內容產生模型。04.聯手三星、高通共建安卓XR現場示範智慧眼鏡回訊息、搜圖片谷歌副總裁、安卓XR主管沙赫拉姆·伊扎迪(Shahram Izadi)稱,安卓平台現在正發生許多令人興奮的變化。上周,Google已經發布了安卓16和Wear OS 6兩大新一代作業系統,而今天發布的許多Gemini最新進展將很快登上安卓平台,不僅限於手機,還包括手錶、汽車和智慧電視。而Google的安卓XR是Gemini時代的首個安卓平台,將支援從頭顯到智慧眼鏡等多種裝置類型,滿足不同使用場景的需求,如沉浸式觀影、遊戲和工作等。目前,Google正與三星合作共建安卓XR,並與高通合作針對驍龍平台進行最佳化。自去年發布開發者預覽版以來,已有數百名開發者為該平台建立應用程式。谷歌認為,智慧眼鏡是AI的理想載體。現場,Google工作人員和NBA球星「字母哥」一同展示了Google眼鏡原型機的使用體驗。天氣、時間、影像和訊息等資訊能以彩色形式顯示在Google眼鏡上,使用者可以直接透過語音指令讓安卓XR智慧眼鏡完成訊息回覆、開啟勿擾模式、影像檢索等操作。這款眼鏡還具備一定的上下文記憶能力。在示範人員登上台後,Google眼鏡能回想起剛才在後台看到的咖啡究竟是什麼品牌的。谷歌稱,他們與三星的合作關係將會提升至新的高度,從頭顯拓展至智慧眼鏡領域,雙方已經在合作開發軟體和參考硬體平台。繼與三星合作的Project Moohan之後,Google的第二款安卓XR設備是與XREAL合作的Project Aura。這款智慧眼鏡使用了安卓XR的軟體堆疊和高通驍龍XR晶片,配備光學透視(OST)和虛擬透視(VST)顯示技術,擁有70度的視野,不過仍然採用了有線的設計。05.AI Mode支援上傳全身照虛擬試穿追蹤低價代理結帳自去年在I/O大會上推出以來,Google搜尋的AI Overviews月活用戶已達15億,在200多個國家和地區可用。AI Overviews是Google Lens視覺搜尋成長的驅動力之一。 Google Lens搜尋次數的年增率為65%,今年已完成超過1,000億次視覺搜尋。為提供更沉浸式的AI搜尋體驗,Google推出了全新的「AI Mode」。 AI Mode以新分頁形式出現在搜尋介面中,其底座是Google基於Gemini 2.5定制的模型版本。在這個模式下,其會針對使用者需求對答案進行整合並提供方便閱讀的答案形式,如附帶評分的飯店資訊、包含地圖概覽的答案等,同時,使用者也可以透過對話形式進行後續追問。這項功能今天開始在美國推出AI Mode背後的關鍵技術是“查詢扇出(query fan-out)”,可跨子主題和多個資料來源同時發出多個相關搜索,然後將這些結果匯總在一起,提供易於理解的回應。在個人化搜尋能力方面,AI Mode允許用戶引入更多偏好訊息,幫助用戶預定座位、進行所在地活動推薦等。對於用戶需要獲得更詳盡答案的問題,AI Mode能代表用戶發起數十次甚至數百次搜索,幾分鐘內產生一份專業級報告。AI Mode在運動數據、金融分析的深度應用會於今年夏天推出。如讓其展示本賽季和上賽季使用魚棒球員的打擊率和上壘率,這個問題包含不同賽季、使用特定球棒的球員、打擊率、上壘率等多個要素。其會動態為使用者產生如圖表等適應使用者觀看的介面。AI Mode也重塑了用戶的購物體驗,幫助用戶客製化瀏覽介面、虛擬試穿以及結帳。AI Mode將Gemini與購物圖譜相結合,擁有超過500億個產品,並附有評論、價格、顏色選項和可用性等詳細信息,同時會根據用戶特定需求定制產品瀏覽面板。基於AI Mode,用戶選取衣服點擊「試穿」圖示、上傳全身照,就能進行虛擬試穿。這一效果由時尚定製圖像生成模型提供支持,該模型能夠理解人體結構和服裝的細微差別,例如不同面料在不同人體上的折疊、拉伸和懸垂效果。同時,用戶在商品詳情上點擊“跟踪價格”,然後設置合適的尺碼、顏色以及期望的支付金額,AI Mode就會自動在不同網站監控降價信息,並向用戶發送降價通知,將商品添加到用戶購物車並通過Google Pay完成結帳。這項視覺購物、結帳功能將在未來幾個月內陸續推出。06.研究項目突破:3D視訊通話、視訊通話搜索為Agent引入多工處理能力皮查伊重點提到了目前正在改變Google產品的三個例子:第一個專案是在Project Starline之上,Google推出一個以AI為核心的全新視訊通話平台Google Beam,該平台採用新一代視訊模型將2D視訊串流轉換為3D體驗,透過6台攝影機組成的陣列捕捉用戶動作,借助AI將這些視訊串流進行合併,實時處理呈現用戶影像,精度達毫米級,每秒60幀。谷歌與惠普合作的首批Google Beam設備將於今年稍後向其測試用戶推出。此外,Google致力於將Project Starline的底層技術引入Google Meet視訊會議平台,包括即時語音翻譯功能。今天谷歌將直接在Google Meet中推出即時語音翻譯功能,訂閱用戶可以使用英語和西班牙語,未來幾周之內將會支援更多語言,今年稍後向企業用戶推出。第二個專案是即時、多模態的AI助理專案Project Astra,如今Gemini Live已具備Project Astra的相機和螢幕分享功能,讓使用者可以暢聊所見的一切。去年,Project Astra展示的即時視覺、螢幕分享和記憶功能已逐步整合到Gemini中,今天谷歌新增了更自然的原生語音互動和電腦控制功能。Gemini Live API現已推出音訊視訊輸入和本地音訊輸出的預覽版本,開發者可以控制其語調、口音和說話風格。Project Astra也可用於視障人士的輔助。谷歌示範了Project Astra如何幫助一位盲人音樂家完成現場演出。第三個專案是Project Marina,這是一個能夠與網路互動並且完成任務的Agent,Google將Agent視為結合了先進AI模型智慧與工具存取能力的系統。其中,電腦使用是一項讓Agent能與瀏覽器和其他軟體互動和操作的重要能力。谷歌引入了多任務處理能力,Project Marina可以同時監管十項任務,用戶展示一次任務,Agent還可以學會為未來類似的任務去製訂相應的計劃。谷歌將透過Gemini API將Project Marina的電腦使用能力帶給開發者,今年夏天將開放給更廣大使用者。Gemini SDK現在相容於MCP工具,Google會逐步將整體功能引入Google搜尋以及Gemini應用程式。07.結語:Google全面重塑搜索瀏覽器體驗,劍指通用AI助手哈薩比斯提到,在過去的十年中,Google為現代AI時代奠定了許多基礎,從率先提出所有大語言模型賴以構建的Transformer架構,到開發AlphaGo和AlphaZero等可以學習和規劃的智能體系統,並且已將這些技術應用於量子計算、數學、生命科學和算法發現領域的突破。這也是其最新在年度開發者大會上宣布諸多更新的技術底座。谷歌在升級Gemini模型的同時,將更多的AI能力融入搜尋、Gmail和瀏覽器之中。同時,Google也預告了未來的重大舉措,包括改進視訊通話功能、打造更具感知力和對話能力的助手,以及合作開發智慧眼鏡。這些都彰顯出Google作為科技巨頭雄厚的技術實力和廣泛的應用市場,並且在I/O大會上,谷歌也提到將在基礎研究上加倍投入,真正構建更個性化、更主動、更強大的AI。未來實現通用人工智慧(AGI)的下一個突破性技術或許會更快到來。(智東西)
智慧眼鏡進入“安卓時刻”,谷歌為何選擇這家中國企業
谷歌攜手中國企業XREAL定義AR“安卓時刻”,Project Aura有機會重塑產業生態嗎?01十年蟄伏谷歌AR策略的「生態化」轉身在2025年5月21日的Google I/O開發者大會上,Google與中國AR科技公司XREAL聯合發布全球首款基於Android XR平台的旗艦級AR眼鏡Project Aura,標誌著AR產業從技術單點突破邁向標準化生態構建的「安卓時刻」。這項合作不僅是谷歌繼2015年停售初代Google Glass後的重磅回歸,更是其以作業系統為核心、硬體夥伴為觸手的生態策略的延續。從歷史脈絡來看,Google在AR領域的探索始終與生態佈局深度綁定。初代Google Glass因隱私爭議和生態閉環不足而折戟,後來更名為Project Aura並由前亞馬遜Fire Phone團隊主導研發。此選擇與XREAL合作,既依托後者在輕量化AR硬體、光學技術(OST光學透視)及供應鏈上的積累,也彰顯了谷歌以Android XR平台為底座,建構開放生態的野心。Google副總裁、Android XR 負責人Shahram Izadi 表示:「我們非常高興XREAL 加入Android XR 家族,並共同在Project Aura 上打造卓越的XR 體驗。Android XR 是第一個專為Gemini 時代打造的Android 平台,將支援VST(Video See Through,視訊透視)和OST(VideoOptic See Through,透過平台開放性與XREAL 在輕量化、便攜式XR 硬體上的領先能力結合,我們正在推動空間體驗進入更直觀、更可及的OST 時代,這是我們生態系統發展史上的重要時刻。 」XREAL創辦人兼CEO徐馳表示:「XREAL一直在突破AR硬體的邊界,追求性能、舒適度與設計美學的極致融合,打造真正適合日常配戴的輕量化眼鏡產品。此次與Google 聯手共建Android XR 生態,將我們的願景推向一個全新高度。Project Aura 是合作的結晶,融合了美國攝影02技術破局OST路線+Android XRProject Aura的技術突破聚焦於兩大核心:OST光學透視技術與Android XR平台深度融合。作為首款採用OST路線的Android XR設備,其透過超薄光波導鏡片實現真實環境與虛擬資訊的無縫疊加,在輕量化設計(預計低於100克)與120°超廣視場角之間取得平衡。相較於傳統視訊透視(VST)方案,OST技術路徑較符合日常配戴需求,可望解決AR設備笨重、眩暈感強等痛點。同時,Android XR平台的開放性與GoogleGemini AI能力的整合成為差異化競爭力。透過高通Snapdragon旗艦晶片提供算力支持,Project Aura可實現即時環境感知、多模態互動(如手勢與語音協同)及動態空間錨定。而Gemini AI的接入,則讓設備具備上下文語義理解、任務規劃等能力,例如在導航中疊加實時路況預測,或在維修場景中提供分步驟AR指引。這種「硬體+平台+AI」的三位一體架構,為開發者提供了統一的技術接口,降低了AR應用開發門檻。值得注意的是,Project Aura雖配備獨立處理器,但可能仍需連接安卓裝置使用,這或成為其普及的潛在門檻。03谷歌打造的AR“黃金三角”此次合作被業界視為AR產業的「分水嶺事件」。 Google、XREAL與高通組成的「黃金三角」分別涵蓋作業系統、硬體設計與晶片算力,建構了完整的生態閉環。此模式與蘋果Vision Pro的封閉生態形成鮮明對比,Android XR的開放性將吸引更多硬體廠商加入,而XREAL作為首個標竿夥伴,或成為類似智慧型手機時代的「三星」角色。統一開發框架可降低廠商接入門檻,XREAL作為「標竿夥伴」提供已驗證的硬體方案,類似安卓時代的三星角色;而XREAL過往產品定價在299-599美元區間,結合高通驍龍XR晶片的規模化量產,消費級AR眼鏡成本可望壓縮至500美元以下,更重要的是XREAL背後多家A股供應鏈企業(如光學模組、微顯示供應商)的技術升級,標誌著中國在AR核心元件領域的話語權提升。XREAL背後隱藏著中國AR核心元件的突破,在光學模組方面,耐德佳、靈犀微光等企業已實現光波導良品率從30%提升至65%,京東方矽基OLED屏量產進度也追平索尼,打破海外壟斷。從製造協同來看,上海及長三角地區形成從設計到組裝的完整產業鏈,支撐XREAL全球37%的市佔率。這種「技術-製造-市場」的三級跳,標誌著中國在AR價值鏈中從代工到核心技術掌控者的轉型。當然,開放生態需協調多方利益,高通傾向高價旗艦晶片,XREAL追求硬體性價比,Google則依賴廣告與資料變現。這種分歧在智慧型手機時代曾導致安卓陣營“高端失守、低端混戰”,AR領域需建立更緊密的利益共享機制。04Gemini重塑AI生態重新定義AI時代的“作業系統”XR眼鏡之外,GoogleI/O開發者大會以一場長達3小時的「AI總攻」宣告了技術範式的全面躍遷。從搜尋到辦公室協作,從瀏覽器到硬體生態,Google透過數十項創新將生成式AI從工具屬性升維為數位世界的底層作業系統。作為大會核心之一,Gemini 2.5 Pro的發布標誌著推理能力的質變。其「Deep Think模式」引入平行思考機制,能在數學、程式設計等複雜任務中評估多種解決方案,最終生成更優答案,效能接近旗艦級Ultra模型。而Gemini 2.5 Flash則透過效率最佳化,達到高速響應與低資源消耗的平衡,適用於即時場景。此外,Gemini首次支援視聽輸入與原生音訊對話,開發者可透過Live API客製化互動體驗,進一步降低AI應用門檻。值得注意的是,Gemini已深度融入Google產品矩陣:Chrome側邊欄集成AI助手,可解析網頁內容並協助完成任務;Gmail中實現郵件智能總結與草稿生成;甚至Android XR眼鏡也搭載Gemini,支援即時翻譯與導航。這種「無所不在的AI」策略,使Gemini月活用戶半年內激增3倍,突破3.5億。05搜尋革命從“連結列表”到“智慧解答”面對生成式AI對傳統搜索的衝擊,谷歌祭出兩記重拳——首當其衝的是AI模式(AIMode),谷歌在搜索結果頁引入端到端AI推理鏈,將用戶查詢分解為多維度子問題並發起並行搜索,例如“策劃親子露營”需求會同步分析天氣、裝備清單、安全指南並生成可視化方案。谷歌搜尋的「AI模式」可望徹底顛覆傳統邏輯,整合Gemini 2.5的深度搜尋(Deep Search)可發起數百次子查詢,綜合推理後產生帶有完整引用的專家級報告,將用戶研究時間從數小時縮短至幾分鐘。AI Overviews功能直接在搜尋結果頂部提供結構化摘要,涵蓋複雜數據分析與視覺化圖表生成,例如輸入“比較中美新能源汽車市場趨勢”,系統將自動整理數據並繪製動態圖表。這項變革對產業影響深遠。傳統搜尋依賴網站流量分發,而AI摘要可能導致流量向頭部平台集中。谷歌已試水溫“AI概覽廣告”,預計2025年相關收入佔搜尋廣告1%,2027年攀升至6-7%。而另一個策略則是多模態搜尋的具身智能,結合Google Lens技術,用戶拍攝電器故障部位即可獲得維修指導視頻,系統能識別螺絲型號、電線顏色等細節,將物理世界轉化為可交互知識庫。此舉直接衝擊傳統搜尋廣告模式,Google正探索在對話流中嵌入情境化廣告,如AI旅行規劃中智慧插入飯店優惠卡。06評語:生態優勢下的隱憂儘管Google透過預先安裝硬體(如三星Galaxy S24)和Workspace辦公室套件建構了用戶護城河,但仍面臨隱私爭議與競爭壓力。 Gemini的Chrome整合被質疑資料收集邊界,而OpenAI的ChatGPT以6億月活保持領先。此外,多模態搜尋的興起要求Google在廣告模式與內容版權間找到新平衡點。(壹零社)
2nm工藝+自研AI伺服器+智慧眼鏡三線作戰:蘋果晶片戰爭的「三位一體」突圍
一、智能眼鏡晶片:基於Apple Watch架構的精準突圍蘋果秘密研發的智能眼鏡專用晶片已取得關鍵突破。該晶片基於Apple Watch S系列架構深度最佳化,通過移除冗餘元件實現超低功耗設計,並強化多攝影機協同能力。知情人士透露,量產計畫將於2025年底至2027年間啟動,首款產品可能定位為"非AR功能優先"的輕量化智能眼鏡,直接對標Meta熱銷的Ray-Ban系列。技術亮點:能效比iPhone晶片降低30%,支援全天候佩戴整合環境掃描攝影機與AI協處理器台積電N3E工藝加持,良率優於前代3nm工藝二、Mac晶片矩陣:M5量產在即,M6/M7/Sotra三線並進供應鏈確認,M5晶片已進入量產階段,將採用台積電3nm增強版(N3E)工藝,重點提升AI算力與散熱效率。值得關注的是:M5 Pro/Max/Ultra:2026年發佈,支援更複雜機器學習任務M6(Komodo):專注能效比最佳化,MacBook Air首選M7(Borneo):面向專業工作站,算力較M2 Ultra提升70%Sotra:首款伺服器級晶片,專為AI訓練設計產業影響:蘋果計畫在2027年實現Mac產品線100%自研晶片覆蓋,徹底擺脫X86架構依賴。此舉可能引發Windows陣營加速ARM架構轉型。三、AI伺服器晶片Baltra:與博通聯合開發的"算力核彈"代號Baltra的AI伺服器晶片是蘋果首次涉足資料中心領域。該晶片採用chiplet設計,整合:128核神經網路引擎1.6TB/s記憶體頻寬博通定製互聯模組預計2027年投產後,Apple Intelligence平台資料處理效率將提升400%,端雲協同延遲降至5ms以內。戰略意義:打破對NVIDIA/AMD的算力依賴,建構從端到雲的完整AI生態閉環。庫克在內部會議強調:"這是繼A系列晶片後最重要的技術投資"。四、台積電代工版圖:2nm工藝卡位戰白熱化作為蘋果核心代工夥伴,台積電正加速2nm工藝落地:2024Q4啟動N2節點試產2025Q2實現小批次交付亞利桑那州工廠2026年加入量產行列最新路線圖顯示,1.4nm工藝(A14)將於2027年量產,首用於iPhone 19 Pro的A21晶片。產能博弈:蘋果已鎖定台積電2nm產能的70%,三星3nm良率不足50%的現狀,讓半導體代工市場呈現"一超多強"格局。五、深入觀察:蘋果晶片戰略的三大底層邏輯技術自主權爭奪:從基帶晶片到伺服器處理器,全面替代高通/英特爾/博通元件,每年節省百億美元授權費生態閉環強化:通過統一架構實現iPhone→Mac→AI伺服器的算力協同,開發者適配成本降低60%AR市場卡位:智能眼鏡晶片先發優勢,為未來空間計算時代儲備核心技術潛在挑戰:伺服器晶片需突破企業級市場信任壁壘智能眼鏡面臨國內廠商的性價比圍剿(2024年中國AR眼鏡銷量達28.4萬台,7億元市場規模)當庫克將"晶片自主化"列為最高戰略優先順序,這場戰役已超越單純的技術競爭。從可穿戴裝置到資料中心,蘋果正在建構一個橫跨7個技術層級、覆蓋10億終端裝置的算力網路。正如分析師郭明錤所言:"未來五年,得晶片者得生態"。在這場矽基革命中,台積電的晶圓廠、蘋果的設計團隊、全球開發者的創造力,正編織著一張改變數字世界底層規則的巨網。 (視界的剖析)
AI不是泡沫,每個企業都有AI代理,智慧眼鏡將成「終極社交平台」—祖克柏談Meta的野心
在近日Stripe Sessions活動上,Meta CEO馬克‧祖克柏與Stripe總裁John Collison進行了精彩對話。作為美國最大的GPU買家之一(僅次於雲端運算巨頭),祖克柏站在AI浪潮的前沿,分享了他對AI發展、Meta在AI領域的戰略佈局、市場競爭格局和管理哲學的獨到見解。(註:Stripe為Patrick Collison和John Collison兄弟二人在2010年創立的金融科技公司,主要為電子商務網站和行動應用程式提供支付處理軟體以及相關產品功能整合。)一、AI:不是泡沫,而是加速發展的趨勢當被問及AI發展趨勢時,祖克柏表示:「總體來說,一切都在按計畫進行,甚至超出預期。」"他認為AI將徹底改變幾乎所有產品類別和經濟的各個部分。關鍵問題不是我們是否處於泡沫中,而是這種轉變將在多快的時間內發生。"我們在AI領域工作的時間越長,越發現我們預想的事情總是提前到來。實際上,設定更加雄心勃勃的目標,在過去幾年中反而更能精準預測行業發展方向。"Meta AI現在每月已有約10億活躍使用者,而他們為團隊設定的目標不斷被超越。不僅如此,整個產業發展速度也持續加快,各公司紛紛達成甚至超越預期目標。二、AI改變商業模式:從廣告到商業代理祖克柏詳細闡述了AI如何徹底改變Meta的兩個核心業務領域:1. 廣告系統的智慧化革命傳統上,企業投放廣告需要自行建立素材、確定目標受眾、進行效果測量。隨著AI的發展,這一過程正大幅簡化:"我們正在建立的終極目標是,任何企業都可以直接告訴我們他們的目標(例如獲取新客戶或銷售特定產品),告訴我們他們願意為這些結果支付多少錢,然後我們就能持續不斷地提供結果。這本質上就是一個'終極商業結果機器',可能成為最重要、最有價值的AI系統和商業系統之一。"這種轉變意味著企業,尤其是小企業,將能夠專注於他們的核心創意和產品,而不必糾結於廣告創意和定位策略。AI可以產生和測試數千個創意版本,找出效果最佳的那一個。祖克柏指出,傳統廣告佔全球GDP約1%,但其中包含許多效率低下的方式(如戶外廣告牌,可能四分之三的觀看者並非目標客戶)。當AI能精準配對廣告與受眾,整個網路經濟將獲得更大成長。以前,Meta的廣告系統優勢在於能讓企業精確定位特定人群(例如"18-28歲的女性")。而現在,他們實際上鼓勵廣告主不要過度限制AI的範圍,因為:"除非你真的有理由不想向其他人群銷售,否則不要僅限於定於那些人群,因為AI實際上可能比你更能找到對你產品感興趣的人。"2. 商業AI代理的崛起祖克柏提出了一個大膽預測:"就像每個企業今天都有電子郵件地址、網站和社交媒體存在一樣,未來每個企業都將擁有一個AI代理,存在於不同的消息平台中,負責客戶支援和銷售。"他特別提到了泰國和越南的有趣案例。這兩個國家雖然在全球GDP排名中僅位於30幾位,卻是Meta的第10和第11大收入來源國。這是因為在這些地區,企業可以負擔得起人工客戶支援的成本,大量商業活動透過訊息平台進行。"當每個企業都擁有能處理客戶支援和銷售的AI商業代理時,這將大大加速業務增長。從收入角度看,WhatsApp才剛剛起步,它很可能成為我們業務的下一個支柱。"三、個人AI:Meta的消費者策略,不只是生產力工具談到Meta的AI策略,祖克柏明確區分了他們與其他AI公司如Anthropic的不同路徑:"在消費者方面,我們非常專注於'個人AI',而不僅僅是生產力工具。這意味著AI將更具對話性,更傾向於語音互動,並且更加個性化。人們需要一個能真正理解他們的系統,就像Feed演算法一樣理解他們的喜好,而不是每次查詢都要從零開始。"祖克柏指出了當前AI個性化方面存在的巨大機會。例如,Siri難以精確地識別使用者的聲音,而實際上它不需要識別任何人的聲音,只需識別特定使用者的聲音即可。祖克柏特別強調了智慧眼鏡作為AI的完美形態因素:"智慧眼鏡是AI的完美載體,因為它能讓AI看到你所看到的,聽到你所聽到的,全天與你交流。它應該不斷理解你,而不是每次查詢時都從零開始。"四、技術前瞻與戰略定位作為一家經常走在技術前沿的公司,Meta(前Facebook)經常在新技術成為主流之前就做好準備。祖克柏11歲時就開發了自己的聊天應用"Zucknet",11年前收購了Oculus,2013年就成立了AI實驗室。當被問到這種前瞻性是否是他個人身份的一部分時,祖克柏幽默地表示:"提前佈局當然比落後更有趣,但我們也有落後的領域,比如Reels就是在TikTok變得很大後才開始追趕的。"這種前瞻性思維也體現在他對下一代計算平台的看法:"我認為我們必須比競爭對手做得更好、更早進入市場。這可能意味著我們需要在市場真正準備好之前很久就大量投資。這種想法源自於Meta的現實處境——他們的服務主要透過競爭對手的平台(如蘋果和Google)分發。 "如果我們能夠做所有我們認為對消費者有益的事情,而不受這些平台的限制,我們的盈利能力可能會增加一倍。"他預測眼鏡將成為"終極社交平台",因為全息投影將提供一種"存在感",讓你感覺與他人在一起,這是當前任何螢幕都無法提供的體驗。目前,以祖克柏的說法Meta的VR產品"比蘋果的更好且便宜10倍",他們的AR眼鏡銷量已達數百萬台。五、祖克柏的非正統管理哲學1. 非正統管理哲學:當談到管理風格時,祖克柏坦承他的方法與傳統理論有很大不同:- 不喜歡管理人:"我甚至不喜歡管理人,這與正統管理理念不同。"- 最小化例行會議:"我每周只有兩個固定會議——一個開放式戰略討論和一個運營會議。我真的很努力減少固定會議。"- 不相信完全授權:"基本上我不相信授權...如果有我想參與的決定,我就會參與其中。我認為這通常是創始人應採取的方式。"- 保持時間彈性:"我通常保持大量時間開放,這樣事情可以保持動態性...如果我整天都被安排滿了,而我知道有更重要的事情無法處理,我會感到非常沮喪。"Meta的組織結構分為約15個不同的產品組,從Facebook、Instagram到廣告系統、VR和眼鏡等。祖克柏將這些部門依主題組織,但同時保持非層級化的溝通方式:2.「小組」制核心團隊他更注重建立一個緊密連接的核心團隊:"我們的管理團隊不僅僅是我的直接下屬,而是一個由25-30人組成的更廣泛群體,我儘量讓他們理解公司內部的所有情況,形成一個能在整個公司完成任何任務的核心團隊。"3.以人為本的團隊建設祖克柏強調,在管理中,他重視的是人和文化,而非組織結構圖,人員和文化比組織結構更重要:"很多人從組織架構圖的角度思考如何運營公司。但我實際上認為,人員和文化才是關鍵。正如那句話所說,'文化吃戰略做早餐'。無論你畫什麼組織線條,你都需要優秀的人才,並確保他們能良好協作。"Meta的高階主管團隊中有一個有趣的特點:15個產品組負責人中,沒有一個是以產品負責人身份加入公司的。有些人最初是設計師,有些是資料分析師,甚至有兩位現任管理團隊成員原本是行政助理。祖克柏認為這創造了一個"密集連接的網絡",團隊成員之間相互信任,理解彼此的優勢和劣勢,這種關係是"你無法通過招聘獲得的,必須通過時間建立"。4.對投資時間線的思考當被問及如何平衡短期和長期投資時,祖克柏表示這取決於企業的獲利狀況和能承擔多少長期賭注。他更傾向於從人員而非財務角度考慮這個問題:"我認為關鍵在於找到最優秀的人來做各種不同的事情,然後把所有事情都做好。我們之所以能做長期的項目,是因為我們的核心業務做得非常好。"他指出,自己並不花時間改進Feed演算法或廣告系統,但負責這些團隊的人才出色,並獲得所需的一切資源,因為這些是使用者使用Meta的核心產品。"我可能更專注於人員而非財務方面,關鍵問題是你將最優秀的人才分配到那裡,誰先獲得資源。你越盈利,就能嘗試越多不同的事情。"結語:AI時代的企業機遇在回答給企業家的建議時,祖克柏強調了AI和網路平台如何改變創業生態,AI和網路平台的發展使得創業者可以專注於核心創意:"20年前,如果你創業,必須在公司內部建立所有不同的能力。現在有這麼多優秀的平台可以使用...這意味著你可以更專注於公司的核心理念。"他預見這將導致全球創造出更高品質的產品,因為創業者可以組建小型的、才華密集的團隊,並專注於他們熱衷的想法。「這將帶來全球更高品質的創造,因為現在你可以組建小型的、才華密集的團隊,專注於他們熱衷的想法。我認為這是未來的美好願景:人們將更有能力專注於核心想法,並能夠合作完成比人類歷史上任何時候都更大規模的事情。"馬克·祖克柏的對話揭示了無論是AI驅動的廣告系統轉型,還是商業代理和個人化AI的發展,Meta都展現出明確的戰略方向。在管理哲學方面,祖克柏的非正統方法也提供了有益參考:精簡會議、保持彈性、重視人員和文化勝過組織結構,以及建立高度互信的核心團隊。當AI技術繼續快速發展,那些能夠理解並應用這些趨勢的企業和個人將在未來競爭中佔據優勢。正如祖克柏所言,現在是"歷史上最令人興奮的時期之一",我們正站在技術變革的新浪潮前沿。 (JER學家)
蘋果智慧眼鏡最快2026年底推出,首款AI伺服器晶片預計2027年完成
據外媒報導,蘋果在2023年全球開發者大會上推出的頭顯產品Vision Pro,已於去年2月份開始在美國市場上市,6月份推向了國際市場,目前上市已有一年多的時間。但從外媒最新的報導來看,已推出頭顯產品Vision Pro的蘋果,也正在研發智慧眼鏡。就外媒的報導來看,蘋果智慧眼鏡項目早在2015年就已傳出,與去年2月放棄的汽車項目相當,蘋果汽車項目的消息首次出現,普遍認為是在2014年。同已經放棄的汽車項目在啟動之後申請了大量的專利一樣,蘋果的智能眼鏡項目,在傳聞出現之後也申請了大量的專利。而對於蘋果的智慧眼鏡項目,有外媒在當地時間周四的報導中提到,可能會在2026年年底或2027年年初發貨,早於此前預期的不會在2030年左右推出。在蘋果先前的新品上,無論是首次推出的產品還是已有產品的更新,在發佈之前都有大量的消息傳出,部分還有設計圖或模具,但在傳聞中的智能眼鏡上,外媒稱還沒有具體的設計圖曝出。對於蘋果智慧眼鏡的設計,有傳聞稱蘋果希望看起來時尚,也有外媒在報導中稱從已申請的專利圖來看,看起來像安全防護眼鏡,但專利中的說明,並不是產品的原型圖紙,至於最終如何,要在正式發佈時才會知曉。正在為AI伺服器研發晶片智慧眼鏡也將有專用晶片從外媒最新的報導來看,為iPhone、iPad、Mac等硬體產品線研發晶片之後,蘋果公司也在研發其他產品線的晶片,其中就包括AI伺服器。就外媒的報導來看,蘋果在研發的AI伺服器晶片,是他們“Baltra”項目的一部分,他們的首款AI伺服器晶片,預計將在2027年完成。在OpenAI訓練的生成式人工智慧聊天機器人大火之後,科技巨頭們紛紛加大了在人工智慧方面的投入,蘋果也是其中之一。對在大力投資人工智慧的廠商來說,伺服器是支出較大的一項,自研晶片有助於降低成本,也能依需求設計相關的晶片。而值得注意的是,在報導蘋果為AI伺服器研發晶片時,外媒也提到他們在為智慧眼鏡研發專用晶片。蘋果的智慧眼鏡,是預計最快在2026年底或2027年初推出,將同Meta等公司的產品競爭。 (TechWeb)