#翻譯
Token能力:人工智慧核心競爭力
我們在《人工智慧應用中,token到底應如何翻譯?》中,認為對於token翻譯需要一個兼具價值基本單位、計算基本尺度和基礎構成單位,三者於一體的表述,據此認為token最好的翻譯是“籌”。之所以如此關注這個問題,是因為token已經在一定程度上成為人工智慧應用能力的關鍵詞,我們將進一步論述token是資訊單位、算力單位、貨幣單位,已經成為衡量人工智慧應用水平的尺度。從“字節”到“Token”,已經形成了認知的躍遷。在電腦科學的傳統語境中,“字節”(Byte)是資訊儲存和傳輸的基本計量單位。無論是硬碟容量、網路頻寬還是記憶體大小,我們都習慣於用字節來衡量。然而,當我們將目光轉向人工智慧領域,尤其是大語言模型的世界,另一個單位悄然成為核心度量衡——Token(籌)。Token究竟是什麼?它與字節有何關係?為什麼DeepSeek、OpenAI、Anthropic等AI廠商無一例外地選擇用Token來定價、限制對話長度、衡量算力消耗?更進一步,為什麼Token的消耗量和使用效率,正在成為評判AI模型能力強弱的核心標尺?本文將從Token與字節的技術關係出發,深入剖析Token為何成為AI經濟的“一般等價物”,並論證一個核心觀點:Token能力,即模型用儘可能少的Token實現儘可能高價值任務的能力,正在成為人工智慧的核心競爭力。一、字節與Token:從物理儲存到語義理解的跨越要理解Token的意義,首先需要釐清它與字節的本質區別。字節是電腦物理層面的儲存單位,1字節等於8位元,代表一個0-255之間的數值。在純文字檔中,一個英文字母通常佔用1字節,一個中文字元在UTF-8編碼下通常佔用3字節。字節的計量是機械的、均勻的、與語義無關的——無論這個字元是“的”還是“量子”,無論它在句子中扮演什麼角色,在字節層面它們只是冰冷的數字。Token則完全不同。Token是大語言模型處理文字的基本單元,是將連續文字序列離散化後可計算的最小語義單位。它既不是字元,也不是固定的字節塊,而是通過分詞演算法(如字節對編碼BPE)從訓練資料中統計得到的語義碎片。舉例來說,英文單詞”unbelievable”可能被分成”un”、”believe”、”able”三個Token,因為從統計上看,這些子詞單元能更好地組合出新詞;中文句子“人工智慧很強大”可能被分成“人工”、“智能”、“很”、“強大”四個Token,而非逐字分割。根據統計,英文中平均每個Token對應3-4個字元,約0.75個單詞;中文則因編碼效率不同,平均每字約0.5-2個Token。字節和Token的關係,折射出兩種截然不同的世界觀:字節計量的是“儲存了什麼”,它忠實記錄每一個位元,無論資訊有無意義;Token計量的是“模型看到了什麼”,它反映的是模型理解語言的基本粒度,是語義世界的最小公倍數。字節是物理世界的計量,Token是語義世界的計量。當電腦從計算走向理解,計量單位也必須從物理躍遷到語義——這正是Token取代字節成為AI核心單位的底層邏輯。二、Token是資訊單位:智能思考的細胞為什麼人工智慧應用的最基礎單位不是字節,而是token呢?這是理解AI所有問題的基礎。究其原因,從根本上說這是因為模型根本不是按“字節/字元”理解文字的,它只認token。而且算力、成本、長度,全都跟 token 強繫結,跟字節無關。模型是怎麼“讀”資訊的?比如你看到的是“我喜歡人工智慧”,而電腦(字節)看到的是一堆 0101 二進制,按字節存。但大模型看到的,是先把文字切成一段“小碎片”這就是token,比如:我 / 喜歡 / 人工 / 智能。模型不認識字,只認識編號。每一個token,模型都要做一次巨大的矩陣計算。那為什麼不能按“字節”收費/算長度? 一是因為同樣長度字節,token可能差很遠;同樣是 100 字節,英文可能切成25個token,而中文可能切成30~40 個token。而程式碼、符號、特殊表情:可能1個字元=1個token。字節相同,模型計算量天差地別。二是模型算力=跟token 數量成正比。每進1個token,模型要做一次完整推理計算, 進1000token,計算量×1000。上下文越長(比如 128k token),算力爆炸式增長。算力成本≈token數量,而跟字節幾乎無關。三是字元/字節沒法衡量“模型理解難度”。一個生僻詞可能佔1個字元,卻切成 3 個 token,一個常用詞可參3個字元,只切成 1 個 token。模型理解成本、計算成本,只由 token 決定。總之,字節是存檔案的單位,而token是模型思考的單位。API 收費、長度限制、算力消耗,本質都是在收模型“思考”的錢,不是存檔案的錢。 所以必須按token算,而不能按 字節/字元算。三、Token是算力單位:智能效率的標尺理解了Token的本質,就不難解釋為什麼AI廠商的API定價、對話長度限制、算力消耗估算都不約而同地選擇Token而非字節。這背後有著深刻的技術和經濟原因。Token是計算的基本單元。在大模型的推理過程中,Token是計算的基本單位。模型對每個Token的處理都需要執行嵌入層查詢、注意力計算和前饋網路運算,處理的Token數量越多,計算量呈平方級增長。更重要的是,不同Token消耗的算力並不相同。Google最新的研究發現,模型生成的Token其實可以分為兩類:一類是“功能性詞彙”,如“和”“是”“的”這類詞,模型在淺層網路就快速確定了,不需要深度思考;另一類是“深度思考詞”,如“運算結果是10”“選項為A”,這類詞在深層網路中還會被反覆修正,體現模型真正在琢磨問題。如果用字節計費,意味著要求使用者為“的”“了”“嗎”這些廉價Token支付和核心推理Token同樣的價格——這顯然無法反映真實的計算成本。而Token作為模型處理的基本單元,天然地與計算量掛鉤,因此成為更公平的計量基準。Token是輸入/輸出的雙向成本結構。當前主流API均採用“輸入Token+輸出Token”的復合計價模式。這一設計的精妙之處在於,它精準反映了NLP任務中“思考過程”(輸入處理)與“結果生成”(輸出)的不同資源消耗。以DeepSeek為例,其計費模型中輸入和輸出價格不同,輸出通常更貴,因為生成過程需要逐個Token地自回歸計算,無法平行。如果按字節計費,這種成本結構的差異將無法體現——同樣是1KB資料,作為使用者提問傳送和作為模型答案生成,背後消耗的算力可能相差數倍。Token是語義容量的衡量尺度。另一個關鍵概念是上下文窗口(Context Window),即模型單次處理的最大文字長度。GPT-4支援32K Token,Claude 3支援200K Token,DeepSeek企業版支援32K Token。為什麼不用字節來定義上下文窗口?因為模型真正“看到”的是Token序列,而非字節流。Transformer架構的注意力機製作用於Token之間,其計算複雜度和記憶體佔用與序列長度的平方成正比。一個200K Token的窗口,對應的是模型能夠同時“關注”的語義單元數量,而非物理儲存空間。用Token定義窗口,才是對模型能力邊界的真實刻畫。四、Token是貨幣單位:智能商業的壁壘如果說Token消耗量反映了模型的效率,那麼單位Token創造價值的能力則是模型商業價值和技術能力的終極體現。一個反直覺但日益成為共識的結論是:對於同一個意思,Token使用量越少,說明模型處理能力越強。最高級的智能,恰恰在於知道什麼時候該停止思考。 能夠用更短的思維鏈、更少的Token精準解決問題的模型,才是真正聰明的模型。Token消耗量,正在成為衡量模型“思考效率”的核心指標。Token的貨幣化:AI經濟的計量單位。當前,全球AI廠商的營收正與其Token呼叫量呈現顯著同步的高增趨勢。OpenRouter平台的周度Token呼叫量在2026年3月達到14.8兆,兩個月內增長約160%。Token已經成為衡量AI應用滲透的“硬指標”。在這一背景下,單位Token的經濟產出成為區分模型優劣的關鍵。同樣是處理一個企業客服請求,模型A消耗5000 Token,模型B消耗2000 Token但達到相同的解決率,後者就具備了5倍的成本優勢。中國模型之所以能在全球市場持續提升份額,核心優勢正是“性能與成本效益”——即更高的Token價值化能力。Token的價值化:AI技術的演進標尺。Token價值化能力的提升,正在成為各大廠商技術競賽的主戰場。一方面,通過演算法創新壓縮冗餘Token。字節跳動的SAGE-RL演算法能在保持精準率的同時,將推理Token消耗壓縮約1/3;Google的Think@n策略通過早期識別低品質推理樣本,在多款模型上實現算力成本砍半。另一方面,通過架構創新提升Token的語義密度。字節Seed的DLCM將推理單位從Token推向“概念”,在壓縮後的語義空間進行深度推理,實現計算資源的自適應分配。這一突破意味著,未來的模型可能不再逐字“思考”,而是在概念層面直接推理,用更少的步驟解決更複雜的問題。Token價值化水平:AI應用的商業壁壘。對於AI廠商而言,Token價值化能力正在成為核心的商業壁壘。表面上看,增加Token輸出似乎能增加API收入。但頭部廠商深知,降低冗餘Token消耗帶來的長期價值遠高於短期收益。能讓伺服器接收更多並行請求、降低響應延遲、提升使用者體驗,這些帶來的市場份額增長,遠比讓單個請求多說幾句廢話要划算。DeepSeek之所以能在開源模型中脫穎而出,不僅因為技術先進,更因為“把推理成本打到了不可思議的低價”。這種成本優勢的背後,正是對每一個Token價值的極致挖掘——讓每個Token都用在刀刃上,不浪費算力,不拖延時間。五、Token能力,人工智慧應用核心競爭力的尺度從字節到Token,計量單位的躍遷折射出人工智慧從“計算”走向“理解”的範式革命。Token是人工智慧語義的最小單元,是算力的計價單位,也是AI經濟的“一般等價物”。它連接著底層的算力消耗、中層的API定價、頂層的模型能力。Token的數量決定模型的視野範圍,Token的效率決定模型的思考深度,Token的價值化能力決定模型的商業競爭力。展望未來,隨著多模態模型、AI Agent、長上下文處理的普及,Token的含義還將不斷演化。字節跳動已經在探索“概念”級推理,Google在量化“深度思考”Token,擴散模型在挑戰自回歸的Token生成範式。Token這個單元本身,或許會有不斷進化,不斷包括更高級的語義。不斷提升Token能力,或許是人工智慧永不停歇的進化方向。 (數字新財報)
Google翻譯重大更新:即時翻譯,全球無障礙交流摩擦蘋果
真正的理解不僅在於對方說了什麼(What),更在於他們是如何說的(How)。今天,Google 搜尋產品副總裁 Rose Yao 宣佈,Google 翻譯(Google Translate)將引入 Gemini 模型最強大的翻譯能力,在理解語言的細微差別方面實現了質的飛躍此次更新主要包含三大核心內容:基於 Gemini 建構的頂尖文字翻譯質量、通過耳機實現的即時語音對話翻譯(Beta 版),以及擴展的語言練習與技能建構功能。1. 更智能、更自然的文字翻譯從今天開始,Google 翻譯在搜尋和 App 中將利用 Gemini 的先進能力,更好地處理包含成語、本地表達或俚語等具有細微差別的短語。過去,翻譯像 “stealing my thunder”(搶了我的風頭)這樣的英語成語時,往往會出現生硬的逐字翻譯。現在,Gemini 能夠解析上下文語境,捕捉成語的真實含義,從而提供更自然、更準確的翻譯結果。適用範圍: 該更新即日起在美國和印度率先推出,支援英語與近 20 種語言(包括中文、西班牙語、印地語、日語和德語)之間的互譯。使用者可在 Android、iOS 的翻譯應用以及網頁版上體驗。2. 即時聆聽與理解世界:耳機語音翻譯 Beta 版基於 Gemini 原生的“語音到語音”(Speech-to-Speech)翻譯能力,Google 推出了全新的即時翻譯 Beta 體驗。這一新功能不僅能進行即時翻譯,還能保留說話者的語氣、強調重點和說話節奏(Cadence)。這使得翻譯後的語音聽起來更加自然,也讓使用者更容易分清對話中的不同角色。無論是在國外聆聽講座、觀看外語影視劇,還是進行跨語言對話,使用者只需戴上任意品牌的耳機,打開翻譯 App 點選“即時翻譯(Live translate)”,即可聽到即時的翻譯內容。適用範圍:地區與平台: 即日起在 Android 平台的翻譯 App 中向美國、墨西哥和印度的使用者推出。語言支援: 支援超過 70 種語言。未來計畫: Google 計畫在 2026 年將此功能擴展至 iOS 平台及更多國家。3. 助力語言掌握:擴展練習工具Google 翻譯還在進一步完善其語言學習功能,幫助使用者在現實場景中提升技能。改進的反饋機制:系統將根據使用者的口語練習提供更有針對性的建議。進度追蹤:新增了“連續學習天數”(Streak)追蹤功能,幫助使用者設定目標並直觀地看到自己的堅持與進步。服務擴展:語言學習功能現已擴展至近 20 個新國家和地區,包括德國、印度、瑞典和,台灣新增語種:*   英語 -> 德語、葡萄牙語*   孟加拉語、中文(簡體)、荷蘭語、德語、印地語、義大利語、羅馬尼亞語、瑞典語 -> 英語Google 表示,通過更先進的 AI 模型,翻譯工具不再僅僅是轉換文字,而是幫助使用者捕捉語言背後的深層含義與情感。隨著這些功能的推出,Google 期待收到使用者的反饋,以持續最佳化體驗 (AI寒武紀)
全世界在等的Gemini 3終於來了!強到斷崖領先,連馬斯克OpenAI都誇好
全球最強多模態理解模型來了,讓你所想即所得。智東西11月19日報導,今天凌晨,Google最強推理模型Gemini 3終於亮相,一個模型囊括了原生多模態、推理、Agent多種能力。GoogleDeepMind研究團隊稱,這是全球最先進的多模態理解模型、Google最強大的Agent程式設計和氛圍程式設計模型,能呈現更豐富的可視化效果和更深度的互動體驗,且完全建構於最先進的推理技術基礎之上。該模型基於GoogleTPU進行訓練,支援100萬個token的上下文窗口,適用於需要以下功能的應用:Agent、高級程式設計、長上下文、多模態理解、演算法開發。剛一發佈,Gemini 3就幾乎屠榜所有評測集,以1501 Elo得分位列LMArena大模型競技場第一。OpenAI聯合創始人、CEO薩姆·阿爾特曼(Sam Altman)和xAI創始人、CEO埃隆·馬斯克(Elon Musk)紛紛向Google發來“賀信”。阿爾特曼發推評價“Gemini 3看起來很不錯”,GoogleCEO桑達爾·皮查伊(Sundar Pichai)用了個表情包回覆。馬斯克轉發了GoogleDeepMind CEO戴密斯·哈薩比斯(Demis Hassabis)的推文稱“幹得不錯”。今天起,Google將在以下平台部署Gemini 3:適用於Gemini應用的所有使用者,以及在搜尋的AI模式中使用Google AI Pro和Ultra訂閱服務的使用者;適用於Gemini API中的開發者、Google全新Agent開發平台Antigravity的開發者,以及Gemini CLI的開發者;適用於Vertex AI平台與Gemini企業版的企業使用者。此外,Google將在未來幾周向Google AI Ultra訂閱者開放Gemini 3的深度思考模式,目前其還在進行安全評估。對於Gemini 3的發佈,皮查伊認為,這一模型可以讓使用者的任何想法變為現實。01. 分分鐘造出互動遊戲、App 還能幫你學新知識先來看下Gemini 3 Pro能做什麼。Gemini 3能編寫托卡馬克裝置中電漿體流的可視化程式碼,並創作捕捉核聚變物理原理的詩歌。如果使用者想學習家族傳統烹飪,Gemini 3可以解讀並翻譯不同語言的手寫食譜,製作成可共享的家庭食譜。如果使用者想學習一個新話題,可以給Gemini 3輸入學術論文、長視訊講座或教學,它還能生成互動式抽認卡、可視化或其他格式的程式碼,幫助使用者掌握這些內容。Gemini 3可以分析使用者的匹克球比賽視訊,找出可以改進的地方,並生成整體動作提升的訓練計畫。AI搜尋模式下,Gemini 3能學習複雜主題內容,如借助搜尋功能中AI模式的生成式使用者介面,學習像RNA聚合酶作用機制這類複雜知識點。值得一提的是,這也是Google首次在模型發佈首日,就將新模型直接整合至AI搜尋功能中。Gemini 3可以編寫擁有豐富可視化介面和互動性的復古3D飛船遊戲。該模型通過程式碼建構、解構和重新創作精細的3D體素藝術,能讓使用者的想像變為現實。Gemini 3能使用著色器建立可玩的科幻世界。其還可以生成更具實用性、元素豐富的互動性網頁和App。02. 屠榜評測集 刷新大模型能力天花板再來看下Gemini 3 Pro的基準測試結果。Google部落格提到,Gemini 3 Pro在一系列基準測試中進行了評估,包括推理、多模態能力、Agent工具使用、多語言性能和長上下文,其在主要的AI基準測試中都遠遠優於Gemini 2.5 Pro,並以1501 Elo得分位列LMArena大模型競技場第一。該模型展現出博士級推理能力,在“人類終極測試”(不使用任何工具情況下得分37.5%)和GPQA鑽石級測試中均斬獲最高分,在MathArena Apex測試中取得23.4%的最新頂尖成績。除了文字,Gemini 3 Pro在MMMU-Pro上獲得了81%,在Video-MMMU上獲得了87.6%的多模推理,在SimpleQA Verify上也獲得了最高的72.1%。這意味著Gemini 3 Pro能夠以高度可靠性解決涵蓋科學和數學等廣泛主題的複雜問題。Gemini 3的深度思考和多模態理解能力更新,可以幫助使用者解決更複雜的問題。測試中,Gemini 3 Deep Think在“人類終極測試”(未使用工具時為41.0%)和GPQA Diamond(93.8%)中表現優於Gemini 3 Pro。它在ARC-AGI-2(程式碼執行,ARC獎項認證)上取得了45.1%的成績,均超過Google自家前代模型,以及OpenAI、Anthropic的模型。程式設計能力中,Gemini 3是Google迄今為止建構過的最佳氛圍程式設計和Agent程式設計模型。該模型以1487 Elo得分登頂WebDev競技場排行榜。它在Terminal-Bench 2.0測試模型工具使用能力上,得分為54.2%,在衡量程式設計Agent能力的基準測試SWE-bench Verified上表現遠超2.5 Pro。開發者可以在Google AI Studio、Vertex AI、Gemini CLI以及Google全新的代理開發平台Google Antigravity中使用Gemini 3進行建構。它還支援第三方平台,如Cursor、GitHub、JetBrains、Manus、Replit等。自Gemini 2以來,GoogleGemini模型已經在Agent方面取得諸多進展,此次Gemini 3還登頂了Vending-Bench 2排行榜。該基準測試通過模擬自動售貨機業務營運來考核模型的長期規劃能力,其結果顯示,Gemini 3 Pro在一整年的模擬營運中,始終保持穩定的工具使用和決策連貫性,既未偏離任務目標,又實現了更高收益。這意味著Gemini 3能幫助使用者完成日常生活中的事務,如預約本地服務或整理收件箱等。03. 全新Agent開發平台亮相 實現端到端軟體開發自動化今天Google還發佈了全新的Agent開發平台Google Antigravity。借助Gemini 3的高級推理、工具使用及Agent程式設計能力,GoogleAntigravity將AI輔助功能從開發者工具包裡的一個工具,轉變為積極主動的合作夥伴。儘管GoogleAntigravity的核心仍是AI整合開發環境(AI IDE)體驗,但其Agent已升級至專屬介面,並能直接訪問編輯器、終端和瀏覽器。如今,這些Agent可以自主規劃並同步為開發者執行複雜的端到端軟體任務,同時還能對自身程式碼進行驗證。除了Gemini 3 Pro,Google Antigravity還將結合Google最新的Gemini 2.5 Computer Use模型,以及圖像編輯模型Nano Banana。GoogleAntigravity借助Gemini 3,為航班追蹤應用打造了端到端的Agent工作流。該Agent能夠自主規劃、編寫應用程式碼,並通過基於瀏覽器的電腦操作來驗證其執行效果。最後Google還提到,Gemini 3是其迄今為止最安全的模型,並且經歷了GoogleAI模型中最全面的安全評估。模型評測結果顯示,其諂媚行為減少,對即時注射的抵抗力增強,並提升了對網路攻擊濫用的防護。從2023年12月Gemini模型發佈至今已近兩年:Gemini 1在原生多模態和長上下文窗口上的突破,擴展了可處理資訊的種類以及處理量;Gemini 2可幫助使用者處理更複雜的任務和想法,使Gemini 2.5 Pro的排名在LMArena中領先超過六個月。如今,Google基於Gemini模型的搜尋功能AI Overviews月活使用者達到20億,Gemini應用月活使用者超過6.5億,超過70%的雲端客戶使用GoogleAI功能,1300萬開發者用其生成模型建構了作品。04. 結語:免費開放+性能飆升! Gemini 3攪動大模型競爭格局GoogleGemini 3相比前幾代模型性能大幅提升,可以感知使用者提示詞中的細微線索及複雜問題,還能理解使用者請求的背景和背後意圖,讓使用者用更少的提示獲得所需資訊。Google部落格提到,在Gemini 3發佈的下一個新篇章中,他們將繼續突破智能、Agent和個性化的前沿,讓AI真正惠及所有人。隨著Gemini 3正式亮相,加上Google此次免費開放其使用權限,一場圍繞大模型的新一輪行業競爭已全面打響。 (智東西)
凱文·凱利:5000天後的世界,所有產業都將因科技重塑
01 食品的未來1、未來將是“新生物學的時代”未來將是新生物學的時代,實際上,這個時代已經到來。我們處於一個可以通過生物學轉變命運的時代,我們自身也在不斷地努力適應這種轉變。比如,和食物相關的畜牧業正在發生改變。生物科技的發展趨勢會和今天的電腦科技一樣,得到充分普及。如今可以說全民皆可程式設計,生物科技也將走下殿堂,普通人都可以通過視訊網站自學成才,每個人都可以發明出某個生物科技的工具。到那時,每個人都可以從生物學的角度重塑自己。我們的改變還會福澤子孫,例如發明出使人類遠離疾病的基因治療方法等。2012年,科學家發明出一種全新的基因編輯技術——CRISPR-Cas9。未來的一個世紀,將會有更多的新技術出現在我們的生活中。但是,到了那個時候,我們是否真的可以成為想要成為的任何樣子呢?對這一點我深表懷疑。因為生物科技不可能完成所有的任務,我們還需要其他的技術輔助。當然,最重要的問題是,我們到底想要成為什麼樣子?有時候,社會或許會默許某種大多數人並不能接受的形式。比如,我們是否可以以善的名義對兒童加以改造,相關的論戰勢必無法避免。畢竟,這是一個比是否應該允許墮胎更難以做出決斷的問題。“訂製嬰兒”很難被人們接受,但這肯定不是新時代唯一的難題,必然會有大量同樣棘手的問題隨著科技發展湧現出來。甚至我們提到的人造肉也可能產生新的問題。例如我們是否可以隨意改變物種,我們究竟是應該分別製作出豬肉和牛肉後將其混合,還是製作出兼具兩者基因的人造肉?我們是否可以改良出“無腿雞”,只讓它蹲坐在雞舍裡?在未來的100年間,還會出現無數這樣無解的問題。2、農場會變成AI 和機器人活躍的場所關於農業和科技相結合的農業科技,我也想簡單說一下我的看法。通常來說,農業這個古老的領域受科技的影響並不如其他領域明顯,我現在認為未來對農業影響最大的應該是AI和機器人。這幾年出現了名為“精密農業”的新型農業。例如在拖拉機上搭載AI技術,在長臂上裝上攝影機,幫助農民管理生菜或玉米地。拖拉機在菜地內往返,這些攝影機可以同時監控25英畝的菜地。而且,因為安裝了GPS(全球定位系統),我們還可以獲得精確的位置坐標。攝影機可以觀測附近作物的情況,評估其健康程度,並依據這些資訊提供必要的水、肥料以及殺蟲劑。這種監控和管理可以精確到植株,控制每棵莊稼或蔬菜的水肥量,因此能夠避免浪費。從古至今,農民都希望能夠做到按需澆水施肥,只是從來沒有一種技術可以幫助他們實現這個想法。“精密農業”的卓越之處在於可以同時管理數百萬的作物,並且精準到每個植株。古老的農業在AI和機器人的幫助下煥發生機。通過“精密農業”,農民可以將肥料和資源的浪費控制到最小,而作物的整體狀態可以保持到最佳。新技術徹底改變了農耕方式。這項技術在現實中已經開始得到應用。而到了收穫的環節,機器人就要發揮作用了。採摘草莓之類的工作非常辛苦,如果想要大面積、大規模採摘,機器人就是很好的選擇。我們現在已經開發出自動駕駛拖拉機,可以利用GPS使其完成自動駕駛。未來我們還會發明出新型機器人,可以在大型農場裡完成收割、採摘、播種等工作。02 交通的未來1、2040年後自動駕駛將成為主流矽谷在未來勢必會引領自動駕駛汽車的新潮流。雖然我們已經研發出自動駕駛技術,但需要完全實現自動駕駛至少還需要10年的時間。這個周期會比我們想像得更久,而且會分階段完成。例如,先在高速公路上設定專用車道,或者從長途貨運卡車開始應用自動駕駛技術,還可以在停車場使用自動泊車功能。再進一步,就是在馬路上設定自動駕駛專用車道,然後逐步推廣。不過,在全面普及自動駕駛汽車之前,我們還需要先完成一些極其重要的事情。當駕駛完成從有人到無人的改變時,基礎設施也需要同步改變。無論是道路標識還是交通訊號燈,都要重新調整為適應自動駕駛的模式。我們現有的交通設施從駕駛員的角度出發,已經發展到了非常合理的水平,但是並不適用於自動駕駛。在起步階段,我們不得不允許兩種模式同時存在。其實,相比於全面改換為單一的自動駕駛模式,同時保持兩種模式更加困難。不僅汽車需要改變,迄今為止我們所有的標識、習慣、車輛與行人的共存模式都要發生很多變化,這個過程至少要花費幾十年。當駕駛員被區分為人類和機器人時,兩者在優勢上就會存在一種此消彼長的傾向,也就容易發生搶奪優勢地位的問題。因此,我們必須要在保證自動駕駛技術得到運用的同時,解決好各種相關的複雜問題。由於自動駕駛技術普及的最大障礙就是兩種駕駛員群體共同存在這一事實。我們不能滿足於99%的安全性,必須追求99.9999%的精準。安全性達到98%不是一件困難的事情,但是越往後越困難,想要完成最後不足2%的突破可以說是舉步維艱。大路修整之後,所有背街小巷也要整改。最後的部分難度最大、耗時最久。而且,我們要預測自動駕駛汽車也會發生擁堵在一起、進退不得的情況。我們需要對此做好充分的預案。因為當交通堵塞時,人類駕駛員也會找不到騰挪的辦法,也會心情煩躁,甚至怒不可遏。人類尚且無法應對此類突發現象,機器人又該如何呢?如何在類似的情況下確保車輛和乘客的安全,如何最大限度地做到萬無一失,都是我們必須提前考慮的難題。2、無人機前景廣闊與飛行汽車不同,小型無人機已經開始被應用於生活中了。亞馬遜也在考慮使用無人機完成配送。無人機送貨是否可以完全替代人工,這一點還不能判斷,但是今後無人機勢必會在更廣泛的領域裡為我們的生活提供便利。盧安達已經開始使用無人機配送藥物。因為在盧安達道路建設還很落後,很多地區甚至沒有路。為了將藥物和其他重要物資快速穩妥地送達指定地點,人們啟用了無人機,而且效果很好。在我們這些基礎建設做得很到位的國家,日常生活中可能並沒有使用無人機的必要。再過25年或30年,商業飛機很可能也要改為自動駕駛。一架沒有飛行員的飛機,從某種意義上說豈非就是無人機的延伸?我們將看到在貨物運輸領域出現無人機。不僅如此,搭載乘客的無人機也會出現在未來的天空中。客機最大的成本就是飛行員等機組成員的人工費。其實現在的商業客機已經採用AI技術進行自動駕駛,同時有飛行員保駕護航,只是為了預防發生意外情況。飛機起降也都由自動駕駛系統完成,基本可以實現全程無人。這樣一來,是不是可以認為安裝了自動駕駛系統的飛機就不再需要飛行員,同樣搭載AI的貨車也就不再需要司機了呢?暫時還不用擔心駕駛員全體失業,因為長途飛行或運輸還是需要有飛行員或駕駛員搭乘。舉例來說,當長途貨運車進入波士頓這樣交通狀況複雜的大城市時,司機就顯得非常重要了。在其他時間段,司機可以待在開著空調的車內,做一些自己想做的工作,甚至是做做程式設計。未來駕駛員可能就是一種兼職工作。駕駛員在不需要人工駕駛的時候可以做其他事情,有需要時就像急診醫生一樣隨叫隨到即可。我們要好好計畫一下,未來在不需要自己駕駛汽車後,車上的時間應該怎麼利用起來。我們可以戴上智能頭盔在虛擬的世界裡盡情遨遊,或是戴上智能眼鏡看看別處的風景。總之,車內的時間都可以交給VR和AR,讓科技帶給我們更多的樂趣。我猜想未來車內的通訊環境會比家中還要好。屆時到處都有5G網路覆蓋,機器人駕駛時會使用最大的頻寬。03 能源的未來1、依靠電力實現低碳生活我曾經採訪過研究全球變暖、可持續發展技術、能源問題的專家,就現在美國的能源消費請教了他的觀點。他說美國政府一直在監查全國的能源系統和消費情況,並致力於減少碳排放,取代天然氣和煤炭等資源,更多地使用風力、太陽能和核能發電,讓汽車、暖氣、采暖熱泵、電動機、無人機等均以電力作為能源。如果這些領域全部實現電氣化,那麼即便使用同樣多的能源,我們的實際消耗也不到現在的一半。例如,石油運輸需要大型油輪和輸油管道,也就是說,我們需要花費大量的能源來輸送能源。但是電力就不需要這麼多過程,它是一種高效且低價的能源。汽車的電發動機會比汽油發動機更高效,采暖熱泵也會比暖爐更高效。如果所有的能源均轉換為電力,我們就可以在保證現有生活模式不改變的前提下減少一半的能源消費量。我的一位合作者索爾·格里菲斯著有《電氣化》(Electrify)這本書,我還為這本書寫過推薦文章。這本書的主旨是所有的能源都應該由電能取代,只要實現全面電氣化就可以防止全球變暖。他呼籲利用太陽能、風能、水能和核能發電,無論是家裡的空調,還是包含飛機在內的交通工具,維護現有文明的一切事物,都應該實現全面電氣化。只要做到這一點,就可以在很大程度上解決環境問題。2、未來五年是電動汽車的黃金期電動汽車是相當優秀的新產品,普及也很快,大有取代傳統汽車的勢頭。目前充電站的數量還有些少,但也在不斷增加。再過五年,估計大部分新上市的汽車就都是電動汽車了。福特汽車公司生產的卡車數量比普通轎車多,其中最有名的要數F-150這款卡車。就在不久前,福特公司宣佈將生產這款車的電動版。如果電動汽車越來越普及,那麼還有誰會去加油站呢?在油價上漲的今天,普通家庭動輒就要在加油站消費數百美元。電動汽車普及後,充電站和家庭電力系統等都會發生相應的改變。我有一輛小型的電動汽車,但這是我迄今為止開過的最好開的車,它性能良好,加速快,駕乘體驗好。這輛車很便宜,而且我這幾年在汽油上面也省下不少。我相信低碳減排會成為主流。儘管汽油價格可能降低,儘管風力發電、太陽能發電和核電技術還不夠成熟,但是我相信這些技術終將成為解決環境問題的重要手段。04 教育的未來1、教育因AR和VR產生巨變我一直認為視訊網站非常適合進行教學活動。不過,這種形式還屬於比較初級的階段,如果AR眼鏡等智能裝備得到普及,視訊網站就能實現和在教室中一樣的教學效果。此外,視訊搭配AR和VR,能夠形成強有力的學習媒介組合。一個人想學習操作時,只要看視訊模仿別人的動作即可;想要學習化學的時候,自己就可以製作分子模型,可以在模型裡面走走看看,也可以把模型拎起來轉一轉。即使不是自己動手,所有的實驗也都可以近在眼前。這才是最強大的學習媒介啊!等到了人人都擁有智能眼鏡的時候,每個人都可以把自己的知識分享出去,打造線上課程。這樣的形式也會激發人們的學習熱情和學習興趣,更容易堅持下去。由Google的彼得·諾維格和史丹佛大學的塞巴斯蒂安·史朗等知名研究者主持的線上AI講座,吸引了全球10萬以上的學習者,受到眾多人的關注。如果使用自動翻譯功能,那麼語言也不再是障礙,使用任何語言的學習者都可以輕鬆參與。在此基礎上,如果再使用AR或VR技術,我們就可以模擬實際情景,擁有實際的體驗。這樣的組合將會成為強有力的教育工具,甚至可以承擔大學的普通教學任務。很多公司都將運用AR的這一功能進行員工培訓。如果在新員工的入職培訓中也加入這個環節,就會產生一個巨大的教育市場。在培訓中,公司可能還需要購買配套的微軟開發的智能眼鏡(Hololens2),這又是一個市場。2、機器翻譯改變世界AI自動翻譯技術如果能達到同聲傳譯的水平,世界會發生什麼變化呢?首先,商務活動和旅遊活動都會發生極大的變革。人們無須學習英語,苦練對話,只要戴上耳機就可以在美國旅行,而且無論在那裡都能做到和當地人無障礙交流。這樣一來,每個人都可以輕鬆接受更多的挑戰。設想一下,一個只會日語的人,也能沒有顧慮地前往只說俄語的地方,這將是一件多麼令人欣喜的事情。如果在任何地方都可以使用即時翻譯裝置,旅行者的足跡將會遍佈世界。這件事情的意義非同尋常,人們可以走出自己的文化圈,去接觸和擁抱不同的文化。我一直認為政府有必要鼓勵年輕人出門旅行,甚至應該為此設立援助資金和機構,甚至要求每個國民都完成為期兩年的旅行任務也不為過。無論男女,也無論是否身體上有殘疾,人人都應該在高中畢業後,在18歲之後的兩年裡拿出專門的時間去旅行。服兵役、做醫療援助、從事教育工作,甚至前往海外參加維和運動等,都是很好的選擇。如果政府可以拿出專款進行資助,那麼這將是一件使所有人受益的事情。美國人會因此結交海外友人,並且學會瞭解和接受不一樣的價值觀。一個人無論多大年紀,都可以通過旅行豐富自己,這時我們迫切需要的就是一個語音翻譯裝置。它可以讓人們展開超越國界和種族的交流,同時也可以幫人們在世界範圍內尋找工作的機會。由於自動翻譯機的出現,世界上優秀的人才會聚集起來,對世界經濟的發展也能起到推動作用。矽谷一直渴求優秀的人才,我女兒所在的公司位於舊金山,為了吸引人才甚至會獎勵介紹人才來公司就職的員工一萬美元。因為公司之間為了爭奪人才的競爭極其激烈,所以招兵買馬並不是一件易事。程式設計師、精算師、對於某一特定領域極其精通的法律顧問、智慧財產權律師等,都是公司急需的人才。如果將人才市場擴大到全球,那麼不會說英語的人也可以通過遠端辦公完成工作。那該有多棒呀!自動翻譯機可以解決與人溝通交流的問題,VR可以讓每個人在工作時都身處同一個環境,與以往相比,人與人之間的合作能夠更加深入,協作感和共情能力也會更強。人類的文明不就是這樣一點點發展到今天的嗎?從早期的人類社會開始,人們學會了合作和交流。在狩獵採集社會,人們形成了部落,並逐步發展為農耕社會。這之後誕生了城市,在協作與互助的基礎上,科學和知識得到了發展。新的科技將會進一步增強人們的共情能力,也會讓溝通更為有效。人類通過不斷的發展和前進,終將成為更好的自己。 (總裁讀書會)
庫克聽勸了!“蘋果全家桶”將牙膏擠爆,史上最薄iPhone上架
一年一度的“科技春晚”,庫克帶著2025年“蘋果全家桶”亮相。4款iPhone,3塊Apple Watch以及一款新的AirPods耳機,這是今年的全部新品。先聊大家最關注的四件事:手機價格、最薄iPhone、eSIM和Apple Intelligence:手機價格方面:起售價格不變(依舊是5999元),但誠意滿滿,最低儲存配置為256GB,而iPhone 16的同價格產品僅128GB;史上最“薄”iPhone:iPhone Air沒有跳票,僅5.6mm厚,外觀和手感都非常驚豔;eSIM情況:中國大陸僅iPhone Air一款產品可使用eSIM功能,且目前僅中國聯通一家營運商支援(全球產品的eSIM支援情況根據不同地區和版本而異);Apple Intelligence:發佈會未明確,大陸依舊有可能不會隨發售上線,需等後續推送;和近兩年一樣,這次蘋果發佈會在各種劇透下,又成了一次“開卷考試”,而發佈會也是提前錄製好的視訊,缺少了現場直播的“驚喜感”。好在今年 iPhone 17 系列帶來了肉眼可見的外觀突破——超薄設計的 Air、電池容量升級的Pro,終於讓人感覺到,蘋果停滯許久的創新齒輪,重新緩緩轉動起來。過去幾年的秋季發佈會總少不了行業內“創新不足”、“沒有了賈伯斯的靈魂”這類評價。今年,這種評價也許能稍微少一點了。01 iPhone 17系列“超薄”的Air、有“相機島”的Pro、基礎款加量不加價今天蘋果算是把牙膏擠爆了,而且還加量不加價。先說價格,全系iPhone的國行版起售價格分別為5999元、7999元、8999元和9999元,其中iPhone 17的價格比較有誠意,依舊是5999元起,但是配置從上一代的128GB,擴容到了256GB。價格最貴的iPhone 17 Pro Max,由於增加了2TB版本,堪稱至尊版,但價格也拉到了17999元,屬於蘋果“史上最貴的iPhone”。可以看到,今年的iPhone系列儲存容量是256GB起,128GB配置已經全部取消了。2007-2024 歷年iPhone產品線外觀對比iPhone的設計語言已延續近二十年,讚譽者稱其擁有經典的家族式設計,批評者則認為其創新遲緩、“一套設計用了二十年”。最新發佈的iPhone 17系列,在延續品牌辨識度的同時,實現了蘋果歷史上一次顯著的設計突破。蒂姆·庫克將其定義為“iPhone 歷史上最大的飛躍” 和 “極具開創性的產品” ,強調它在技術、美學和體驗上的全面革新。/ iPhone Air看點:史上最薄iPhone今年iPhone“全家桶”取消了Plus,新加入Air產品線,主打輕薄設計,總共四種顏色版本,還提供了掛繩。6.5英吋屏、機身5.6mm厚,刷新iPhone 6的6.9mm紀錄,可以說是“史上最薄iPhone”。材質方面,Pro系列換了鋁合金,到了Air這裡又繼續保留了鈦合金——80%以上航空級再生鈦金屬,理論上應該是搭配超薄設計,提升機身的堅固性。另外,兩面都有超瓷晶面板,抗摔性能提升4倍。機身後蓋部分,iPhone Air同樣採用了橫向延伸的DECO(鏡頭模組區),但因為只有單鏡頭,DECO變得更窄了。除了全系1800萬像素的前攝外,後置4800萬像素攝影機,通過計算實現1200萬像素2倍長焦。受厚度限制,內部空間本就捉襟見肘,電池容量就會受到限制,蘋果標稱Air同樣能達到“全天候”續航。想延長續航也不是不可以,買一塊官方的Magsafe電池包外殼後,可支援40小時續航。你看,這又來一個賺錢的生意。還有一點值得關注,超薄設計使得iPhone Air放棄了SIM卡槽,以eSIM替代。在中國大陸,目前僅中國聯通一家營運商支援eSIM,且需要去線下門店開通。性能部分,iPhone Air 雖然搭載了A19 Pro晶片,但其 GPU 核心數為5核(iPhone 17 Pro 系列為6核)。用晶片負責人Tim Millet的話說,這是“在 iPhone 中實現了 MacBook Pro 等級的計算能力。”除了A19 Pro外,iPhone Air還搭載了自研N1無線晶片(iPhone 17全系支援)和C1基帶,如果訊號穩定,那蘋果和高通相關合作就“到頭”了。/ iPhone 17看點:120Hz ProMotion高刷,續航更強標準版iPhone 17,外觀真看不出變化,一共五種顏色版本,採用鋁合金,但在硬體上做了一系列提升。最值得關注的是120Hz的ProMotion自適應高刷屏,要知道過去這是Pro系列的獨享,並且還搭配第二代超瓷晶面板,防刮能力增強。由於不是主打拍攝的型號,後置鏡頭小幅提升,但前攝用了一顆1800萬像素方形大底,支援橫、豎等四種比例照片拍攝,FaceTime視訊通話也做了特殊適配,自動居中人物,並且引入了前後置攝影機同步拍攝的能力。前後置攝影機同步拍攝iPhone 17也搭載了6核CPU+5核心GPU的A19晶片,圖像能力比前代晶片提升20%,相比搭載A16的iPhone 15,CPU和GPU性能分別提升了40%和80%。續航能力上,影片播放30小時,比上一代能多支撐8小時,搭配蘋果40W動態電源介面卡 (最高 60W)快充,可以實現20分鐘充電50%,充電10分鐘就能看8小時視訊。關於去年的主角Apple Intelligence,這次戲份不多,在介紹的時候只是提了視覺搜尋(AI拍照提問)、視訊通話即時翻譯等。至於大陸何時上線,發佈會並未明確。國行官網標註(硬體)“為Apple 智能預備好”/ iPhone 17 Pro看點:“增肥”+“背影殺”iPhone 17 Pro系列在外觀上最大變化是顏色,其中橙色的視覺衝擊性最強,可以立刻讓身邊的人知道你換了新的iPhone。設計上的改變主要在背面,雖保持“三眼設計”,但DECO橫向延伸成了一座“相機島”,閃光燈、雷射雷達掃描器在最右側,四周環繞一圈高性能天線。拍攝作為Pro系列的重點,升級比較明顯,三顆鏡頭全部為4800萬像素(4800萬像素四反射直立式棱鏡長焦+4800萬像素廣角+4800萬像素主攝影機)。長焦鏡頭支援8倍光學變焦和40倍數位變焦,前置鏡頭和標準版一樣,同樣升級至1800萬像素。專業攝像功能升級,最高支援4K 120fps,提供ProRes Raw 格式拍攝更適合專業攝像者。支援GenLock,可以有更多機位精準的轉場對齊。iPhone 17 Pro組成的“子彈時間”拍攝系統iPhone 17 Pro材質從之前的鈦合金,替換成了鋁合金,並且採用了陽極氧化鋁工藝,後蓋除了DECO是玻璃外,無線充電部還切出了一塊,貼上了超瓷晶面板。換鋁合金材質,核心考慮的還是導熱性,而且為了散熱,導熱性要比鈦合金高20倍,蘋果在Pro系列上,還引入了全新的VC均熱板(內部注有去離子水),提升散熱性能。iPhone 17 Pro的VC均熱板效果演示不過,提醒大家——換成鋁合金材質,機身更容易彎折變形,這個可以參照早期的iPhone 6“彎曲門”。內部結構調整,帶來電池容量增加(史上最大電池),eSIM版本還能額外多給2個小時續航,達到39小時影片播放,但是這也間接導致機身增肥了。相比iPhone 17的A19,Pro系列的晶片升級至了A19 Pro,6核心CPU+6核心 GPU,性能比上一代提升40%。以下是iPhone全系列的核心配置:02 Apple Watch系列Series 11、Ultra小改動,SE 3“青春版”長大了Apple Watch問世至今已有10年時間,Counterpoint報告顯示,Apple Watch過去十年貢獻了1000億美元的營收。過去這10年,如果說iPhone外觀還有些微小的變化,Apple Watch的外觀改動則趨近於0。但這一次,也有一些小驚喜。/ Apple Watch看點:全系快充、5G,續航提升外觀上看,這一代Series 11手錶也沒有大變化。反正外觀也不是重點,庫克一開場就說,“最喜歡它的提醒功能”,然後用一個很長的短片展示了它拯救各種生命的記錄。Series 11採用了峰值亮度 2000 nits的1.96英吋螢幕,輕薄度增加,號稱是“系列最薄”Apple Watch,螢幕採用Ion-X玻璃,防刮性能提升兩倍。Series 11的晶片更新為S10晶片,還支援5G網路。Series 11的機身配色有七種,再生鋁材質有曜黑、太空灰、玫瑰金和銀色四種,拋光鈦金屬材質的則有天然色、金色和灰板色三種版本。Series11 全家福健康方面,在耳機都配備了心率測試的情況下,Watch探索的更進一步的功能是測血壓。通過新配置的光學心率感測器Apple Watch現在可以通過30天周期的演算法監測高血壓,識別後會向使用者傳送通知,首批支援150個國家和地區。高血壓提示睡眠分析也有了升級,現Apple Watch可以觀測到不同的睡眠周期,並給你的睡眠打個分數。但這個基本是其他同類型產品的基礎操作了。睡眠也要跑分了運動方面基本沒有更新,今年,Apple Watch健康和運動這個主力殺招確實有點更新乏力。上了5G網路,毫無疑問會削減續航,但更新版本的蜂窩網路又能減少電量消耗。兩相抵消之後,Series 11電池續航將“最多可達 24 小時”。不能說雞肋,但由於不是標準C口充電,一天一充確實還挺麻煩。但這次新更新的快充,充電速度比前代提升了兩倍,至少一天一充時候能快點。Ultra這個系列去年沒有更新,今年上了Ultra 3,也換上了全新的S10晶片,同樣支援5G網路。此外,縮小了邊框的Ultra 3擁有該系列最大的螢幕。Apple Watch Ultra 3 官方渲染圖另外,由於Ultra 3電池容量更大,續航相對Series 11要長一些,達到了42小時,總算可以兩天一充了,也是兩倍速度快充。Watch SE 這條產品線初代產品2020年上市,基本保持2年更新一次的節奏。在Series 11和Ultra 3略顯乏力的今年,SE 3卻意外的有些驚喜,功能下放的有點多。Apple Watch SE 3 官方渲染圖另外兩款手錶有的S10晶片、Always-On display、5G、2倍快充這些功能點和配置,SE 3全都有,健康方面還增加了跌倒檢測和睡眠呼吸暫停檢測及睡眠評分、排卵周期估算,還新增了溫度測試,可通過揚聲器播放音樂和播客。相比於Series 11,SE 3目前所有功能裡只缺少心電圖(EKG)和血氧感測器了。越來越多的功能,和普通版越來越小的差距,就等於越來越高的性價比。從功能上來看,三款手錶各有差異,基本的睡眠、心率、心律等檢測都有,但不確定多少人真的會去查看、跟蹤Apple Watch的監測資料。售價方面,全系無變化,SE 3售價1999元起 ,Series 11 2999元起,Ultra 3 6499元起。以下是Apple Watch全系列的核心配置:03 AirPods Pro 3用“即時翻譯”和“健康監測”,讓耳機躍遷到智能耳機過去蘋果的智能穿戴裝置主打是手錶,突出健康檢測能力和智能輔助能力。但今年,耳機也要來分這杯羹了。面對著各種AI耳機氾濫,蘋果這次也要把耳機“智能化”。首先,AirPods Pro 3的外觀和材質上做了設計微調,它採用了新的多孔聲學結構,相比前一代產品略微變小,也更貼合耳型。IP57級的防水功能也對運動使用者更友好。多孔聲學結構其次,AirPods Pro 3的主動降噪被蘋果稱為“世界第一”,其效果達到前代的兩倍。除此之外,它還提升了音質,擴大了聲場,能夠對人聲、器樂有更清晰的處理。AirPods Pro 3的續航性能也得到了提升,一次充電降噪的使用時間從6小時提升到8小時,通透模式可達10小時。最重頭的智能化上,蘋果推出了AI“即時翻譯”的能力。雖然這個功能的想法並不新穎,但蘋果的實現相當巧妙。一個手勢,就能讓AirPods Pro 3在通透模式下直接通過音訊把翻譯播放給你聽。同時,你對著它說話,就可以在手機上給對方顯示翻譯後的結果。當雙方都有AirPods Pro 3時,戴上耳機兩個人就可以實現跨語種即時同傳。蘋果宣傳片中展示的翻譯場景蘋果把Powerbeats Pro 2的心率檢測功能平移給了AirPods Pro 3,在融合了蘋果史上最小的LED光感測器後,它現在可以計算使用者的心率和卡路里消耗,健康、運動都可以用到。這是一種定製的光電容積描記(PPG)感測器,“以每秒 256 次脈衝發出不可見的紅外光以測量血流中的光吸收”。LED光感測器AirPods Pro 3 售價加量不加價,與上一代相同,依舊是1899元。04 沒有One More Thing老蘋果、老庫克,需要新故事當 2025 年蘋果秋季發佈會的錄製視訊落幕,沒有 “One More Thing” 的彩蛋,也沒有足以重構行業的顛覆性技術,但這場 “科技春晚” 依然交出了一份足夠紮實的答卷——從 5.6mm 厚的 iPhone Air 打破機身厚度紀錄,到 AirPods Pro 3 把 “即時翻譯” 裝進耳機,再到 Apple Watch SE 3 將更多旗艦功能下放到入門款,蘋果終於在 “擠牙膏” 的爭議中,讓創新的痕跡變得肉眼可見。當庫克口中 “iPhone 歷史上最大的飛躍”,最終落地為 “更薄的機身”“更大的電池”“更強的鏡頭”,我們依然會懷念賈伯斯時代那種 “重新定義產品” 的魄力。成立近 49 年的蘋果,早已不是那個需要靠顛覆證明自己的初創公司,“穩” 成為它的核心戰略 —— 但在 AI 耳機、摺疊屏、更激進的智能穿戴裝置紛紛湧現的當下,這場 “穩進式” 迭代,或許也在提醒蘋果:消費者對 “驚喜” 的期待,從來沒有停下腳步。2025 年的 “蘋果全家桶”,是一次合格的升級,卻未必是讓人尖叫的突破。 (騰訊科技)
【WWDC2025】蘋果的諾基亞時刻:庫克如何避免兆帝國沉沒?
一、中國危局:蘋果的定價權崩塌與AI救贖北京三里屯Apple Store的玻璃幕牆依然光潔如新,但店內景像已今非昔比。2024年聖誕季,華為摺疊屏手機佔據34%中國高端市場份額,蘋果份額縮水至55%。為挽回頹勢,庫克祭出史無前例的降價策略:iPhone 16全系官方降價幅度達12-18%,基礎款實際售價跌破5000元心理關口。價格戰背後是產品力優勢的消融。當中國使用者習慣AI美顏、應用雙開時,蘋果直到2018年才從中國市場“學會”雙卡雙待功能。庫克曾坦言:“中國直接擁抱移動網際網路,沒有桌面時代的包袱” ,這種跳躍式發展催生了二維碼支付等獨特需求。面對本土化困局,蘋果正押注AI破局:A18晶片多核性能飆升27%,神經網路引擎專為圖像生成最佳化秘密接洽中國大模型企業,擬將本地AI服務深度整合至iOSWWDC2025推出即時翻譯功能,支援中文等37種語言即時互譯這些舉措直指中國使用者的痛點。上海消費者調研顯示,67%使用者將“AI功能不足”列為換機主因。庫克能否用技術奪回市場,今年秋季的iPhone 17系列將成為試金石。二、產品線革命:摺疊屏與雙發策略的豪賭“我們的產品路線圖是有史以來最具野心的。”蘋果硬體主管約翰·特納斯在內部備忘錄中的宣言,如今正演變為一場產品革命。據供應鏈爆料,蘋果將從2026年起實施三大變革:顛覆發佈節奏:新機分春秋兩季上市,2月推入門款,9月發旗艦摺疊屏破局:2026年秋季首推摺疊機型,2027年迭代升級產品線分層:Pro系列邁向真全螢幕,Air系列主打輕薄設計這場豪賭源於中國市場的警示。Android陣營上半年新機潮吞噬蘋果30%暑期份額,庫克不得不縮短產品空窗期。更嚴峻的是,Pro系列銷量佔比從2021年的35%升至2024年的61%,中端市場出現真空。摺疊屏成為關鍵戰場。三星Galaxy Z Fold6在華預售量破百萬,而蘋果內部檔案顯示:摺疊iPhone工程機厚度僅8.2mm,鉸鏈壽命突破40萬次。這場遲來的進擊,將決定蘋果能否奪回創新話語權。三、供應鏈暗戰:庫克的白宮博弈術川普的關稅威脅絕非虛張聲勢。2025年5月,其發言人勞拉·盧默在社交媒體喊話:“快醒醒吧,庫克”,將蘋果推上貿易戰前線。但庫克深諳政治博弈之道——一周內三赴白宮,提出折中方案:轉移整機組裝:印度產iPhone佔比從12%提升至25%本土化晶片製造:德州工廠量產M4晶片,保障AI伺服器產能供應鏈“雙軌制”:核心元件保留中國供應商,規避關稅制裁這種精妙的平衡術源自製造成本鐵律。分析師測算,全美製造的iPhone售價將突破3000美元,相當於現款頂配機型溢價40%。庫克向華爾街保證:“多元供應鏈能將關稅影響控制在6%以內”。四、AI生死戰:WWDC2025的隱秘防線6月10日的開發者大會,成為蘋果AI戰略的諾曼底登陸。當OpenAI聯合艾維打造“iPhone終結者”的消息震動業界,庫克在《連線》專訪中亮出底牌:“經典蘋果策略是進入混亂的新領域,然後讓技術變得親切性感” 。WWDC2025的防禦工事已悄然構築:AirPods即時翻譯:裝置端運行免雲依賴,隱私性碾壓競品統一作業系統OS 26:打通iOS/macOS/visionOS生態牆開發者AI工具包:開放CoreML框架,激發應用創新硬體協同構成關鍵優勢。M4晶片神經引擎達38兆次/秒運算,能耗卻降半。這讓裝置端運行大模型成為可能,庫克強調:“我們拒絕在隱私與智能間做取捨”。更隱秘的殺招在資本層面。蘋果手握1330億美元現金,正瞄準兩大收購目標:Anthropic(估值615億) :替代Google搜尋的備選方案Perplexity(估值140億) :強化Siri語義理解能力這些佈局直指蘋果的AI軟肋。內部測試顯示,Siri複雜指令理解正確率僅71%,遠低於Gemini的89%。庫克需要證明,蘋果依然能後來居上。五、庫克的遺產:凡人CEO與創新魔咒賈伯斯劇院後台,庫克曾向中國記者吐露心聲:“你無法做到所有事情” 。這位以供應鏈管理見長的CEO,正面臨與諾基亞末路截然不同的挑戰——不是技術落後,而是生態顛覆。2012年諾基亞轉攻中端市場時,單季智慧型手機份額從38.3%驟降至32.7% 。而今蘋果份額雖遭蠶食,但服務業務毛利率高達70%,構成護城河。庫克的真正難題在於:如何讓20億終端使用者相信,蘋果仍是未來科技的載體。環保戰略成為差異化王牌。iPhone 16系列採用100%再生鈷電池,包裝塑料清零,產品碳足跡削減30%。“我們對產品的整個生命周期負責”,這份宣言正在轉化為ESG評級優勢。庫克的管理哲學也在重塑蘋果。相比賈伯斯“暴君式”決策,他更傾向團隊協作:午餐時與員工同桌,主動和解與HTC的專利戰,甚至在北京地鐵與果粉攀談。這種開放姿態,或許才是穿越創新迷霧的羅盤。 (視界的剖析)
前華為員工創業AI翻譯耳機,拿下全球第一,年收入2億
2016年,前華為工程師團隊錨定語言服務賽道,以5秒極速翻譯延遲與90分貝降噪技術攻克跨國溝通痛點;2023年登頂美國亞馬遜翻譯裝置銷冠,服務網路遍及170個國家和地區……中國硬體品牌如何以“自然對話邏輯+垂直場景深耕”,在AI翻譯紅海築起技術護城河?基於此,我們與時空壺CMO吳衛兵聊了聊。時空壺創始人田力決定創業,是在他母親的一次意外後。2015年,田力父母決定去歐洲旅遊。出發前,田力的媽媽下載了滿屏翻譯軟體,田力還專門給老兩口準備了翻譯機。到了國外,翻譯機出乎意料地難用,簡單地買瓶水都要等機器反應很長時間。旅途行至瑞士法語區的一座高山時,意外發生了。語言問題變得生死攸關。田力的母親感覺身體不太對勁,頭疼乏力,疑似高原反應。兩人匆忙趕往當地醫院,卻發現居然完全無法交流。面對急診護士,老兩口對著翻譯機急促說話,卻因語速過快導致翻譯結果支離破碎。當老兩口沒辦法,用手拚命比劃時,護士又在埋頭研究翻譯機。很多時候,中文和法語你來我往,彼此聽不懂一句話。一段焦灼的語言真空帶就這樣橫亙在生死時刻。他們又花了些時間,終於把握到翻譯機的節奏,必須放慢語速、逐字吐詞,這才勉強能交流。當聽父母說起這件事,田力一瞬間脊背發涼:如果母親不是高反而是更嚴重的疾病,是否已經發生不可挽回的後果?他對跨語言溝通障礙並不陌生,此前的商務溝通中一些商務談判經常用到翻譯軟體。彼時他沒想過自己去改變現狀。離開華為後,他到了一家機器人公司,主導硬體開發。想過創業,卻沒看到什麼機會。父母在歐洲的經歷算是給他一種啟發。根據世界衛生組織資料,全球超過10億人因語言障礙無法自由溝通。從手持翻譯機到手機APP,傳統解決方案始終未能解決“自然對話”的痛點。“吵架時,沒人願意舉著翻譯機來回傳遞。”田力這樣說過。顯然,這是個廣闊而未被滿足的市場。而田力希望能做一款“讓人忘記翻譯存在的裝置”,最貼近他想法的就是入耳式耳機。2016年,田力找到大學同學,聯合幾個工程師,成立時空壺品牌,開始做可穿戴翻譯耳機。他們經歷過產品大失敗、方向的調整,到2020年才推出第一款真正成功的耳機M2,這款產品當年迅速賣出10萬台。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。2024年,時空壺又推出了W4Pro系列,總體營收超過2億元。翻譯硬體是個傳統產品。海外來看,目前市佔全球第二的日本Post主打手持翻譯機Talkmate因技術迭代緩慢逐漸退出市場(已三年未更新產品),而Google、蘋果等大廠則聚焦於AI語音助手與耳機功能整合(如Pixel Buds Pro的即時翻譯),尚未形成規模化硬體。至於國內,市場上主要還是科大訊飛為首的翻譯機。時空壺選擇了AI翻譯耳機這個相對新穎的模式,並做出了技術壁壘。在亞馬遜上,它們是華強北廉價翻譯耳機外唯一的品牌商家,所以即便價格和AirPods相當,也有不錯銷量。當然,時空壺的生意還遠談不上穩定。ChatGPT開啟AI大模型浪潮後,翻譯質量和速度都上了一個台階。如果硬體大廠下場整合,將直接刺入創業公司的領土。終極訴求最初,在田力的認知裡,做翻譯硬體是一個很小的事情,只需要找個軟體外包公司合作就能解決。但隨著不斷地深入,田力發現,想要真正實現跨語言溝通,必須儘可能地還原母語交流時地場景,現有的方案根本無法滿足需求。“使用者要的不是翻譯,是自然對話。”時空壺CMO吳衛兵告訴硬氪。他們經歷了慘痛的教訓才明白這一點。2017年,時空壺首款翻譯耳機WT2 Plus登陸Kickstarter,憑藉“即時翻譯”概念眾籌超百萬美元。但當極客們戴上耳機測試時,反饋卻令人尷尬:對話雙方需嚴格遵循“說完-等待-播放”的節奏,稍有插話就會導致翻譯混亂。“像和機器人對暗號。”一位早期使用者抱怨。2018年,他們又嘗試了一款即插即用裝置,卻因收音缺陷滯銷20萬台,損失上千萬,將公司逼到懸崖邊緣。這次失敗讓團隊徹底轉向耳機品類,並錨定兩大技術痛點:即時性與抗噪能力。傳統翻譯機的序列處理模式(收音-翻譯-播放)導致至少2秒延遲,而藍牙協議的頻寬限制進一步加劇資料擁堵。轉機出現在技術路徑的“暴力拆解”,時空壺團隊將單通道藍牙拆分為四通道(雙耳獨立處理上傳與下載),如同在單車道馬路上強行開闢四條平行車道。“就像在耳機裡建交通樞紐。”吳衛兵形容,“稍有不慎,左右耳資料就會‘撞車’,翻譯結果變成亂碼。”他們花了18個月才最終實現“邊說邊譯”功能,將對話效率提升2倍。抗噪則是另一場硬仗。在東京澀谷的測試中,環境噪音導致翻譯精準率暴跌至70%。時空壺團隊開發出RNNVAD人聲識別演算法,通過聲源方向鎖定與距離感知,過濾90%背景噪音。“我們甚至要求工程師戴著耳機去夜店測試,確保在90分貝環境下仍能精準收音。”吳衛兵說。這項技術讓翻譯精準率在鬧市區提升至93%,酒吧點單、機場問詢等場景得以實現。技術取捨始終是研發過程中的核心挑戰。2021年,團隊為壓縮翻譯延遲,一度簡化演算法校驗流程,卻導致商務場景翻譯精準率下降。某跨境貿易公司反饋,耳機將合同中的“不可抗力條款”誤譯為“無力條款”,引發法律風險。“錯誤翻譯比等待更致命。”吳衛兵在內部復盤會上強調。此後,團隊開始做出調整,日常對話呼叫Google、微軟等六大翻譯引擎,覆蓋通用需求,醫療、法律等垂直領域則建立自己的專用術語庫。據第三方測試報告,在涉及“冠狀動脈搭橋術”等醫學名詞時,時空壺翻譯精準率從通用引擎的76%提升至92%。為平衡專業性與易用性,他們還增設“場景模式”功能——商務談判時採用正式書面語,旅行場景則自動切換為口語化表達。比如,一位經常出差的使用者舉例:“‘Let’s talk tomorrow’在商務模式下譯為‘煩請明日再議’,旅行模式下則是‘明兒再聊’。”在M2推出後,時空壺終於爬出了低谷。他們接著推出M3、W3,熱度越來越高。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。但此時,真正的戰鬥剛剛開始。山寨圍剿,B端破局沒有什麼電子產品,是華強北無法山寨的。當時空壺成為細分品類第一時,深圳華強北的白牌廠商們自然聞風而動,推出“19.9美元AI翻譯耳機”,有的在TikTok用“跨國情侶甜蜜對話”短影片行銷,單月銷量衝到20萬台。這些產品實為公模耳機搭配開源翻譯APP,實測延遲達3秒,退貨率超40%。整個行業都步入晦暗。“山寨機毀掉的是整個品類認知。”吳衛兵苦笑。更棘手的是,低價策略吸引大量首次使用者,他們誤以為“AI翻譯就該這麼便宜”,迫使時空壺投入雙倍預算教育市場。面對山寨機的低價衝擊,時空壺選擇了一條雙軌平行的防禦路線。在C端市場,團隊推出售價1299元的T1新銳版,保留“雙向同傳”核心功能,但將離線語言從40種縮減至13種。“我們像做手機裡的‘青春版’,砍掉非必要功能,但必須守住技術底線。”吳衛兵解釋。這款產品在亞馬遜Prime Day期間沖上翻譯裝置銷量前三,成功攔截下部分價格敏感使用者。B端成了華強北廠商無法觸達的戰場。時空壺的確能拿出過硬的翻譯指標:5秒超低延遲秒與90分貝環境降噪——前者是離線翻譯延遲速度(手機依賴網路延遲),後者是只識別說話者聲音的定向降噪能力(手機麥克風在同等環境精準率不足50%)。技術表現成為企業支付溢價的關鍵。2023年,時空壺萬豪、希爾頓達成合作,將翻譯耳機植入酒店服務體系——外籍旅客入住時可租賃設備,日租金僅為人工翻譯成本的1/10。在深圳盈科律師事務所,律師們甚至將耳機寫進保密協議條款:“客戶對話必須通過我們的裝置,禁止使用第三方翻譯軟體。”吳衛兵回憶。B端使用者對效果極其敏感,時空壺的產品達到了他們的預期。深圳雲杉醫療的護士接待外籍患者時,用他們的耳機後,誤診率下降40%。深圳機場導遊靠耳機對接海外地接社,投訴率下降75%,墨西哥城某教堂用耳機雙語禮拜,信徒首次參與英語聖經討論。“大廠可以複製功能,但軟硬一體化的Know-how需要三年沉澱。”吳衛兵表示。目前時空壺覆蓋40種語言、93種口音,平均精準率超95%,在醫療、法律等專業領域表現尤為突出。他們近六成營收來自亞馬遜,獨立站與線下管道均攤其餘部分,產品覆蓋170個國家。成立以來,他們見證了很多故事。曾有一個美國使用者Christian來感謝他們,他的妻子是委內瑞拉人,日常與妻子和岳父岳母溝通需頻繁使用耳機,他稱“產品拯救了婚姻”;也有日本使用者通過耳機向醫生精準描述了急性闌尾炎症狀。未來三年,行業競爭或將聚焦多模態翻譯(語音、文字、圖像協同)與垂直場景深化。AI大模型的逐漸成熟,也給時空壺這樣的創業公司帶來更多緊迫感。無論如何,當硬體參數競賽趨於白熱化,時空壺的突圍背後,仍是一個樸素的理想:技術的終極價值,在於讓人重新成為人。他們無需學習語言規則,不必適應機器邏輯,只需如本能般開口說話。“說到底,我們不是一家純粹做耳機的公司,而是解決跨語言溝通問題。”吳衛兵說。 (硬氪)