#Veo3 | 熱門關鍵字 | 鉅亨號

-- "你是坐Waymo來的嗎？"-- "我很想，但我們還在確保它們的安全性，讓它們能夠上高速公路。"6月5日，Bloomberg科技峰會現場，資深記者Emily Chang以一個調侃的提問開場，Google CEO Sundar Pichai的回答看似輕鬆卻透露出一絲無奈。這個簡單的問答，就是整場訪談的縮影——Chang每一個問題都綿裡藏針，而Pichai總是用他特有的方式應對：不直接但坦誠，不迴避現實，也不過度承諾。一、第一輪交鋒：搜尋帝國的生死之間AI時代的搜尋，進化還是滅絕？Chang："說實話，我現在更多地在用聊天機器人，用Google搜尋反而少了。也許你也是這樣？在AI智能體和個性化答案的世界裡，搜尋的命運是進化（evolution）還是滅絕（extinction）？"搜尋是Google的核心根基，這個問題直擊要害，Pichai回應："人們問這個問題已經好幾年了。聊天機器人已經擴展到數億使用者，但我們的搜尋查詢量還在增長。這對我來說，遠不是一個零和遊戲。"他接著用了一個絕妙的類比："就像TikTok出現時，每個人都開始用TikTok，但YouTube在那些時刻也增長得非常好。"Pichai沒有否認競爭的存在，反而用事實暗示市場足夠大，容得下多種形式的資訊獲取方式。Google AI Overview：出版商（Publisher）的"悲劇"？Chang追擊："你說AIOverview對出版商有好處，但我們採訪的出版商都說這是悲劇。研究顯示點選率在下降。我甚至都不總是點選，因為你已經在Google上直接回答了我的問題。出版商說他們無法退出，否則可能完全被Google除名。那麼有什麼具體證據表明這對他們真的有好處，而不只是對Google有好處？"Chang不僅質疑了Google的說法，更點出了出版商的困境。對此，Picha回應："與世界上大多數公司相比，我們在設計體驗時格外小心，確保會展示連結。我們花了很長時間測試AI概覽，優先考慮能產生高品質流量輸出的方法。"他接著給出了一個看似有說服力的資料："我們看到人們點選並訪問更多樣化的網站，每次點選平均花費的時間也更長。"但這個回答是否真的令人信服？Chang的作為使用者的行為習慣和一些資料已經讓很多人心中有了答案。二、第二戰：壟斷陰雲下的反擊戰不是壟斷而是使用者自主選擇？Chang直擊痛點："在兩次審判中，法官都說Google在搜尋和部分廣告業務上構成壟斷。你如何回應這樣的擔憂：你的AI建立在對搜尋和廣告的既有主導地位之上，這只是在強化原有的壟斷？"面對這個可能影響公司命運的指控，Pichai異常平靜："首先，我們不同意這些裁決，我們正在上訴這些事情。"他接著用了一個巧妙的論證，"我認為這裡沒有人在使用任何他們不想使用的東西。如果你看看ChatGPT或任何產品的成功，人們比以往任何時候都有更多選擇。人們使用Google是因為他們想要使用它。"這個回答的精妙地將注意力從法律問題轉向了使用者選擇，暗示Google的成功來自使用者的主動選擇，而非壟斷地位。資本遊戲：750億美元的豪賭Chang："投資者都想知道，你在AI上到底砸了多少錢，又從AI賺了多少錢？"Pichai坦然道出了一個驚人的數字："2025年，我們的資本支出是750億美元。"要知道，幾年前Google的資本支出（Capital Expenditure）還只有200億美元。Pichai解釋說，這項投資為從搜尋到YouTube，從雲端運算到Waymo的所有業務提供動力。但當Chang繼續追問具體那些收入流在增長、那些在下降時，Pichai沒有直接回答，而是用例子說明："我們的雲業務中，Vertex AI在令牌使用量上，僅在過去12個月就增長了40倍。"Pichai也進一步說明了面對壟斷指控，仍不希望拆分以影響創新。“我們去年花在研發的費用超過500億美元，我們是頂級研發公司之一。我們花了幾十年時間投資建設Chrome，建設Waymo超過十年，量子計算超過十年。這種規模的研發和創新，只有在我們採取長遠觀點時才有意義。”三、AI革命的人性拷問未來會有一半員工失業嗎？Chang提出了最現實的擔憂："你們現在有超過18萬名員工。未來會是一半嗎？"這個問題涉及AI對就業的衝擊，也是公眾最關心的話題之一，最近各家科技巨頭也都發表了AI對目前工作的影響：祖克柏提到使用AI進行coding，微軟已經有35%的程式碼是由AI完成，而在Google這個比例是25%。對此，Pichai表示，"我預計即使到明年，我們也會在現有工程基礎上繼續增長，因為這讓我們能做更多事情。我把這看作是讓工程師變得極為高效，擺脫他們工作中的瑣碎部分，讓他們更專注於更高價值的任務。"他用歷史資料支撐："今天60%的工作在1940年時根本不存在。"但當Chang提到Anthropic CEO關於“AI可能在五年內淘汰50%白領工作”的預測時，Pichai說：“我認為我們應該非常認真的對待這些擔憂。我尊重那種觀點，表達這些擔憂並進行辯論是很重要的。” 既不否定，也不完全認同——這就是Pichai式的平衡藝術。信任的終極考驗Chang拋出了關係到每個人安全的問題："你們掌握著我們最深層、最黑暗的秘密。現在你們要使用更多這些資訊來整合到更個性化的體驗中。為什麼我們現在要比以往任何時候更信任你？"面對這個關於隱私和信任的終極拷問，Pichai回答："我們通過行動贏得信任。我們已經儲存人們的電子郵件很多年了，但我們負責任地處理這些內容。我們保護它免受惡意行為者的侵害，我們比任何其他公司都更多地對抗無理要求。"Voe3會成為真相的終結者嗎？當談到剛發佈的Veo3視訊生成技術時，Chang拋出了一個深刻的哲學問題：“這些超級逼真的視訊令人震撼，但也真的挺嚇人。這是我們所知的真相的終結嗎？”Pichai詳細介紹了Google的應對措施：“我們正在給視訊加入水印，它們內建了這個功能，所以人們可以檢測出他們是用Voe生成的。你可以上傳任何視訊到Google，詢問這個視訊的情況，它會告訴你是否是用Veo3生成的。我們為研究人員和記者建構了一個真實性檢測器。”Chang進一步追問：“我們還能再有共同的現實感嗎？”Pichai的回答充滿了對人性的信心：“我認為會的。人類作為一個整體，我們會珍視那種共同的現實感。所以在未來，你會更加真實真正的人類體驗。” 這段話也反映了我們在AI時代共同的深層焦慮——當技術能完美模擬現即時，我們如何保持對真相的判斷？Trump政府：妥協還是堅持？Chang：“在Trump的就職典禮上，你坐在前排，Google撤回了一些DEI（diversity多元化、equity公平、inclusion包容）政策，你是否在自己信仰的事情上妥協了？”Geoffrey Hinton曾對於Google在原則上的調整頗有微詞，這個問題讓Pichai處於微妙的境地，“首先，作為領先的美國公司之一，也是全球公司，在AI這個特殊的拐點時刻，未來幾年很關鍵，所以致力於參與其中”。他強調了原則性：“作為一家公司，我們確實有自己的價值觀，我們致力於以保護地球的方式開發AI。這對我們來說是一個重要價值觀。”既展現了實用主義的合作態度，又堅持了核心價值觀的底線。四、傳承與未來的思考下一任CEO什麼樣？Chang問了一個關於傳承的問題：“你已經當了十年CEO了，你認為Google未來的CEO應該是什麼樣的人？”Pichai回答了他對領導力的思考：“我認為重要的是要理解，我們建構的產品對社會產生巨大的影響，而技術發展的歷程，做好艱苦的工作以確保你以有利於人們的方式利用它。這需要大量的工作，我認為這將是一個重要的品質。”孩子應該學什麼？同為家長，Chang拋出了一個令所有家長擔憂的問題：“Google正在向兒童推出Gemini。我已經夠忙於處理更多螢幕時間和社交媒體帶來的育兒問題了。我們的孩子最好的朋友會是聊天機器人嗎？”Pichai的回答既理解家長的擔憂，又展現了對技術進步的樂觀：“新技術總是會帶來不適感。就像網路約會剛出現時，人們會問‘你真的要在網上認識他人嗎？人們會適應這些事情’”。他強調了針對兒童的特殊保護，就像而兒童設計Youtube Kids一樣進行分層保護。面對教育問題，Chang問：“現在的孩子應該學什麼？他們哈應該學程式設計嗎？還應該獲得電腦科學學位嗎？”Pichai的回答充滿了對未來的樂觀：“我認為這個時刻的偉大之處在於，隨著時間的推移，AI將允許我們所有人更多的追求自己的激情。這是很多技術真正解放的方面。你給了每個人一個強大的工具，讓他們以自己想要的方式表達自己。我仍然會鼓勵人們追隨他們的激情，找到他們感興趣的東西。今天有價值的幾乎所有學科，在未來都會有有價值的版本。”五、AGI的終極叩問訪談接近尾聲時，Chang問了一個頗具哲學意味的問題："AI的極限是什麼？我們有可能永遠達不到AGI嗎？"Pichai停頓了一下："完全可能。我們可能會遇到技術曲線上的暫時平台期。那麼我們目前是否在通往AGI的絕對路徑上？我不認為任何人能夠確定地說出來。"他用Waymo的例子說明了技術的複雜性：“Waymo做得非常好。但記住，你可以在大約20小時內教會一個孩子開車。所以技術很神奇，但我們距離AGI還很遠。” Pichai的這種承認不確定性與目前業內過於炒作AGI形成了鮮明的對比。最後的妙問妙答Chang的最後一擊既幽默又深刻："Google 50歲的時候會是什麼樣？會是人類在經營Google，還是AI？"Pichai的回答堪稱完美："我認為無論誰在經營它，都會有一個非凡的AI夥伴。"這個回答既迴避了直接回答，又描繪了一個人機協作的未來圖景。結語：Pichai的"非標準答案"哲學我個人很喜歡Emily Chang的風格，作為Bloomberg Technology的主持人、彭博電視台高級編輯，Emily Chang被稱為矽谷最犀利的“拷問者”，她既不是技術的盲目崇拜者，也不是簡單的批評者，而是站在公眾利益的角度進行理性質疑，擁有著“溫和的外表下的犀利核心”。縱觀整場訪談，Chang提問每一個問題都直擊要害，既有技術細節，又有商業邏輯，還有社會責任的追問。她不滿足於官方說辭，用具體的例子和資料來質疑，迫使Pichai在每一個關鍵議題上給出更實質的回答，而Pichai則以他特有的“非標準答案”哲學，展現了一個成熟領導者在AI紛擾時代的智慧：在技術樂觀主義與社會責任之間尋找平衡：他既推動AI發展，有認真對待社會擔憂；在商業利益與使用者價值之間保持一致：他強調Google的成功來自使用者選擇，而非壟斷地位；在政治現實與價值堅持之間遊走：他既與政府合作，又堅持核心價值觀；在確定性與不確定性之間保持誠實：他承認對AGI等未來技術的不確定性。Pichai沒有給出技術狂熱者式的絕對承諾，也沒有政客式的空洞表態，而是用一種既理性又充滿人文關懷的方式，描述了一個可能的未來途徑。或許，這正是在這個充滿不確定性的時代，我們最需要的品質：在承認不知道的同時，保持繼續探索的勇氣。（image generated by ChatGPT）本文基於Sundar Pichai在Bloomberg科技峰會的最新訪談整理分析。完整視訊：[Alphabet's Pichai on AI, Antitrust Suits, Privacy]，(https://www.youtube.com/watch?v=nsAqQjhEv5Q) (JER學家)

上周，美國AI巨頭接二連三密集發佈重磅產品和戰略，周末整理回顧，有種強烈的感受：年初大家的爭論和關注還在大模型還是蒸餾後的“小模型”，而短短幾個月，AI的競爭已經不僅僅侷限於模型規模和基準測試，而更在於使用者體驗和互動範式的創新，產業競爭格局也或將重新洗牌。引言：AI行業的“超級發佈周”AI領域風起雲湧，全球四大巨頭同一周內密集舉行了重要活動或發佈：Google I/O開發者大會推出革命性視訊生成模型Veo3及Flow平台，Microsoft Build大會提出建構AI代理網路生態，Anthropic的首屆“Code with Claude”會議發佈“全球最強編輯模型”Claude 4，此外，OpenAI與則聯手蘋果前設計總監Jony Ive宣佈一項被稱為OpenAI的“iPhone”時刻的神秘硬體項目。這一系列重磅發佈標誌著生成式AI已經進入2.0時代，從單一模態向多模態、從被動回應到主動代理、從純軟體向軟硬結合轉變。一、Google Veo 3：AI視訊生成的新巔峰在今年的Google I/O大會上，最引人注目的產品無疑是Veo 3視訊生成模型。這一模型相比前代產品有了質的飛躍，使我們離“以假亂真”的AI生成視訊又近了一步。1.Veo 3的核心突破Veo 3的最大亮點在於首次實現了視覺、語音和音效的完美同步生成。具體而言，它帶來了以下關鍵突破：- 音畫同步生成：不再需要後期加入音效，模型能夠原生生成與內容匹配的對白、環境音樂和背景音樂- 唇形同步：任務說話時的唇形與聲音高度同步，是目前市場上唇形同步效果最好的模型- 物理效果模擬：相比Veo 2，新模型對物理效果的理解大幅提升，物體運動、水流動態更符合自然規律- 鏡頭語言：能夠理解和執行各種電影攝影指令，如推、拉、搖、移等專業攝影動作2.Google Flow：面向專業創作者的AI電影平台與Veo 3同時發佈的還有Google Flow平台，這是一個專為電影製作者打造的工具。Flow整合了Veo 3、Imagen 4等多個AI模型，為影片創作者提供從文字到視訊、從靜態圖像到動態視訊等端到端的解決方案，不僅在於整合已有的生成式AI工具，更為專業創作者提供了接近傳統工作流程的體驗，大大降低了AI視訊創作的使用門檻。3.使用限制與產品策略儘管Veo 3的能力令人印象深刻，但Google對其實施了嚴格的使用限制，使用者需要支付250美元/月（目前促銷價125美元）的Google AI Ultra套餐才能使用，且每天僅允許生成5個視訊，系統會自動加入水印，並在中繼資料中標記AI生成內容。這種嚴格限制一方面反映了生成高品質視訊的計算資源成本仍然很高，另一方面也體現出Google對AI內容倫理和版權問題的謹慎態度。二、Anthropic Claude 4:衝擊“世界最強程式設計模型”在5月23日的首屆“Code with Claude”會議上，Anthropic推出了Claude 4系列模型，將公司戰略重點明確轉向程式設計和推理能力，試圖在特定領域超越OpenAI。1.Claude 4的核心創新Anthropic將Claude Opus 4成為“全球最強程式設計模型”，得到了多項基準測試的支援，在軟體工程基準測試中優於OpenAI的GPT-4和Google的Gemini 2.5Pro，並在支援大型程式碼庫和多檔案項目表現卓越：- 混合模型設計：同時支援快速響應（日常互動）和深度思考（複雜問題）兩種工作模式- 長時間工作能力：能夠連續工作7小時以上不衰減，適合複雜程式設計任務- 精確的程式碼理解：對程式語言的語法和語義有更深入的理解- 代理能力增強：能夠做為智能代理自主完成複雜的軟體開發任務Anthropic的雙產品現策略清晰地表明其市場定位：Sonnet瞄準大眾開發者市場，提供高性價比的AI程式設計助手；而Opus則針對企業客戶和高端研發場景，提供無與倫比的複雜問題求解能力。2.戰略轉向與定位從此次發佈來看，Anthropic正在戰略略性地避開Google Gemini和OpenAI在通用聊天機器人領域（消費級應用）的正面競爭，轉而專注於程式設計和推理這兩個高價值垂直領域。這種“差異化競爭”策略反映了AI市場的細分趨勢。“通過Claude 4，我們不再追求成為更好的聊天機器人，而是致力於成為世界上最好的程式設計和推理助手。這是Anthropic的關鍵差異化路徑。” —— 發佈會摘錄3.安全性和社會責任的爭議值得一提的是，Claude 4發佈後引起了一些爭議。Anthropic的AI對齊研究員Sam Bowman最初在社交媒體上暗示，如果Claude 4發現使用者在進行明顯不道德的活動（如製藥試驗造假），模型可能會嘗試聯絡監管機構或媒體，引發了公眾對AI過度自主權的擔憂。不過，Bowman隨後澄清這只是在特殊測試環境中才會出現的行為，普通使用者不會遇到這種情況。儘管如此，這一事件仍然引發了人們對AI代理權限邊界的深入思考。三、OpenAI與Jony Ive：醞釀AI硬體的“iPhone時刻”同一周，OpenAI宣佈以65億美元全股票交易收購前蘋果首席設計師Jony Ive的AI裝置初創公司io，並透露雙方正在合作開發一款革命性的AI硬體裝置，被外界視為可能引領下一代計算平台的重要佈局。1.合作背景與戰略意義據報導，Sam Altman與Jony Ive的合作始於兩年前，此次收購和合作的戰略意義重大：- 標誌著OpenAI從純軟體公司向軟硬結合企業的轉型- 借助Ive的設計理念，可能為AI互動創造全新範式- 暗示AI需要突破現有計算裝置的限制，創造專屬形態- Sam Altman表示，這項合作可能為OpenAI增加“1兆美元價值”2.神秘裝置的猜想雖然OpenAI和Jony Ive尚未公佈具體產品細節，但根據媒體報導和分析師推測，這款裝置可能具有以下特點：- 口袋大小：便攜設計，可能採用類似iPod Shuffle的小巧形態- 無螢幕互動：不依賴傳統螢幕幕互動，可能主要依靠語音- 環境感知：能夠感知並理解使用者周圍環境- 非眼鏡形態：明確不會是AR/VR眼睛，可能是頸戴裝置- 低干擾設計：Ive表示設計目標是創造“比iPhone社交干擾更少”的計算體驗。有分析認為，這款裝置的定位是“AI伴侶（AI Companion）”，目標使用者群體可能是希望隨時獲取AI助理支援，但又不想被智慧型手機束縛的專業人士。猜測可能是一款AI項鏈或者類似iPod Shuffle形態的可穿戴裝置，但OpenAI與Jony Ive團隊對細節守口如瓶。（預測圖，並非實物圖）3.野心與挑戰Sam Altman表示，這次合作可能為OpenAI增加“1兆美元的價值”，計畫在2026年底前發貨1億台裝置。這一宏大目標反映了OpenAI對硬體市場的巨大野心，但也面臨諸多挑戰：- 硬體經驗不足：OpenAI此前沒有硬體產品經驗- 競爭激烈：已有Rabbit R1、Humane AI Pin等類似產品- 產品定位模糊：目前尚不清楚產品具體解決什麼問題- 市場接受度不確定：消費者對純AI裝置的需求尚不明確“我們希望創造一種全新的計算範式，不再是低頭看螢幕，而是更自然地與AI交流的方式。”——Sam Altman在收購公告中表示四、Microsoft build：建構AI代理網路生態相比前幾個，Microsoft Build大會便向開發者，但其發佈的Microsoft Discovery AI科研平台和GitHub Copilot代理是程式設計助手同樣展示了重要的AI發展趨勢。1. Microsoft Discovery：AI重塑科學發現流程在Build 2025大會上，微軟推出了企業級AI科研平台Microsoft Discovery，這一平台通過結合基礎模型和專業領域知識，為科研創新提供了全新途徑。該平台最引人注目的成就是在僅200小時內發現了一種新型冷卻劑化合物，而傳統方法通常需要數月甚至數年。Microsoft Discovery通過一系列AI"博士後"代理進行運作，這些代理能夠執行文獻回顧、設計實驗、進行計算模擬等多個科學過程。在實際應用中，該平台篩選了367,000個潛在候選化合物，大大加速了材料科學的研究處理程序。這一平台的出現代表了科學研究方法學的革命，AI不再僅是輔助工具，而是成為科研過程的核心驅動力。2. GitHub Copilot Agent：程式碼自動化的新境界微軟還為旗下GitHub平台推出了全新的Copilot Agent，這一工具允許開發者將GitHub問題直接分配給AI代理，由其自動編寫和提交程式碼解決方案。Copilot Agent能夠自主建立安全的開發環境，根據任務描述或圖表自動設計和實現功能，甚至可以修復已標記的問題。更值得注意的是，微軟決定開源VS Code中的GitHub Copilot，這將加速類似Cursor等AI程式設計工具的發展。結語：行業趨勢與未來展望通過這幾家巨頭本周的最新動向，我們可以發現幾個關鍵的行業趨勢：1. 多模態生成向縱深發展以前的多模態都是輸入多模態，輸出單一模態，而現在正轉向輸入輸出都是多模態。音視訊一體化生成（如Veo 3）意味著多模態輸出走向成熟，模型開始理解鏡頭語言、音樂情緒等高層次語義，多模態生成工具開始與專業創作工作流整合（如Flow平台）等。2. 代理能力成為競爭焦點各家公司都在強調AI的主動性和代理能力，這反映了行業從"被動響應式AI"向"主動代理式AI"的轉變：Google展示了Jules非同步程式設計代理，Microsoft推出了GitHub Copilot自主開發能力，Anthropic強調Claude 4的長時間任務處理能力。代理式AI能夠自主執行複雜任務，而不只是回答問題。3. 專業化與垂直領域深耕通用AI之爭後，各家公司開始在特定領域尋求突破和差異化：- Google主攻多模態創意生成領域- Anthropic聚焦程式設計和推理能力- Microsoft重點發力企業科研和開發工具鏈- OpenAI可能通過硬體創新重新定義AI交互範式4. AI硬體與互動範式革新隨著模型能力增強，AI硬體形態創新成為新競爭點：Google展示的AR眼鏡提供即時翻譯和資訊增強，OpenAI與Jony Ive合作開發下一代AI裝置。互動正從"人適應機器"向"機器理解人"轉變。頂級AI公司不再滿足於純軟體解決方案，開始探索軟硬結合的產品形態。這一趨勢可能預示著下一代計算平台的雛形，就像智慧型手機取代PC成為主流計算平台一樣。新硬體平台可能引發新一輪生態系統競爭.5.計算資源的制約與壁壘值得關注的是，所有這些尖端AI突破都伴隨著高昂的計算成本。這一點從Google為Veo 3設定嚴格使用限制和高昂訂閱費可見一斑。計算資源正成為AI創新的主要瓶頸，也是巨頭們建立競爭壁壘的重要手段。未來幾年，隨著專用AI晶片的普及和邊緣計算的發展，這一制約可能逐步緩解，但短期內計算資源的不平等分配將持續影響行業格局。如果將當前AI行業比作個人電腦的發展歷程，2025年5月這一周堪稱AI的"1984年"時刻——正如蘋果在1984年通過Macintosh電腦展示了個人電腦的未來願景一樣，Google、Anthropic、OpenAI和Microsoft在這一周展示的技術突破和戰略願景，將深刻塑造AI的未來十年。我們看到AI正從簡單的內容生成工具向全能代理助手、從單一模態向多模態整合、從軟體演算法向軟硬結合發展。這一系列變化預示著，AI的下一個戰場將不再侷限於模型參數規模和基準測試成績，而是在使用者體驗、場景適配和互動範式上的創新。正如iPhone定義了移動網際網路時代的使用者體驗，我們或許正在見證AI行業的"iPhone時刻"——那個重新定義人機互動的拐點。 (JER學家)