#開發者
不藏了!OpenAI 2025開發者日:ChatGPT要變成作業系統,8分鐘拖曳可建構超複雜Agent
今天OpenAI的開發者日簡直太硬核了,OpenAI的開發者已經達到了驚人的400萬,ChatGPT周活躍使用者達到8億,每分鐘API處理的60億token主要有四個方面內容1.在 ChatGPT 內部建構應用 :Apps inside ChatGPT,OpenAI推出自己的App SDK。這可以說是驚雷消息,OpenAI不但要革蘋果Appstore的命,還要直接把ChatGPT變為作業系統,看大神怎麼說:2.直接拖曳建構Agent工具:AgentKit。這裡有個8分鐘拖曳演示,我把視訊扒下來了並且翻譯好了,大家直接看視訊是最直觀的,(可以玩了,連結:https://platform.openai.com/agent-builder/)3.codex更新,關於codex最新能力演示視訊,我也已經扒下來4.API支援 :sora 2,gpt-5 proApps in ChatGPT:開啟一個全新的應用分發與互動生態我認為這是最震撼的,標誌ChatGPT正式進軍作業系統,簡單來說,OpenAI的野心是以後你只需要一個應用夠了,這個應用就是ChatGPT,這樣ChatGPT就變成事實上作業系統了,蘋果Appstore瑟瑟發抖,毫無疑問這是OpenAI戰略性的賭注在過去,OpenAI 曾嘗試通過 GPTs 和 MCP 等方式,將開發者的服務與 ChatGPT 連接起來。這些嘗試有的成功,有的則不盡人意,但都為 OpenAI 積累了寶貴的經驗。今天,OpenAI 邁出了決定性的一步,正式向開發者開放 ChatGPT,允許他們在其中建構原生應用 (Apps)這將催生新一代的應用形態,它們具備三大核心特質:互動性 (interactive)、適應性 (adaptive) 和個性化 (personalized)。使用者不再是單純地與一個聊天機器人對話,而是可以直接在對話中與功能豐富的應用進行互動。為了實現這一點,OpenAI 推出了全新的 Apps SDK (軟體開發工具包),現已開放預覽Apps SDK 為開發者提供了一套完整的全端解決方案,其主要特性包括:連線據:開發者可以將自己的資料來源和後端服務無縫接入觸發動作:應用可以執行具體的後端操作,例如建立一個設計、預訂一個行程或分析一份資料渲染完整 UI:開發者可以在 ChatGPT 的對話流中渲染完全互動的使用者介面,而不僅僅是文字或卡片。這意味著媒體播放器、互動地圖、設計畫板等複雜的 UI 都可以被直接嵌入基於 MCP 標準:Apps SDK 建立在 MCP 這一開放標準之上,開發者對其後端邏輯和前端 UI 擁有完全的控制權。由於標準是公開的,任何人都可以將其整合到自己的平台對於開發者而言,最大的吸引力在於分發管道。一旦應用建構完成,它就有機會觸及 ChatGPT 全球數億的使用者群體。這將極大地改變產品的規模化擴展方式。同時,OpenAI 也考慮到了商業化的需求。如果使用者已經是開發者現有產品的訂閱者,他們可以直接在對話中登錄帳戶。未來,OpenAI 還將支援多種變現方式,包括新的Agentic Commerce Protocol (智能體商業協議),該協議將允許在 ChatGPT 內部實現即時結帳在現場演示中,軟體工程師 Alexi 展示了幾個首批合作夥伴的應用,生動地詮釋了這種新模式的魔力:Coursera (線上課程平台):當使用者想要學習某個主題時,可以直接呼叫 Coursera 應用。應用會在對話中直接嵌入課程視訊,並支援子母畫面或全螢幕播放。與應用對話功能:當使用者觀看視訊時,可以隨時向 ChatGPT 提問關於視訊當前內容的問題,例如“請解釋一下他們現在正在說的概念”。由於 Apps SDK 允許應用將上下文 (context) 暴露給模型,ChatGPT 能夠準確理解使用者正在觀看的視訊片段,並給出精準的回答。這將學習體驗提升到了全新的高度Canva (設計平台):在一個為寵物狗遛彎業務進行頭腦風暴的對話中,使用者可以直接呼叫 Canva,並用自然語言下達指令,例如“Canva,用這個名字為我製作一個作品集,我希望它色彩豐富、異想天開、明亮,並使用無襯線字型”。Canva 應用會直接在對話中生成設計選項。使用者還可以進一步迭代,比如將一張海報轉化為一個用於種子輪融資的完整 Pitch Deck (簡報)。整個創意流程在同一個對話窗口中無縫完成Zillow (房地產平台):當對話延伸到業務擴張,ChatGPT 建議將新城市選在匹茲堡。使用者可以接著呼叫 Zillow 應用,要求“顯示那裡的待售房屋”。Zillow 會在對話中嵌入一個互動地圖。使用者可以切換到全螢幕模式,瀏覽房屋詳情,甚至可以直接在地圖上發起預約看房。更強大的是,使用者可以繼續用自然語言對 Zillow 應用進行操作,例如“將地圖篩選為僅顯示帶院子的三居室房屋”。ChatGPT 會理解指令並更新地圖。此外,當使用者選定一處房產時,可以詢問“這處房產離狗狗公園有多遠?”。ChatGPT 會將來自 Zillow 應用的房屋位置資訊與其自身的搜尋工具結合,提供綜合性的答案這些演示清晰地表明,Apps in ChatGPT 不僅僅是 API 的簡單呼叫,而是將語言模型的理解能力與應用的豐富功能和互動介面深度融合,創造出前所未有的動態體驗目前,Apps SDK 已向開發者提供預覽版。今年晚些時候,開發者將能夠提交應用進行稽核和發佈,屆時還會推出一個應用目錄 (Directory) 供使用者瀏覽。符合基本標準的應用都將被收錄,而那些在設計和功能上表現更出色的應用,將會獲得更顯著的推薦位置,甚至在對話中被主動建議給使用者https://developers.openai.com/apps-sdkAgentKit:在幾分鐘內將智能體從原型帶入生產環境智能體 (Agent),即能夠理解上下文、使用工具並自主完成任務的軟體,被普遍認為是 AI 的下一個重要發展方向。然而,儘管圍繞它的討論非常火,但真正能投入生產並被大規模使用的智能體卻寥寥無幾。原因在於其開發過程異常複雜,開發者需要處理諸多難題:從選擇合適的框架,到編排複雜的工作流、建立評估循環、連接各種工具,再到建構一個友好的使用者介面,每一步都充滿了挑戰為瞭解決這些痛點,讓每位開發者都能更快速地將想法轉化為可用的智能體,OpenAI 推出了全新的 AgentKit。這是一套內建於 OpenAI 平台中的完整建構模組,旨在幫助開發者以更少的時間和精力,完成從原型設計到生產部署的全過程AgentKit 核心包含三大元件,以及一個強大的連接器生態系統:1.Agent Builder (智能體建構器):這是一個可視化的工作流設計工具。開發者不再需要從頭編寫複雜的協調程式碼,而是可以通過拖曳節點的方式來設計智能體的邏輯步驟、測試流程。這些節點包括工具呼叫、需要人類介入的環節、安全護欄和邏輯判斷等。它建立在已有數十萬開發者使用的 Responses API 之上,對於平台老使用者來說非常容易上手2.ChatKit (聊天工具包):為了讓智能體擁有一個精美的使用者介面,OpenAI 提供了 ChatKit。它是一個簡單、可嵌入的聊天介面元件,開發者可以輕鬆地將其整合到自己的應用中,並進行品牌化定製,例如修改顏色、Logo 和提示語。這讓開發者可以專注於核心業務邏輯,而無需在前端介面上花費過多時間3.Evals for Agents (智能體評估):衡量智能體的性能至關重要。AgentKit 提供了一套專門的評估功能,包括:Trace Grading (追蹤評分):可以逐一審視智能體每一步的決策過程,深入理解其行為Datasets (資料集):允許開發者針對工作流中的某個特定節點進行性能評估Automated Prompt Optimization (自動化提示最佳化):幫助自動調整和改進提示詞,以獲得更好的性能External Model Evals (外部模型評估):甚至支援在 OpenAI Evals 平台內直接對外部模型進行評估Connector Registry (連接器註冊中心):智能體需要安全地訪問資料和工具。通過這個管理控製麵板,企業可以安全地將智能體連接到內部工具和第三方系統,同時確保資料安全和權限可控現場演示,Christina 發起一項挑戰:在 8 分鐘內為 DevDay 的官方網站建構並部署一個問答智能體 "Ask Froge"我已經貼心的把這8分鐘視訊扒下來了,並且做好的翻譯,大家就看吧,不用感謝我設計工作流 (在 Agent Builder 中):1.  她首先拖入一個分類器節點,用來判斷使用者的提問是關於“會議日程”還是“一般資訊”。2.  接著,她建立了兩個專門的智能體節點。一個是“日程智能體”,為其上傳了包含所有會議資訊的文件作為知識源;另一個是“DevDay 通用智能體”,為其提供了通用資訊檔案,並設定了其角色風格(像一隻名為 Froge 的青蛙一樣說話,會發出 "ribbit" 的聲音)。3.  為了讓日程推薦更具視覺吸引力,她使用 **Widget Builder (小元件建構器)** 設計了一個精美的日程卡片,並將其附加到“日程智能體”的輸出格式中。4.  為了增強安全性,她加入了一個預置的 **Guardrail (護欄)** 節點,用於自動遮蔽個人身份資訊 (PII)。5.  整個工作流設計完成後,她在 Agent Builder 的預覽窗口中進行了測試,確認其能夠正確回答問題並以預期的方式呈現結果。部署到網站:1.  她點選“發佈”,AgentKit 為這個工作流生成了一個唯一的 ID。2.  然後,她來到 DevDay 網站的程式碼中,僅用了幾行程式碼就完成了部署:她引入了 **ChatKit** 的 React 元件,將剛剛生成的工作流 ID 傳入,並加入了一些自訂樣式,如 Froge 主題的顏色和提示語。3.  刷新網站,一個名為 "Ask Froge" 的聊天機器人已經出現在頁面右下角,並完全可用。整個過程從設計到部署,耗時不到 8 分鐘。這個演示完美地展示了 AgentKit 如何將一個原本需要數周開發時間的複雜任務,縮短到幾分鐘。更重要的是,後續的迭代可以直接在可視化的 Agent Builder 中完成,修改後的智能體無需重新部署程式碼即可在網站上生效CodexCodex更新今天,Codex 正式結束研究預覽,進入通用可用階段。推出了一系列新功能:1.Slack 整合:開發者可以直接在 Slack 的團隊對話中要求 Codex 編寫程式碼或回答問題2.Codex SDK:一個新的開發工具包,幫助團隊將 Codex 的能力擴展和自動化到自己的工作流中3.新的管理工具和報告:包括環境控制、監控和分析儀表板,幫助企業更好地管理 Codex 的使用現場演示codex強大的程式設計能力: Romain 展示了如何利用 Codex 和 OpenAI 的 API,將周圍的物理世界變成可互動的軟體同樣給大家奉上演示視訊全過程:**從草圖到 UI**:Romain 首先展示了一張他手繪的 UI 草圖,然後使用 `Codex CLI` (命令列工具) 將其轉換成一個帶有攝影機畫面的控製麵板介面**控制物理裝置**:他的第一個挑戰是發佈會控制舞台上方的 Sony FR7 攝影機。他對如何開始一無所知,只知道這款攝影機有一個 C++ SDK。他直接向 Codex 下達了任務,Codex 自主研究了有 30 年歷史的 VISCA 協議,並用 JavaScript 實現了控制邏輯。Romain 強調,Codex 能夠不知疲倦地執行長達數小時的複雜任務**即時加入新功能**:接著,Romain 在 VS Code 中向 Codex 外掛下達了一個新任務:“將一個無線控製器連接起來以控制攝影機”。Codex 在後台開始分析現有程式碼,制定計畫並實現功能。幾分鐘後,Romain 拿起一個 Xbox 手把,成功地控制了攝影機的移動**多模態與多工具協作**:演示的高潮是引入了語音控制。他利用 OpenAI 的即時語音 API 和 Agent SDK,為應用加入了語音互動能力。然後,他向 Codex 發出指令,要求為舞台的燈光系統建立一個 MCP 伺服器,並提供了燈光系統的參考文件。Codex 在執行任務時,發現文件資訊不全,於是自主上網搜尋 GitHub 上的文件,補全了所需資訊,最終成功建立了伺服器**人機協同程式設計的未來**:演示的最後,Romain 通過語音嚮應用下達指令:“讓 Codex 顯示一個類似電影結尾的演職員表,演員是現場的觀眾們”。應用中的語音智能體將這個請求轉發給了 **Codex SDK**。Codex 即時地分析了前端應用的程式碼,注入了新的 React 元件,並在螢幕上滾動顯示出了“演職員表”這個現場演示展示codex開發全過程:從草圖、物理裝置、語音指令到即時應用重構,整個過程幾乎沒有手寫一行程式碼。Codex 真正成為了一位能夠理解意圖、解決未知問題並與開發者並肩工作的智能隊友模型與 API 更新GPT-5 Pro API 開放GPT-Realtime-Mini API 開放Sora 2 API 預覽版發佈寫在最後DevDay 2025 的所有發佈都指向一個共同的目標:OpenAI要為為這個新的開發者時代提供最好的平台。從在 ChatGPT 內部分發應用的 Apps SDK,到簡化智能體開發的 AgentKit,再到 Codex,以及 GPT-5 Pro、Sora 2 和 Realtime-Mini 等更強大的模型 API,OpenAI 正在全方位地為開發者賦能就像Sam Altman說的,軟體開發曾經是一個需要數月甚至數年才能完成的漫長過程,但今天,我們親眼見證了它可以在幾分鐘內完成。在這個新時代,你所需要的,僅僅是一個好的想法。這是一個屬於所有新開發者的黃金時代,注意是新開發者,我們都要問自己一句,我們屬於這個新行列嗎? (AI寒武紀)
OpenAI生態浮現! 2025開發者大會乾貨滿滿:ChatGPT要變成作業系統,每周使用者達8億.....相關公司股票大漲!
OpenAI推出為ChatGPT打造App的框架Apps SDK、為App輕鬆嵌入ChatGPT聊天的ChatKit、建構AI智能體的AgentKit;宣佈軟體工程智能體Codex正式上線;將在API中推出GTP-5 Pro和一個小語音模型,並納入Sora 2。Altman演示第三方App與Apps SDK整合時提到軟體公司Figure,Figma午盤轉漲超10%。OpenAI演示首批ChatGPT的App之一Coursera,後者盤中漲超8%。Altman稱其採用AgentKit軟體後,HubSpot盤中漲超10%。當地時間10月6日周一,規模最大的一屆開發者大會DevDay在舊金山Fort Mason舉行。今天OpenAI的開發者日簡直太硬核了,OpenAI的開發者已經達到了驚人的400萬,ChatGPT周活躍使用者達到8億,每分鐘API處理的60億token主要有四個方面內容1.在 ChatGPT 內部建構應用 :Apps inside ChatGPT,OpenAI推出自己的App SDK。這可以說是驚雷消息,OpenAI不但要革蘋果Appstore的命,還要直接把ChatGPT變為作業系統,看大神怎麼說:2.直接拖曳建構Agent工具:AgentKit。這裡有個8分鐘拖曳演示,我把視訊扒下來了並且翻譯好了,大家直接看視訊是最直觀的,(可以玩了,連結:https://platform.openai.com/agent-builder/)3.codex更新,關於codex最新能力演示視訊,我也已經扒下來4.API支援 :sora 2,gpt-5 proOpenAI的CEO Altman在開場講話中介紹,聊天機器人ChatGPT每周使用者已達到8億,擁有400萬開發者,OpenAI的API每分鐘處理80億個token。以上資料意味著OpenAI的使用者時隔一個月增長了10%以上。因為上月OpenAI透露,ChatGPT的單周活躍使用者達到7億。接下來,Altman和OpenAI的員工介紹並演示了OpenAI給開發者派發的“禮包”——為ChatGPT打造應用程式App的框架Apps SDK(軟體開發框架)、支援打造AI智能體(Agent)的AgentKit、輕鬆嵌入ChatGPT聊天功能的ChatKit。Altman暢想了人工智慧(AI)改變程式設計的願景:讓程式設計從需要大型團隊完成的職業轉變為,個人在ChatGPT幫助下可以完成的工作。他說:“我們正在見證意義重大的事發生。過去,軟體開發需要數月甚至數年的時間。現在,利用AI,開發軟體只需幾分鐘。你不需要龐大的團隊,只需要一個好主意,然後就能以前所未有的速度將其變為現實。”演示App SDK Figma股價盤中轉漲超10%Altman介紹OpenAI的Apps SDK,它將允許使用者直接通過ChatGPT訪問App。例如,使用者可以輸入“要求聊天機器人為派對建立播放列表”,並獲得 Spotify 的推薦。OpenAI現場演示了Apps SDK,一位使用者請求 ChatGPT 使用 Canva 為一家遛狗公司製作海報模型。幾分鐘後,Canva 為這家公司生成了四張不同的海報,並直接在ChatGPT中呈現給使用者。使用者還可以請求後續編輯並建立其他形式的媒體。OpenAI 還在演示中製作了一份簡報。Altman演示了舊金山設計軟體公司Figma的技術,涉及Figma與ChatGPT的結合,展示了第三方App如何與OpenAI的App SDK整合。他說:“當有人使用ChatGPT時,你可以通過輸入名稱來找到某個App。例如,你可以為ChatGPT繪製一個產品流程圖,然後告訴Figma,‘請用Figma將草圖轉換成可行的圖表’。Figma App將響應,接管並完成操作。”Altman稱,如果使用者訂閱OpenAI的Apps SDK,將能夠在不離開ChatGPT對話的情況下登錄該產品。利用Figma開發產品的人還可以啟動 FigJam 工具繼續推進開發創意。Apps SDK 基於去年11月底OpenAI推出的開放標準模型上下文協議(Model Context Protocol)。軟體開發者將能在今年晚些時候提交App供稽核。被Altman提及後,早盤曾跌超3%的Figma(FIG)周一午盤拉升轉漲,午盤刷新日高時,日內漲超16%,收漲7.4%。該司專注於開發基於瀏覽器的協作設計工具。首批ChatGPT App之一Coursera 盤中漲超8%DevDay期間,線上學習平台Coursera宣佈,成為ChatGPT中首批採用的App之一,並在OpenAI的DevDay上亮相。OpenAI演示了如何使用 ChatGPT 在 ChatGPT 中訪問線上學習平台Coursera的視訊,並展示了AI 如何深入研究視訊中的某些主題。OpenAI的軟體工程師Alexi Christakis稱:“在訓練機器學習模型之前,ChatGPT會回應並解釋講師的資料準備步驟,然後進行多次分解。”Coursera(COUR)股價盤中漲幅迅速擴大,午盤曾漲約8.4%,收漲0.4%。OpenAI演示AgentKit建構AI智能體Altman 介紹了 AgentKit,他表示,該工具旨在幫助開發者建構AI智能體,並將其從“原型到生產”階段推進。Altman表示:“我們希望從個人開發者到大型企業,每個人都能從中獲益。”OpenAI的技術人員在八分鐘內建構了一個AI智能體,現場向觀眾演示AgentKit。該智能體在距離八分鐘還剩49秒時間內完成,並已上線供參加DevDay的人員使用。演示者說:“在短短幾分鐘內,我們就以可視化的方式設計了一個智能體工作流程。我們加入了一些工具和小部件,進行了預覽、部署和測試,現在大家就可以使用它了。”在介紹最新發佈的AgentKit軟體時,Altman提到了企業軟體公司HubSpot,該軟體旨在幫助程式設計師更快地建立能夠自動執行某些任務的AI智能體。Altman說,HubSpot使用AgentKit軟體改進了公司的Breeze AI 工具,使其能夠對客戶諮詢生成更具說服力的回覆。被Altman提到後,HubSpot(HUBS)股價午盤曾漲11.3%,收漲2.6%。介紹ChatKit Codex上線Altman表示,利用名為ChatKit的OpenAI產品,App開發者很快就能輕鬆地將基於ChatGPT的AI聊天功能嵌入到他們的App或網站中。他說:“你將獲得一個簡單易用的可嵌入聊天介面,你可以自行建立。你可以加入自己的品牌、工作流程以及任何能夠讓你的產品獨具特色的元素。”Altman宣佈,OpenAI今年早些時候發佈研究預覽版的軟體工程智能體Codex 正式上線。OpenAI的開發者體驗主管 Romain Huet現場未編寫任何程式碼就演示了Codex。他為房間裡的攝影機設計了控制項,並編寫了Xbox控製器實現同樣的功能。Huet用自己的聲音作為控製器,將燈光照亮人群。他說:“我們把語音、草圖和周圍的裝置都整合在一起,然後將它們變成了可行的軟體,而這一切都無需手工編寫一行程式碼。”Huet演示了用語音即時建立一些軟體。比如他用語音命令開發環境顯示所有與會者的姓名,就像電影中的片尾字幕一樣。Huet 表示,這意味著程式設計師將能夠根據使用者需求即時重新編寫App。“當我要求建立片尾字幕疊加層時,它能夠繼續編輯這個 React App內的程式碼,重新載入,找到完成任務所需的內容,然後片尾字幕就開始滾動了。”API推出GTP-5 Pro、小語音模型 納入Sora 2Altman 表示,OpenAI將在API(應用程式設計介面)中推出GTP-5 Pro。OpenAI還將在API中推出一個名為GPT-realtime-mini的小語音模型。Altman認為,語音將成為人們與AI互動的主要方式之一。Altman還宣佈,上周推出的新一代音視訊生成模型Sora 2現已加入API,新的開發者軟體現已可供開發者測試。Altman介紹了開發者使用這些工具的一些方式,並展示了 AI 生成的視訊,包括狗在沙灘上嬉戲,以及皮劃艇運動員在湍急的河流中划槳。Altman說,新模型Sora 2能夠完美地將聲音與視覺效果完美結合,不僅僅是語音,還有豐富的音景,以及基於使用者所看到內容將環境音訊效果同步。OpenAI的計畫或產品有助評估AI行業格局OpenAI此前稱,今年的DevDay預計有超過1500人到場,參加OpenAI“迄今為止規模最大的活動”。OpenAI的高管將在活動期間發表主題演講,CEO Altman和“iPhone之父”、前蘋果首席設計師Jony Ive將進行爐邊談話。此前分析師預計,OpenAI可能借DevDay之機推出更強大的消費級AI代理和AI瀏覽器等產品。瑞銀稱,OpenAI可能發佈更多面向消費者的AI代理程序,例如“一個功能更強大的旅行預訂代理”,甚至可能推出一款AI瀏覽器。Ingalls & Snyder高級投資組合策略師Tim Ghriskey稱,任何關於OpenAI計畫或產品的資訊都將幫助投資者評估整個行業格局。最近有消息稱,OpenAI可能在DevDay推出名為Agent Builder的新工具,讓使用者通過一個可視化的畫布,以拖曳的方式建構自己的AI智能體工作流。Altman最近在社交媒體發帖稱,OpenAI“推出了一些新產品,可以幫你用AI進行建構”。評論稱,這一說辭和Agent Builder的消息一致。此外,Altman和Ive的對話有可能讓外界瞭解到OpenAI備受期待的潛在新品進展——OpenAI研發中的AI可穿戴裝置有什麼最新消息。DevDay 2025 的所有發佈都指向一個共同的目標:OpenAI要為為這個新的開發者時代提供最好的平台。從在 ChatGPT 內部分發應用的 Apps SDK,到簡化智能體開發的 AgentKit,再到 Codex,以及 GPT-5 Pro、Sora 2 和 Realtime-Mini 等更強大的模型 API,OpenAI 正在全方位地為開發者賦能就像Sam Altman說的,軟體開發曾經是一個需要數月甚至數年才能完成的漫長過程,但今天,我們親眼見證了它可以在幾分鐘內完成。在這個新時代,你所需要的,僅僅是一個好的想法。這是一個屬於所有新開發者的黃金時代,注意是新開發者,我們都要問自己一句,我們屬於這個新行列嗎? (invest wallstreet)
Google在上海辦了場AI 嘉年華,開發者們卻說像逛「AI 基地」
在上海,重新定義「開發者大會」。8 月13 日,Google I/O Connect China 2025—Google 開發者大會在上海拉開序幕。來自Google 全球不同領域的專家,為中國出海開發者們帶來AI 驅動下的前沿技術、創新開發工具以及全球化平台的最新動態。比起純粹的開發者大會,中國這場I/O Connect 充滿了更多的「嘉年華」屬性。在現場展示區,可以看到來自不同國家的開發者們一早就排隊,積極感受「App 熱線」、「AI 快拼」、「Web AI 智能體」等AI 賦能下的產品互動體驗。置身其中,無論是遍佈各展台的小遊戲,還是Google 經典「小恐龍」造型的雪糕,都充滿了不同於以往國內行業開發者大會的「鬆弛感」。這種「鬆弛感」並非無心之舉,而是一種經過精心設計的策略姿態。它標誌著Google試圖與傳統、刻板的技術宣講會劃清界限,轉而營造一個更具吸引力、更強調創造和體驗的開發者社區氛圍。整個大會的核心,不再是零散的功能發布,而是圍繞一個統一的理念展開:為開發者,特別是中國的出海開發者,構建一個端到端的“AI 原生”工作流。大會期間,Google 大中華區及韓國總裁陳俊廷在致詞中指出,「當前,AI 正以前所未有的速度重塑各個行業格局,AI 驅動的未來開發模式也正在從根本上打造新的開發者體驗。中國出海開發者已成為全球創新舞台上不可或缺的中堅力量。」事實上,大會的每一個環節,每一次對話,幾乎都離不開中國開發者最關心的兩個關鍵詞:「出海」與「AI」。現場的許多討論往往同時聊這兩個話題。對於當下的中國開發者群體而言,人工智慧技術的應用與全球市場的拓展,已經不是兩個獨立的目標,而是同一枚硬幣的兩面,互為因果,密不可分。這也是Google希望向中國開發者傳遞的核心訊息:AI 不僅是提升產品功能的工具,更是實現全球化成功的關鍵驅動力。01 從SOTA 到落地如果你今年沒怎麼關註五月的Google I/O、以及以Gemini 2.5 Pro、Veo3、Imagen 4 為首的Google 系AI 產品落地,對Google AI 的印象還停留在追趕ChatGPT 的“防禦階段”,那麼你可能會對它今年展現出的系統性和攻擊性感到驚訝。曾幾何時,外界普遍認為Google在生成式AI 的浪潮中反應稍顯遲緩,其初步行動更多被解讀為對競爭壓力的被動回應。然而,2025 年的Google已經徹底扭轉了這個敘事。以Gemini 為首的Google AI 產品線,憑藉其強大的多模態能力和深度的生態整合,讓Google 再次回到舞台正中央。這種效應自然蔓延到開發者雲集、天平另一側的中國。在這一背景下,上海的這場I/O Connect 更像是Google AI 戰略在全球範圍內被行業證明行之有效後,來到中國的一場精心策劃的“線下路演”。它不再需要證明自己的技術實力,而是要展示如何將這種實力轉化為開發者生態的絕對優勢。在AI 原生開發成為新範式的當下,這場展會既是對開發者生態的賦能,也是Google試圖建立其全端AI 工具鏈絕對優勢的開始。在正式逛展前,來自Google的演講嘉賓已經通過主題演講,為現場的中國開發者「匯報」了Google 在生成式AI 領域過去一年的成績。這部分內容構成了整個大會的技術基石,也清楚地展示了Google為開發者準備的強大「AI 基地」。圍繞著AI 如何賦能開發者突破創新邊界,Google 開發者關係與開源業務總監Timothy Jordan 在專訪中,進行了深度分享:Google正致力於提供最前沿的技術與工具,幫助中國出海開發者突破創新邊界,打造惠及全球用戶的卓越產品。Timothy Jordan 介紹,「Gemini 2.5 系列模型憑藉跨模態任務處理能力和快速響應能力,幫助開發者建立需要復雜規劃邏輯的應用。」這並非抽象的技術術語,而是直接指向了出海開發者面臨的核心痛點。在競爭激烈的全球市場,使用者體驗是決定成敗的關鍵。更強的跨模態能力意味著開發者可以建立更複雜、更直觀的應用介面,例如,使用者可以透過語音、圖像和文字的組合與應用進行互動。更快的回應速度直接提升了使用者滿意度,尤其是在需要即時回饋的場景,如智慧客服、即時翻譯或互動遊戲中。因此,Gemini 2.5 被定位為出海開發者升級產品體驗的「有力支援」,是其AI 基地中的核心主戰裝備。除了通用的Gemini 模型,Google還展示了其在生成式媒體領域的專業武器。 Timothy Jordan 指出,「Veo3、Imagen 4 等生成式模型,激發開發者圖像、音視頻作品的創意靈感,提高內容生產效率。」這些工具的引入,旨在「重新定義創作極限」,尤其對於遊戲、社交媒體、內容創作和廣告營銷等領域的開發者而言,意義重大。它們能夠大幅降低高品質創意內容的生產成本和時間,讓中小開發者也能擁有與大型工作室相媲美的創意生產力,從而在全球內容經濟中獲得競爭優勢。如果說Gemini 代表了Google AI 技術的巔峰戰力,那麼Gemma 開放式模型系列則體現了其建構廣泛生態聯盟的深遠戰略。Gemma 開源模型與Gemini 同源,這也向開發者社群傳遞了一個明確的信號:選擇Gemma 並不意味著在模型品質上做出巨大妥協。 Gemma 繼承了Google最先進模型的基因,但提供了開源模型所獨有的靈活性和可控性,助力開發者根據實際需求進一步開發衍生模型,為企業「提升商業效率、解決實際問題開闢新路徑」。眾所周知,單一的、封閉的超大模型無法滿足所有場景的需求。對於許多企業而言,資料的隱私性、模型的定製化以及部署的成本效益是更優先的考量。 Gemma 正是為此而生,它授權開發者和企業在自己的資料上進行微調,創造出高度專業化的模型,從而解決特定的行業難題。即使是放眼中國國內,面對諸多本地競爭對手的挑戰,Google也並未止步於發佈基礎的Gemma 模型,而是透過持續拓展其應用,主動為開發者指明了創新的方向。大會中提到的MedGemma(用於醫療健康)、全球首個「海豚語」大模型DolphinGemma 和Gemma 3n(用於端側裝置)等衍生模型,正是這種策略的體現。鼓勵開發者「最大化挖掘AI 價值」,進入高價值、高影響力的領域。這不僅提升了Google技術的社會聲譽,也引導整個開發者生態走向更健康、更多元化的發展路徑。綜合來看,Google正在執行一種複雜的雙軌並進的 AI 霸權策略。它透過兩個看似不同但實則緊密關聯的路徑來鞏固其市場地位。首先,透過頂尖的閉源模型Gemini 系列,Google直接與OpenAI 等對手在性能的「珠穆朗瑪峰」上展開競爭,確保自己在技術的最前沿擁有無可爭議的領導力。這部分是其策略的「矛尖」,旨在吸引那些追求極致性能、希望在產品中整合最強AI 能力的頭部開發者和企業,用於處理複雜任務和升級全球產品體驗。與此同時,Google透過開放原始碼的Gemma 系列,建構了一個廣泛而深入的「群眾基礎」。這個策略的邏輯起點是,AI 的未來不僅取決於最頂尖的模型,更取決於其應用的廣度和深度。Gemma 源自Gemini 的核心技術,但透過開放原始碼,將模型定製、資料隱私和成本控制的主動權交還給開發者,有效吸引了那些被閉源API 的高昂成本和資料政策所限制的廣大開發者和企業。這構成了其戰略的「護城河」,透過建立一個龐大、活躍且高度依賴Google技術堆棧的開源社區,來對抗Llama 等其他開源模型的競爭,並最終將開發者鎖定在自己的生態系統內。對中國的出海開發者而言,這種雙軌策略提供了一個極具吸引力的「兩全其美」的方案。他們可以在其全球應用的核心功能中,在自己的產品中呼叫Gemini 2.5 Pro ,以實現業界領先的用戶體驗。同時,又可以利用Gemma 為特定的區域市場、或為了實現低延遲的端側智能,開發出如MedGemma、DolphinGemma 等高度定製化、成本可控的衍生模型。這種靈活性使得Google的AI 平台相比於只提供單一路徑的競爭對手,具有更強的「黏性」。這不僅是爭奪AI 開發市場的「頭部」,更是意圖包攬其「長尾」的深遠佈局。02 “嘉年華”體驗與傳統開發者大會常見的「主題演講+分論壇」結構不同,I/O Connect 的整體動線、互動機制甚至工具鏈設定,都更像是一場線下「裝備升級」體驗。 Google將抽象的技術公告,轉化為了可觸摸、可互動的現實場景。I/O Connect 採用了高度互動的展區結構,將整個體驗空間劃分為多個「沙盒」(Sandbox)和體驗區。這種設計的核心理念是,讓開發者從被動的聽眾轉變為主動的創造者。作為參觀者,在入口處領取日程表後,便可自由進入各個「沙盒」。這裡沒有復雜的任務系統,目標非常直接:上手體驗。開發者們圍在各個展台,不是被動地聽講,而是主動地向AI 下達指令,觀看代碼在螢幕上自動生成、修改、調試。這種「在實踐中學習」的模式,正是Google AI 原生哲學的物理體現。與其說是逛展,更貼切的形容是參觀一個「未來開發者的AI 基地」:每個展位都是強大的新式武器,而Google則扮演著軍火商的角色,向你展示如何用這些工具贏得下一場戰爭。在「應用工坊」(App Factory),Firebase Studio 成為核心,開發者可以親手體驗將一個Figma 設計稿拖入,AI 智能體不僅能產生前端代碼,還能自主分析並部署後端服務,這幾乎是「應用級的生成」。在「創意畫廊」(Creative Gallery),主題演講中的公告變得栩栩如生,Veo 3 和Imagen 4 等生成式媒體模型的驚人能力不再是簡報裡的片段,而是開發者可以親手呼叫的工具。特別是Veo 3 首次實現了視頻和音頻的原生同步生成,讓AI 視頻告別“默片時代”,為參會者帶來了強烈的感官衝擊。在搭建風格上,I/O Connect 體現出強烈的統一性。整個展區隨處可見Gemini 的Logo,以及分佈在不同部門、但同樣對Gemini 的應用能力瞭如指掌的Google 員工。所有的工具,從行動端到Web 端再到雲端,都被同一個AI 大腦所驅動。03 「端到端」AI 工具包逛完展後,一個強烈的感受是:I/O Connect 背後連接的是Google對新一代AI 原生開發的一種系統性理解。它不再滿足於提供單點的工具,而是致力於建立一個完整的、自洽的生態系統。前文提到,「出海」是本次大會的關鍵詞。中國開發者在全球市場的成功,背後有三個關鍵要素:對全球化市場的敏銳洞察;快速迭代的產品開發能力;以及最重要的,對AI 技術浪潮的積極擁抱。 Google正在推動的,正是對後兩者的革命性重塑。僅僅提供先進的工具是不夠的。一個真正強大的生態系統,不僅要為開發者提供「武器」,還要為他們鋪設通往勝利的「道路」。這正是Google在本次大會上發布的另外兩項重要計劃的核心所在,它們構成了其全方位賦能戰略的結構性支撐。在展示了強大的AI 模型和開發工具之後,Google也宣佈正式啟動 「Google Developer Program」。這可以被視為Google對其開發者社區承諾的正式化和體系化。該計畫提供的「個性化首頁、技能認證等專屬資源」,以及第一時間推送的最新活動與技術更新,旨在幫助開發者係統性地學習和掌握前文所述的整個「AI 基地」。如果說Developer Program 是為開發者打好技術和知識基礎,那麼第四期 「出海加速器」 計畫的開啟申請,則是Google為中國開發者鋪設的通往全球商業成功的「最後一公里」。該項目被定位為Google整個中國戰略的頂點,它將技術(AI 模型)、生態(開發者計劃)與最終的商業成果(全球市場增長)緊密連接起來。加速器不僅提供技術指導,更重要的是,它幫助中國的初創團隊解決在文化、市場、法規、融資等方面遇到的實際困難,幫助他們「在全球市場加速成長」。這一系列工具包的推出,說明Google想要建構的是一個全方位的「成功即服務」(Success-as-a-Service)平台,這已經遠遠超越了傳統的「工具即服務」(Tools-as-a-Service)模式。背後的邏輯是,一個開發者或一家新創公司的成功,技術只是必要條件之一。傳統的平台可能提供一個強大的API 或一款高效的IDE,但這並不能保證其使用者能夠取得商業成功。 Google試圖覆蓋從創意萌生到全球擴張的全生命周期。這個路徑的設計非常清晰:開發者首先透過Gemini 和Gemma 獲得強大的技術能力;然後透過Google Developer Program 獲得系統性的學習資源和社區支援,將技術能力轉化為熟練的開發技能;最後,通過出海加速器,將成熟的產品和團隊對接給全球市場和資本,克服商業化過程中的非技術壁壘。這種模式創造了一種基於價值而非純粹技術的強大「鎖定效應」。對於現場不少雄心勃勃的中國出海創業團隊來說,他們面臨的選擇不再是「那一個的 AI 模型在某個基準測試上高出5%」,而是「那個平台能為我提供最高的全球成功機率?」。透過解決開發者在市場認知、商業擴展和人脈網絡等方面的痛點,Google將自己從一個單純的技術供應商,轉變為一個不可或缺的戰略合作夥伴。這使得其生態系統對於追求長期發展的開發者而言,成為了一個理性的、甚至是唯一的選擇。除技術和工具以外,Google 將持續透過豐富的資源、社區和合作夥伴網絡,促進本土與全球開發者間的交流與協作,陪伴中國出海開發者長期成長。結語04在會後與媒體的對話中,Timothy Jordan 分享了在近年來AI 快速發展下,對開發者生態變化的觀察。他表示,「AI 技術的迭代更新正在降低應用開發門檻,有越來越多不同背景的開發者湧入生態,這是令人非常興奮的。其中,中國開發者的想法非常發散且具有多樣性,整體市場競爭激烈,激發出很多優秀的作品。」這種開發者群體的擴大化,也帶來了新的挑戰。他同時指出對AI 時代下開發者的擔憂,「隨著AI 便捷工具普及,很多工程師容易忽略學習者心態,即對新知識的深入自主思考。而這種持續自主學習的思維,往往對於開發者來說是最重要的,也是創新的根本來源。」在他看來,這不是人與機器的零和博弈,而是一種共生關係。開發者與AI 工具呈現雙向賦能關係:開發者透過使用AI 工具提升效率與創新能力,同時以場景實踐和資料回饋驅動AI 工具的持續進化,形成雙向增強的「人機共進」閉環。Timothy Jordan 強調,「無論是像Google、Meta 這樣的大廠,還是初創企業,經營好開發者生態的關鍵是把自己想像成使用者,深入觀察社區中開發者的不同角色背景,以及他們的真實需求,並持續傾聽用戶反饋。」就目前來看,Google並未將I/O Connect 定位為一次性的技術展示,更多是在完成一場「開發範式的空間實驗」。它敏銳地洞察了快速增長的AI 原生開發需求,進而嘗試將Gemini 大模型和Google開發者生態結合併搬到線下,打通從想法到全球用戶的完整鏈路。這場大會成功地將「AI 原生工作流程」這個抽象概念,轉化為一個開發者甚至更多AI 領域從業者都可以親身步入、互動和感知的物理空間,使其變得不再遙遠;甚至某種程度上,這種互動都已經不侷限於物理空間:在小紅書上的「出圈」某種程度上就是證明。I/O Connect 不是傳統技術大會的對標物,也不是誰的挑戰者。它更像是這個時代平台公司探索「人機協同」的一次大膽嘗試,一次關於未來軟件將如何被創造的宣言。或許作為「嘉年華」來看,它的完成度還不夠高,但它作為「AI 原生開發者大會」來看,最終交付給中國開發者的成果已經足夠有「賣點」。 (極客公園)
黃仁勳:全球 50% AI 開發者在中國,中美兩國在產業鏈中相互依存,中國是對手而不是敵人
Special Competitive Studies Project(SCSP)是一個成立於 2021 年,由前 Google CEO Eric Schmidt 發起的美國非營利、跨黨派智庫組織,其使命為研究和應對 AI 及其他新興技術對國家安全、經濟與社會的深遠影響,並向美國政府提供戰略性政策建議。NVIDIA 創始人& CEO 黃仁勳在近期參加 SCSP 旗下播客採訪時表示,當前對公司所取得的階段性成果仍“難以完全消化”,但這一時刻本身承載著非凡意義。黃仁勳指出,過去幾十年裡,全球電腦產業基本沿襲 IBM System 360 所確立的藍圖,涵蓋系統架構、軟硬體分離、相容性規範、應用開發模式等方面。這一框架支撐了整個資訊化時代的崛起。然而,當前 AI 帶來的技術轉變,正推動計算產業邁入一個全新的平台時代,而 NVIDIA 正是在推動這一變革的核心角色。他回憶道,2012 年 AlexNet 的出現是轉折點。當時團隊看到了這項技術的潛力,也意識到這不僅是電腦視覺的突破,更可能是 AI 領域的關鍵飛躍。AlexNet 的訓練依賴 NVIDIA GPU 和 CUDA 平台,使得深度學習模型在視覺任務上超越了人類專家四十年來的積累。黃仁勳表示,正是這一次突破,讓他認識到,AI 並非只是一個應用分支,而是整個平台範式的更迭。深度學習之所以具有變革性,是因為它不再依賴人工設計的特徵工程,而是借助大規模資料和計算資源,學習解決那些難以用規則形式化的問題。在他們看來,這預示著整個計算棧——從處理器架構到軟體方法論,再到網路連線方式,甚至整個產業生態——都將被重新定義。為此,NVIDIA 在隨後數年中重構了幾乎所有技術堆疊,從基礎的深度學習庫 cuDNN,到支援 AI 訓練和推理的 Megatron Core,再到硬體側的 NVLink 和 Tensor Core,再到 AI 超算系統 DGX1。這套完整平台的首次應用對象之一,便是當時位於舊金山、仍屬初創階段的 OpenAI。▍AI 三波發展浪潮從 2012 年至今,AI 技術經歷了清晰的三波發展浪潮。黃仁勳將第一階段定義為“感知智能”,即通過深度學習,電腦在圖像識別、語音識別、語言理解等方面達到了超越人類的水平。第二階段是“生成式智能”,AI 不再只是理解資訊,而能夠生成文字、圖像、音訊與視訊。如今我們正處於第三階段——“推理智能”,AI 已能夠通過鏈式思維、樹狀邏輯等方法對問題進行分解、分析和多步求解,甚至能在答題前自主進行資料查閱與學習。正是由於這類推理能力的顯現,外界才會開始討論通用智能的臨近。他表示,下一波浪潮將是“物理智能”。這類智能將理解並掌握物理世界的基本常識,包括物體恆常性、摩擦力、慣性、因果關係等——即人類孩童與小動物天然具備的常識性認知能力。一旦 AI 掌握這些能力,便可進入機器人等具身智能系統的發展階段。▍AI 工廠,專注 token 的資料中心對於“AI 工廠”,黃仁勳指出,傳統資料中心主要以資料儲存與分發為主,而 AI 工廠則是“一個只專注於生成 token 的全新類型的資料中心”。這些 token 可能被轉化為文字、符號、數字,未來甚至是化學結構、蛋白質配方,或機器人動作訊號。為了支撐如此規模的推理任務,AI 工廠需要持續消耗巨量電力,美國在能源政策上的積極推動正恰逢其時,為 AI 工廠建設打下基礎,也將形成一個全新產業。回顧歷次技術革命的就業走勢:從電力時代到資訊化時代,每次技術提升都伴隨著新產業的誕生與整體就業規模的上升。生產力提升本身不會自動導致失業,關鍵在於一個組織是否有創新意願與增長野心。以 NVIDIA 為例,企業擁有大量尚未實現的好想法、未進入的新市場、未建構的應用場景,如果擁有更強的生產力,就能推進更多工作,反而需要更多人力。他認為,這種樂觀並非盲目,而是歷史經驗的真實體現。AI 的普及也將成為前所未有的“平權力量”。這是第一次,技術如此先進卻又如此容易被每一個人使用。無論是否會寫程式碼,無論是否懂英語,甚至不會打字也能通過語音與 AI 對話。只要願意開始,每個人都可以向 AI 學習如何使用它。他鼓勵所有人“立即參與 AI”,因為這是一種前所未有的賦能工具。▍中國是對手而不是敵人對於美國政府應當採取的政策,美國在電腦行業具備全球唯一的領先地位,這是國家級的戰略資產。黃仁勳坦言,“我們已經失去了 5G”,無論從技術、政策還是戰略決策層面,美國都未能保住那一波通訊浪潮。而 AI 是新的機會,“我們不能再輸”。為了維持全球領先,美國必須在 AI 生態中贏得開發者。他指出,“任何平台的第一要務,是贏得全世界開發者”。當前全球大約 50% 的 AI 開發者位於中國,而 AI 開發者遍佈非洲、拉美、東南亞、中東等地,每個國家、每個產業都想接入 AI。他主張,美國不應限制 AI 技術擴散,而應確保全球開發者建構在美國技術堆疊之上,從晶片、系統、框架、工具到模型,讓“美國技術堆疊成為全球通用標準,像美元一樣具有全球影響力”。儘管 OpenAI、Gemini 等通用模型全球可用,但每個國家都應有能力建構本地 AI 系統。因為語言、歷史、文化、價值觀具有不可替代的本土特徵,任何西方技術企業都無法全面代表全球多樣性。因此他倡導“主權 AI”,即每個國家都有建設本土模型的能力,同時這些模型依然運行在美國主導的通用技術堆疊上。談及全球競爭格局時,黃仁勳重申,中國是競爭對手,但不是敵人”。兩國在產業鏈中相互依存,美國的計算產業擁有無與倫比的技術領導力,而中國也有製造能力強、工程技能深、國家榮譽感驅動下崛起的科技公司,例如華為和比亞迪。“這不是關於低成本勞動力,而是技術、工藝與規模的融合。”他認為,美國需要正視製造能力的缺失,重燃對“製造”的熱情,因為現在的製造早已高度技術化,不再是體力勞動主導的產業。川普提出的“再工業化”戰略是非常及時的政策調整,只有將 AI、製造、能源等關鍵領域的能力結合,美國才能真正減少依賴、緩和地緣風險、實現國家安全與產業持續領先。黃仁勳還呼籲,美國在制定 AI 政策時,不應止於限制與監管,更應認識到自身在 AI 與計算產業上所擁有的獨特能力與歷史成就 —— “戰略的第一步是認清自己”,只有在對自身能力充分理解之後,才能制定有效的對外策略。而在 AI 領域,這種自信、開放與全球主導力,正是美國繼續領先的根基。 (有新Newin)
區塊鏈開發者面試必備:6種常見共識演算法全解析
說在前面作為一個在區塊鏈搬磚多年的開發者,我發現共識機制是面試中最常被問到的技術問題之一。今天,我想梳理一下6種主流共識機制,為我也為你在面對相關問題時能夠準確、專業地回答。共識機制解決的核心問題在分佈式網路中,節點之間如何在沒有中心權威的情況下對某個值或狀態達成一致?這就是共識機制要解決的根本問題。簡單地來說,解決了三個核心問題:由誰來驗證、由誰來記帳、保障節點資料的一致性。核心概念一覽先給你一個全域視角,6種主流共識機制的關鍵特點:• POW(工作量證明):通過算力競爭達成共識,比特幣的選擇• POS(權益證明):通過持幣權重決定出塊權,以太坊2.0的選擇• PoH(歷史證明):Solana的創新,通過時間戳最佳化性能• DPOS(委託權益證明):代表投票制,EOS等鏈的核心• PBFT(實用拜占庭容錯):容忍惡意節點,聯盟鏈的安全選擇• Raft:強一致性演算法,分佈式系統的經典選擇,私有鏈和企業內部系統常用POW:算力即正義POW(Proof of Work)是最早也是最知名的共識機制,比特幣網路就是基於這個演算法運行的。打個比方:這就像數學搶答賽,誰最快算出答案誰就獲得記帳權。實現原型// POW挖礦核心邏輯func mine(blockData []byte, difficulty int) (uint64, []byte) {    target := make([]byte, 32)    // 設定目標值:前difficulty位為0    var nonce uint64    for {        data := append(blockData, uint64ToBytes(nonce)...)        hash := sha256.Sum256(data)        if bytes.Compare(hash[:], target) < 0 {            return nonce, hash[:]        }        nonce++    }}優缺點:• ✅ 安全性在比特幣網路中經過長期驗證,去中心化程度高• ❌ 能耗巨大,吞吐量低(比特幣約7TPS)POS:持幣即權力POS(Proof of Stake)通過持幣數量而非算力來決定出塊權。打個比方:這就像股東大會,持股多的人有更大發言權。實現原型// POS驗證者選擇演算法type Validator struct {    Address string    Stake   uint64}func selectValidator(validators []Validator, seed []byte)string {    totalStake := uint64(0)    for _, v := range validators {        totalStake += v.Stake    }    // 基於質押權重和隨機數選擇    target := binary.BigEndian.Uint64(seed) % totalStake    current := uint64(0)    for _, v := range validators {        current += v.Stake        if current >= target {            return v.Address        }    }    return""}以太坊2.0的實現要點• 質押要求:最少32 ETH(2025年Pectra升級後單個驗證者最大可質押2048 ETH)• 時間結構:每12秒一個slot,32個slot組成一個epoch• 最終確定性:2個epoch後交易具有最終確定性優缺點:• ✅ 能耗極低,出塊速度快• ❌ "富者愈富"問題,Nothing at Stake攻擊風險DPOS:代議制民主DPOS(Delegated Proof of Stake)通過投票選舉出少數代表來負責出塊,如EOS選出21個超級節點。打個比方:這就像議會制,大家投票選出代表來做決定。實現原型type BlockProducer struct {    Name  string    Votes uint64}func electProducers(candidates []BlockProducer, count int) []BlockProducer {    // 按得票數排序    sort.Slice(candidates, func(i, j int)bool {        return candidates[i].Votes > candidates[j].Votes    })    iflen(candidates) < count {        return candidates    }    return candidates[:count]}優缺點:• ✅ 高性能(EOS約4000 TPS),快速確認• ❌ 去中心化程度低,存在賄選風險PoH:時間排序的創新PoH(Proof of History)是Solana的核心創新,通過可驗證延遲函數建立時間序列,實現高性能。打個比方:像鐘錶,先有了準確的時間,再安排誰做什麼事。通俗理解想像一個場景:你要證明某張照片是在特定時間拍的,但沒有時間戳。傳統方法是找證人,但PoH的做法是:讓你在拍照前做一萬次伏地挺身,每次都拍下來。因為伏地挺身必須一個一個做(無法作弊),所以照片的順序就證明了時間的先後。Solana的PoH就是這個原理:通過SHA256雜湊運算(相當於伏地挺身)建立無法偽造的時間序列。需要注意的是,PoH本身不是完整的共識演算法,而是一種時間排序機制,Solana將其與PoS結合使用。實現原型// PoH條目結構:每個條目包含雜湊值和計數type PoHEntry struct {    Hash  []byte// 當前的雜湊值,作為時間證明    Count uint64// 計數器,表示執行了多少次雜湊運算}// 生成PoH序列的核心函數func generatePoH(initialHash []byte)chan PoHEntry {    // 建立一個緩衝通道,用於傳遞PoH條目    entries := make(chan PoHEntry, 1000)    // 啟動一個goroutine持續生成PoH序列    gofunc() {        hash := initialHash // 從初始雜湊值開始        count := uint64(0)  // 計數器初始化為0        for {            // 關鍵步驟:對當前雜湊值進行SHA256運算            // 這個過程必須序列執行,無法平行加速            hash = sha256Hash(hash)            count++ // 每次雜湊運算後計數器加1            // 將新的PoH條目傳送到通道            // 每個條目都包含當前雜湊值和計數            entries <- PoHEntry{                Hash:  hash,  // 雜湊值作為時間戳的證明                Count: count, // 計數表示從開始到現在的"時間"            }            // 這個循環會持續運行,不斷生成時間證明            // 就像時鐘的滴答聲,為網路提供時間基準        }    }()    return entries}// 驗證PoH序列的函數func verifyPoH(entries []PoHEntry, initialHash []byte)bool {    currentHash := initialHash    for i, entry := range entries {        // 重新計算雜湊值        currentHash = sha256Hash(currentHash)        // 驗證雜湊值是否匹配        if !bytes.Equal(currentHash, entry.Hash) {            returnfalse        }        // 驗證計數是否正確        if entry.Count != uint64(i+1) {            returnfalse        }    }    returntrue}Solana的混合架構Solana = PoH(時間排序)+ PoS(共識安全)性能表現:• 理論TPS:65,000+• 出塊時間:400毫秒• 確認時間:約12.8秒優缺點:• ✅ 極高性能,支援平行處理• ❌ 硬體要求高,相對中心化PBFT:拜占庭容錯PBFT(Practical Byzantine Fault Tolerance)解決拜占庭將軍問題,廣泛用於聯盟鏈。打個比方:這就像軍事會議,將軍們必須達成絕對一致才能行動。實現原型三階段協議type PBFTMessage struct {    Phase     string// "pre-prepare", "prepare", "commit"    View      int    Sequence  int    Digest    []byte    NodeID    string}func (n *Node) handlePBFT(msg PBFTMessage) {    switch msg.Phase {    case"pre-prepare":        // 驗證提案,傳送prepare消息        n.sendPrepare(msg)    case"prepare":        // 收集prepare消息,超過2f+1個則傳送commit        if n.prepareCount >= 2*n.faultCount+1 {            n.sendCommit(msg)        }    case"commit":        // 收集commit消息,超過2f+1個則執行        if n.commitCount >= 2*n.faultCount+1 {            n.executeRequest(msg)        }    }}優缺點:• ✅ 強一致性保證,快速最終確認• ❌ 通訊複雜度高(O(n²)),不適合大規模網路Raft:工程師的簡單選擇Raft將一致性問題分解為領導者選舉、日誌複製、安全性三個子問題。打個比方:像班級選班長,選出一個領導者負責組織大家。type RaftNode struct {    state     string// "follower", "candidate", "leader"    term      int    votedFor  string    log       []LogEntry    commitIndex int}func (n *RaftNode) requestVote() bool {    n.term++    n.state = "candidate"    n.votedFor = n.id    votes := 1// 自己的票    for _, peer := range n.peers {        if peer.vote(n.term, n.id) {            votes++        }    }    if votes > len(n.peers)/2 {        n.state = "leader"        returntrue    }    returnfalse}我在參與一個聯盟鏈BaaS項目時發現,Hyperledger Fabric 1.x使用了PBFT類演算法,而2.x使用Raft作為排序服務的共識機制,實現相對簡單,偵錯和維護都比較容易。優缺點:• ✅ 演算法簡單,易於理解和實現• ❌ 需要奇數個節點,不適合惡意環境不可能三角理論下的技術取捨V神提出的區塊鏈不可能三角理論認為:去中心化、安全性、可擴展性無法同時達到最優。選擇決策框架基於我的實際項目經驗,不同場景下的選擇建議:公鏈場景• 優先去中心化和安全性(數字貨幣):POW或POS• 優先性能(DeFi、遊戲):PoH或DPOS我觀察到Solana生態中的Raydium等DeFi項目,都充分利用了PoH的高性能特性,實現了中心化交易所等級的使用者體驗。聯盟鏈場景• 強一致性需求:PBFT• 簡單可靠:Raft從我的學習調研中發現,國內的聯盟鏈項目廣泛採用了這兩種演算法:• 某蟻鏈:基於PBFT的改進版本,用於支付寶的區塊鏈業務• 騰訊TBaaS:支援PBFT共識,服務於騰訊雲的企業客戶• 某為雲區塊鏈:同時支援PBFT和Raft,根據業務場景選擇私有鏈場景• 企業內部系統:Raft(性能優先,參與者可信)• 需要拜占庭容錯:PBFT(參與者可能惡意)面試要點總結面試中的關鍵答題框架:1. 原理解釋:用打個比方說明演算法核心機制2. 優缺點對比:基於不可能三角分析權衡3. 應用舉例:提及具體區塊鏈項目4. 場景選擇:根據業務需求推薦合適機制常見面試問題示例:• "為什麼以太坊要從POW轉向POS?"• "Solana的PoH機制如何提升性能?"• "聯盟鏈為什麼選擇PBFT而不是POW?"記住,共識機制的選擇沒有標準答案,重要的是理解每種機制的設計理念和適用場景。 (明技術堆疊)
刷螢幕了!剛剛,華為重磅宣佈!
華為鴻蒙6作業系統首次亮相,華為雲盤古大模型5.5重磅發佈一年一度的華為開發者大會於6月20日揭幕。在6月20日下午舉行的主題演講環節,鴻蒙、華為雲都有重磅消息發佈:華為鴻蒙6作業系統首次亮相,華為雲盤古大模型5.5發佈,新一代升騰AI雲服務全面上線。華為鴻蒙6作業系統首次亮相開發者Beta版同步開放華為常務董事、終端BG董事長余承東宣佈「鴻蒙 HarmonyOS 6作業系統來了」,隨後還宣佈HarmonyOS 6啟動開發者Beta。據悉,HarmonyOS 6開發者Beta版首次發佈鴻蒙智能體框架( HMAF, HarmonyAgent Framework),並帶來全新的鴻蒙智能體。首批50+鴻蒙智能體即將上線,涵蓋多個場景的不同應用。據華為終端BG CEO何剛介紹,HarmomyOS 6有多項關鍵創新。全新的互聯架構,在更低時延的連接優勢之上,為使用者帶來了更智感易用、更開放創新的互聯體驗。「碰一碰」分享覆蓋到了更多裝置,手機與電腦觸碰即可互傳圖片、影片檔案。HarmonyOS 6開發者Beta在底座技術、開髮套件、場景化解決方案、生態共建等方面實現了全面提升。為了激勵更多創新,華為推出鴻蒙星光計畫,將投入總額1億元的現金與資源,支援更多人才在鴻門沃土探索創新。余承東稱,經過635個日夜,鴻蒙生態已從應用鴻蒙化階段走向了「指數級擴張」的飛輪加速新階段。開源鴻蒙是發展最快的開源作業系統,程式碼已超過1.3億行,開發者突破800萬人。「搭載HarmonyOS 5的華為終端產品已超40款,系統功能增加260多項。鴻蒙應用的體驗也以日新月異的速度更新,累計有9000多個應用參與了70多個系統級創新體驗的聯合打造,目前有3萬多鴻蒙應用和元服務在加速開發、更新。」余承東說。華為雲盤古大模型5.5重磅發佈五大基礎模型全面升級華為常務董事、華為雲端運算CEO張平安正式發表盤古大模型5.5,自然語言處理(NLP)、電腦視覺(CV)、多模態、預測、科學計算五大基礎模型全面升級,加速重塑千行萬業。「盤古大模型是基於升騰雲的全端軟硬體訓練而成的,這標誌著基於升騰架構可以打造出世界一流大模型。」張平安強調。盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上升級,提升使用者體驗。例如,盤古提出了自適應快慢思考合一的技術,透過建構難度感知的快慢思考資料和兩階段漸進訓練,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回覆,複雜問題深度思考,整體模型推理效率提升8倍。「在過去的一年中,盤古大模型持續深耕行業,已在30多個行業、500多個場景中落地,在政務、金融、製造、醫療、煤礦、鋼鐵、鐵路、自動駕駛、氣像等領域發揮巨大價值。」張平安介紹。新一代升騰AI雲服務全面上線打造最適合大模型應用的算力服務張平安宣佈,基於CloudMatrix384超節點的新一代升騰AI雲服務全面上線,為大模型應用提供澎湃算力。據他介紹,隨著大模型訓練和推理對算力需求的爆炸性增長,傳統計算架構已難以支撐AI技術的代際躍遷。華為雲新一代升騰AI雲服務基於CloudMatrix384超節點,首創將384顆升騰NPU和192顆鯤鵬CPU通過全新高速網路MatrixLink全對等互聯,形成一台超級“AI伺服器”,單卡推理吞吐量躍升到2300 Tokens/s。當前,升騰AI雲服務已成為AI基礎設施的最優選擇,為超過1300家客戶提供澎湃的AI算力,加速千行萬業智慧化升級。例如,在科研領域,中科院基於CloudMatrix384超節點打造了自己的模型訓練框架,快速建構了中科院AI for Science科研大模型,擺脫了對國外高性能AI算力平台的依賴。華為雲發佈CloudRobo具身智慧平台為具身智慧裝上“大腦”和“小腦”2025年被譽為「具身智能元年」。CloudRobo具身智慧平台也於6月20日正式發表。張平安強調,華為雲不做機器人本體,而是把機器人本體交給夥伴,“華為雲的目標是讓一切聯網的本體都成為具身智慧型手機器人”。平台基於盤古大模型的多模態能力及思考能力,整合了資料合成、資料標註、模型開發、類比驗證、雲邊協同部署以及安全監管等端到端能力,能提供三大核心模型,加速具身智慧創新。具身多模態生成大模型,能為具身智慧型手機器人提供一個跟物理世界一致的數字空間,建構海量的資料樣本支援不同場景的泛化訓練。具身規劃大模型,即具身大腦,可針對機器人在真實環境互動中的實際需求,提供空間感知、環境互動理解、具身推理的能力。具身執行大模型,即小腦,驅動機器人完成高精度、可泛化的各項動作控制,目前已經全面覆蓋了工業領域。未來,華為雲還將探索具身智能在更多工業領域的應用。 (中國基金報)
鴻蒙,超炸裂升級! ! !
全面進化的HarmonyOS 6,來了!6月20日,華為開發者大會(HDC 2025)如期召開,華為終端BG董事長余承東公佈了鴻蒙系統的成績。他表示,OpenHarmony是發展最快的開源作業系統,程式碼已超過1.3億行,軟硬體產品超過1200款,鴻蒙應用和元服務超過3萬款,目前已有超過40款終端產品搭載HarmonyOS 5。(圖源:HDC2025)儘管與Android、iOS等平台數百萬款應用程式相比,鴻蒙應用程式數量不算多,但考慮到TOP5000應用程式已佔用戶使用手機總時長的99.99%,這三萬款應用程式和元服務已經足夠覆蓋絕大多數用戶的日常使用需求。在開發者大會上,余承東公佈了HarmonyOS 6,並宣佈HarmonyOS 6 Developer Beta版是針對開發者正式啟動。四大體驗全面進化,升級不只是“更流暢”華為終端BG CEO何剛表示,HarmonyOS全場景智慧作業系統的升級,主要在連結、智慧、安全、流暢四個方面。互聯一直是鴻蒙設備的強項,例如先前推出的碰一碰分享功能,已支援50+應用,全新升級後,碰觸功能將支援一發多收、快速組隊等功能。(圖源:發表會現場)跨裝置辦公時,手機碰一碰電腦,即可將相簿中的圖片插入電腦端運作的WPS中,也可以透過碰一碰,將手機平台的影片素材上傳至電腦平台的剪映軟體,方便使用者進行創作,還有100+應用程式支援音樂、小說等內容跨裝置無縫串流。星閃技術為鴻蒙產品跨設備互聯提供了技術基礎,基於該技術精準定位、更快速度、更廣覆蓋、更低時延的特性,華為將構建出多設備協同矩陣,不僅要覆蓋手機、平板電腦、個人電腦常見設備,還要向麥克風、相機、無人機等領域延伸。(圖源:發表會現場)智能方面,在盤古大模型的加持下,小藝助理全面升級,但更重磅的是HMAF鴻蒙智能體框架,包含應用和智能體層、協議層、平台層,能夠實現更自然的人機互動、更強大的智能化能力、更高效的連續服務閉環,以及智能體協同完成複雜任務。平台層小藝智能體開放平台,向開發者提供了50+鴻蒙智能體外掛,相容MCP工具,並且支援全場景智能協同,首批將有50+鴻蒙智能體上線,覆蓋購物、影音娛樂、出行、社交等多個領域。例如在大眾點評智能體可為用戶總結店鋪評價、預約、智能推薦餐品;深航智能體可以一句話完成機票的預訂、退改、值機等操作,還能向用戶推薦觀景機位;碼上飛智能體更是可以根據用戶的指令和需求文檔進行編程,用戶能夠用其開發鴻蒙應用。(圖源:發表會現場)HMAF鴻蒙智能體框架打通了感知、決策、行動全鏈路,並實現了跨平台操作,推動人機互動從傳統的GUI(圖形用戶介面)向LUI(語言用戶介面)轉變,讓應用生而智能,將AI徹底融入了系統底層,賦予了手機App全新形態。在用戶越來越重視資訊安全的今天,HarmonyOS 6貼心加入了星盾安全架構,專注於升級AI防窺保護和AI防詐保護。開發者的應用程式存取防窺保護後,可以隱藏部分內容,如釘釘傳送檔案、圖片,或使用相機掃碼時,只能存取使用者允許的最小資料集合,系統感知到別人在看使用者手機螢幕時,會自動隱藏聊天訊息。(圖源:發表會現場)AI防詐保護則可以智慧識別刷單、機票退改等經典騙局,並及時阻斷有風險的交易,保護用戶財產安全。最後則是流暢性升級,華為方舟引擎包含圖形引擎、多媒體引擎、記憶體引擎、調度引擎、儲存引擎、低功耗引擎、Web引擎,將軟硬雲生態深度整合。《王者榮耀》官方表示,得益於方舟圖形引擎,遊戲跟手性相較上一代提升21%,方舟多媒體引擎則為遊戲帶來了更好的通話降噪效果,未來該遊戲還會上線碰一碰傳輸更新包,加快用戶的遊戲更新速度,升級用戶與好友的開黑體驗。應用數量落後於Android、iOS等平台的鴻蒙,不僅在生態方面緊追著猛趕,更著力於推動體驗的全方位升級。 HMAF鴻蒙智能體框架的到來,可以說做了Android和iOS都難以做成的事情。鴻蒙系統快速發展的前提,則是長期支援鴻蒙系統的開發者,未來鴻蒙系統豐富生態、升級體驗,也離不開他們的支援。鴻蒙如何不斷降低開發成本?鴻蒙作業系統涵蓋手機、平板電腦、個人電腦、汽車,以及許多物聯網設備,若是一套軟體重複開發,費時費力在所難免,還會增加開發者的成本,導致開發者不願意為用戶相對較少的鴻蒙設備適配應用。沒有歷史包袱的鴻蒙系統,堪稱對開發者最友善的作業系統。該系統自2019年首次公開發布以來,始終堅持一次開發多端部署理念,統一SDK,多個設備共用一套API,大幅降低了工程複雜度。以蜻蜓FM為例,完成開發後,僅4人天工作量就完成了對鴻蒙平板的適配,3人天完成雙折疊適配、3人天完成闊折疊適配、3人天完成鴻蒙電腦適配、0人天完成三折疊適配。程式碼重複使用率高,加上多端模擬器一次修改多端呈現的特性,讓鴻蒙作業系統跨平台適配效率極高。(圖源:發表會現場)鴻蒙系統對開發者的友善遠不止於此,華為專為鴻蒙開發者打造了DevEco CodeGenie超級助手。 DevEco CodeGenie擁有多達21億tokens的資料庫,能夠提供程式碼續寫、問題定位、UI生成、智慧修復、智慧問答、智慧探索等輔助功能。鴻蒙開發者檔案全面更新,提供2000+典型開發場景和120萬行範例程式碼,檔案總規模高達1100萬字,HMOS程式碼工坊也將上架應用市場。(圖源:發表會現場)華為考慮到了開發者加入鴻蒙大家庭的困難,透過一次開發多端部署的特性,以及提供的DevEco CodeGenie、開發者檔案、HMOS程式碼工坊,幫助開發者縮短應用開發周期和降低開發成本,並便於向其他平台適配移植,實現了開發成本1+1+1<2的效果。華為表示,攜程App跨平台代碼復用率高達80%,京東App跨平台代碼復用率高達85%,Mindmaster程式碼復用率更是達到了95%。除了降低用戶的開發難度,華為在本次開發者大會上也宣佈推出鴻蒙星光計劃,並投入1億元激勵校園開發者。同時,華為自研的倉頡程式語言也將於7月30日開源編譯器、執行時間、標準函式庫。(圖源:發表會現場)開發者永遠是鴻蒙系統最堅定的基石,碼上飛智能體和DevEco CodeGenie超級助理的出現,大幅降低了鴻蒙應用開發的難度,甚至要讓每個人都能成為鴻蒙應用的開發者。不懂程式設計的一般人,或許難以用這些工具開發出複雜的應用,但可以試著透過提示詞結合自己的需求開發一些小遊戲或簡單的應用,加速鴻蒙系統豐富生態的速度。星光計畫則從源頭抓起,吸引仍在校園的準程式設計師擁抱鴻蒙作業系統,培養鴻蒙開發者。儘管取得了這麼多耀眼的成績,鴻蒙生態依然有很長的路要走。不能高枕無憂,鴻蒙之路道阻且長前段時間華為發布的Pura 80系列手機,出廠預裝HarmonyOS 5.1,不支援回退版本,徹底鎖死了「混血鴻蒙」的後路,也讓開發者看到了華為的決心,不再留有僥倖心理。3萬餘款應用程式和元服務,涵蓋了用戶99.99%的用機時間,頭部開發者團隊的加入,已經為鴻蒙構建起了穩健的生態,但總有一些用戶數量較少卻可能在某個時間影響到用戶體驗的App,尚未適配鴻蒙系統。若想吸引這些小型開發者團隊,華為需要做的是讓他們看到鴻蒙系統的前景。Pura 80系列預裝純血鴻蒙,擺明了要與Android一刀兩斷,開發者必須權衡是否應投入鴻蒙大家庭。而為華為手機開發應用程式後,開發者可能又要思考,既然所需成本不高,是否應將應用程式移植到其他鴻蒙設備。鴻蒙系統的優點便在於此,快速豐富生態的不只是手機、平板電腦等用戶規模龐大的設備,就連個人電腦、汽車應用生態也將迅速壯大起來。回到HarmonyOS 6本身,華為在手機廠商紛紛喊出「All In AI」時率先出手,將AI智能體融入系統底層,方便開發者定製智能體,讓每個應用都可以擁有自己的Agent。(圖源:雷科技攝製)身為業界領導者的蘋果,則選擇將Apple Intelligence端側大模型向開發者開放,Foundation Models框架原生支援Swift,開發者僅需為應用程式加入三行程式碼,就能存取Apple Intelligence端側模型,並將AIGC能力整合到應用程式中。從華為和蘋果的表現來看,向開發者開放底層AI能力,將成為下個階段AI OS的核心要務。面對擁有數百萬款應用程式的Android和iOS生態,華為還需要漫長的時間追趕,但在體驗方面,沒有相容性包袱的華為,透過底層融入AI和向開發者開放AI能力,實現部分場景的體驗領先。 (雷科技)
“無驚喜”的Google開發者大會:巨頭不再焦慮
“毫無驚喜”,大概是我在今年GoogleIO開發者大會首日主旨演講結束後,聽到的來自現場最多的評價:無論是來自參會的開發者,還是媒體同行,大家幾乎異口同聲。Google方面似乎對這樣的反響早有準備。在當天最早進行的主旨演講環節,Google首席執行官Sundar Pichai就部分解釋了大家可能會覺得“毫無驚喜”的原因:在大模型時代,已經不允許大公司再按照過去的活動節點來發佈產品更新,而是要求一旦模型和產品準備好,就要盡快發佈(ASAP)。這也道出了目前整個科技行業的現狀,也就是在“大模型時代”下(被Pichai稱為的“Gemini Era” (Gemini時代)),所有參與其中的公司都在爭先恐後。對於Google來說,儘管經歷過OpenAI與微軟深度繫結合作以及Perplexity等後起之秀崛起的焦慮,但如今已經找到了正確的節奏。具體來講,Google通過將旗下Deepmind團隊與GoogleAI團隊深度整合,打通了一條從底層大模型研發、到融入具體應用產品場景的順暢通路:一方面不斷增強底層大模型的整體實力,另一方面賦予旗下應用和產品更多、更強的AI能力,Google“兩條腿走路”的戰略,已經取得了實質性的進展:目前Google最新大模型Gemini 2.5在各主要評測標準方面都處於行業領先。同時,開發者與終端使用者對AI的使用出現了實質性增長。Pichai稱,全世界正在接受AI。根據Google方面提供的資料,去年同期,Google全部產品和API每月的處理Token數為9.7兆,如今這一數字達到了480兆,是去年同期的50多倍。從ChatGPT正式對外發佈不到3年的時間,Google搜尋不僅未被取代,反而因融入了更多的AI能力,而獲得了新的增長機會。根據Pichai當天展示的資料,Google搜尋AI Overview從去年10月至今半年多時間增長了10%。儘管被評價為“毫無新意和驚喜“,但2025年Google的IO開發者大會,卻是過去幾年來Google顯得最篤定的一屆。“不完美”的演示贏得最多掌聲GoogleIO開發者大會美國時間5月20日在美國山景城Google總部如期舉辦,幾乎毫無意外,此次Google開發者大會的唯一主題就是AI,從當天的具體發佈來看,可以說穩定發揮,驚喜不足。當天發佈會的唯一亮點,出現在發佈會的尾聲,GoogleAndroidXR負責人Shahram Izadi登台,在進行眼鏡即時對話翻譯功能時,Izadi提前“警告”:“這是一次有風險的演示(risky demo)。結果也確實如此,當Izadi與同樣佩戴Google眼鏡原型機的同事進行不同語言的即時對話時,眼鏡上並未能即時流暢地生成翻譯文字,畫面出現卡頓,最終該Demo未能順利完成。“我說過這是‘危險的演示’。“Izadi在台上尷尬地笑著解釋,但話音未落,台下卻爆發出當天整場發佈會最持續和最響亮的掌聲,伴隨著幾乎所有在場觀眾的會心一笑。AndroidXR作業系統,可以說是承載著Google重啟眼鏡項目的全部希望。十幾年前發佈的Google眼鏡,被認為是一項失敗的項目,甚至一度成為了經典的商業失敗案例,無論是當時的眼鏡物理尺寸,還是軟體層面的適配以及實際使用上的不切實際,都幾乎註定了Google眼鏡當時的命運,然而在如今的大語言模型時代,Google又看到了重啟眼鏡項目的希望。AndroidXR是Google打造的基於物理現實世界的作業系統,目標很明確,就是用於眼鏡等可穿戴裝置,該作業系統在去年發佈,在今年的IO上正式對外亮相,AndroidXR深度整合了GoogleGemini大模型,希望能夠通過充分運用大語言模型的識別、理解能力,讓智能眼鏡變得真正可商用。當天Google在台上進行的演示,正是最容易讓普通人接受和理解,並且最實用的一種功能,即時對話翻譯,借助智能眼鏡內建的麥克風、揚聲器,以及與智慧型手機連接,打通Gemini大語言模型,理論上就可以實現戴著智能眼鏡的人,用不同語言都能夠進行任何無障礙的交流。無論當天的發佈會上的“不完美“是出於現場網路訊號的原因,還是AndroidXR系統自身bug,抑或是底層大模型本身無法正確理解或翻譯語音,這些細節實際上都不重要了,最重要的是,Google向外界展示了未來智能眼鏡所具備的能力,即便是現在做的還不夠”完美“,但這樣的未來,已經足夠贏得熱烈的掌聲和期待。Google正在變得更為務實Google在眼鏡項目的演示上所展現出的“務實性“,也是當天整場發佈會、甚至過去這幾年Google發展的一個註腳,自從科技行業整體進入大語言模型時代以來,Google作為曾經網際網路時代無可爭議的霸主,正在不斷重新思考和調整自己的定位。無論是微軟與OpenAI曾經緊密的戰略合作,還是後起之秀Perplexity以“顛覆Google”之名崛起,都令這家曾經的搜尋巨頭焦慮無比。但至少目前來看,Google並沒有自亂陣腳。當天Google首席執行官Sundar Pichai的主旨演講的題目為“從研究到現實“(from research to reality),這正是Google在生成式人工智慧時代的戰略主線。通過將旗下因AlphaGo一戰成名的Deepmind與GoogleAI部門進行整合,Google在公司內部成功打通了將大語言模型,迅速賦予各個產品線和應用場景的一條通路。在2025年的Google開發者大會上,儘管沒有驚喜和意外,但Google呈現出的是如何運用大語言模型,將旗下的應用全部AI人工智慧化一遍。首先作為Google的立足之本-搜尋業務,Google在當天宣佈,將推出搜尋的AI Mode(AI模式),直接將Gemini AI對話機器人納入到搜尋框,Search Live功能將運用Gemini大模型的多模態能力,即時通過攝影機捕捉到的現實場景,讓AI能夠就現實場景與使用者進行多輪對話。在Chrome網路瀏覽器中,Google將納入AI助手,讓使用者能夠直接進行瀏覽內容的資訊的彙總梳理以及對話等。在Gmail應用中,大模型會提取郵件的上下文,並幫助使用者撰寫郵件,根據對過去郵件內容的“學習“,大模型撰寫的郵件會顯得更像使用者平時的語氣。Google Meet線上會議應用將增加即時語言翻譯功能,讓不同語言之間的交流變得毫無障礙。在針對開發者方面,Google當天還宣佈了類似Github Copilot的Jules程式設計助手的Beta開放註冊,Jule被Google稱為非同步開發助理(async development agent),使用者通過自然語言便能夠對自己的程式設計項目進行修改,無論是幫助發現和更改Bug,還是新增功能等,Jules都可以為開發者提供幫助。當天Google還發佈了Stitch,一款獨立的幫助開發應用前端的AI工具,開發者通過自然語言描述等方式,就能夠快捷、方便地生成前端程序。一位現場參與GoogleIO的開發者Daniel Wood對騰訊新聞《一線》表示,當天的IO發佈會“毫無驚喜“(nothing exciting),但是可以看出Google的努力。“他們正在讓每一個產品變得更加智能、變得更好,也提供了更多好用的工具給開發者,這就足夠了。“Wood表示。從研究到現實:Google打通AI通路Pichai在當天主旨演講中表示,通常來說,在GoogleIO開發者大會前幾周,你都不會聽說太多關於產品的更新,因為我們會把好的模型發佈放到發佈會當天發佈,但在Gemini時代,我們把我們最好的模型和產品盡快給到你們手中。Pichai在演講中同時展示了一張Google近年來的產品發佈圖,被稱為“relentless pace”(毫不留情的節奏)這段話一定程度上回應了為何外界會覺得Google發佈會毫無新意、毫無興奮點,因為Google不再將最好的模型一直留到發佈會當天才發佈,而是一經達到發佈條件便選擇直接發佈,但這又在客觀上反映了另一個事實,那就是在大模型時代,各個大公司之“卷“,已經進入了白熱化階段,因為同行業的激烈競爭和快速進步迭代,已經讓大公司不可能再按照過去的節奏和步調去發佈產品和更新。同時,Google一方面增強底層模型能力,另一方面迅速將模型能力賦予各個產品和應用場景的“兩條腿走路“的戰略路線,正在越來越顯示出後勁。Google通過“研究向現實“推進的路線正在紮實推進,例如Project Starline衍生出的Google Beam和語音即時翻譯,Project Astra衍生出的Gemini Live,Project Mariner衍生出的Agent Mode(代理模式)等。Google最新的Gemini 2.5大模型無論在推理、多模態、程式碼生成等多個關鍵衡量指標方面都處於業內領先,同時,廣大的開發者終端使用者也確實在使用這些賦予AI能力的產品和應用,根據Google方面公佈的資料,Gemini應用目前有4億月活躍使用者,去年同期,Google全部產品和api每月的處理Token數為9.7兆,如今這一數字達到了480兆,是去年同期的50多倍。儘管受到“無新意”、”無驚喜“的評價,但今年的GoogleIO開發者大會卻可能是過去幾年來最篤定、最有底氣的一屆,同時可以預見的是,接下來幾年,Google可能同樣不會在開發者大會上給外界帶來”驚喜“,而是不斷通過大模型和應用的快速迭代和發佈,來進一步鞏固自己在新的大模型時代的地位。 (騰訊財經)