#生成圖像
震撼!人類第一張在太空生成的圖片曝光
【新智元導讀】人類第一張在太空中AI生成的圖片誕生了——「天地同算」時代正式開啟。註:圖片由部署在星溪04Pro天基算力平台上的z-image圖像生成模型生成太震撼了!這張圖片,不是誕生在地面的機房裡,而是來自數百公里之外的太空。它是被一顆衛星「算」出來的。原來,人類的計算能力,真的開始往天上長了。那種感覺,就像原本沉默了無數年的宇宙,忽然輕輕回了我們一句話。我們仰望星空幾萬年。這一次,它終於開始回應我們了。距地表數百公里的浩瀚星河,共績科技正通過一顆衛星用矽基大腦進行「思考」,完成了從無到有的運算與成像。將晶片送入太空,讓衛星成為會思考的算力節點。這聽起來像《三體》裡的情節,是不是?但我想告訴你,它不是科幻,而是源於兩家清華系企業的一場「天地同算」。擅長調度全球閒置算力的共績科技,與為晶片穿上「太空防護服」的星測未來——已經攜手將人類計算的邊界,從地面邁向星辰大海。01 讓衛星成為算力節點三大難要把地面的邏輯搬到太空,可沒那麼簡單,擺在團隊面前的是三座大山:第一座山:衛星算力「貴」太空環境惡劣:高能粒子如子彈可擊穿晶片,溫度從零下一百多度到一百多度劇烈變化。普通顯示卡上去,幾秒就被「打死」。太空算力極其稀缺,必須精打細算。第二座山:衛星在「動」地面伺服器是固定的,但衛星在天上飛。你沒法「固定」地調度,必須即時知道它飛到那裡、有沒有空、何時能接任務。第三座山:頻寬「窄」衛星通訊頻寬有限,調度指令和資料傳輸都得「精打細算」。02 這三座山,怎麼翻?共績科技解決的是:讓這些算力「能被隨時調度」。共績科技本質上是一家用AI演算法解決資源調度問題的公司。他們將電力調度思想遷移到算力領域,打造了全球首個閒時算力調度平台——讓算力像用電一樣,打開開關就有,用多少付多少。系統已整合全球70萬+閒時算力裝置,實現了99.99%的穩定性,徹底打破了算力行業「彈性、低價、穩定」三者不可兼得的困局。在地面算力場景中,已實現規模化落地:聚合算力相當於2個長三角智算中心,服務5000+大中小型團隊及企業,助力客戶降低算力成本超50%幫助中國最大文生圖社區LiblibAI解決「夜裡閒置、白天排隊」的痛點,成本直接砍半幫助3D AI應用Remy在48小時內扛住50萬使用者的「潑天流量」,算力從百卡秒級擴容到近2000卡推出國內首個專注AI推理的Serverless GPU平台,實現秒級擴縮容、毫秒級計費今天,這家擅長「調度閒置顯示卡」的公司,要把這套「調度服務」,做到太空裡去。星測未來解決的是:讓太空有算力「可用」。這家脫胎於清華「天格計畫」的公司,專攻一件事:將AI送上太空。他們的系統級抗輻照與容錯加固技術,讓商用晶片不懼太空惡劣環境,在軌穩定運行,並通過輕量化演算法和軟硬體協同最佳化,在衛星資源有限的條件下,讓AI 幫助衛星自主運行、智能處理。憑藉此技術,他們已在全球率先實現12nm、7nm GPU晶片的在軌運行,最長在軌近5年。今年2月,他們更在國際上首次將DeepSeek大語言模型部署到了衛星上,讓太空算力在電網線路安全監測、城市內澇分析預警、金融航運監控等場景應用落地。如今,星測未來在軌及待發射平台近百套,一年內將形成數十P的算力規模,徹底築牢太空計算的物理底座。兩家清華系公司,一個打地基,一個蓋高樓。03 從「天數地算」到「天數天算」先說個概念。傳統衛星(天數地算)是怎麼工作的?拍圖、存圖、等過境、傳地面、地面處理、再下發。一顆衛星拍下一張高畫質圖,如果恰好在頭頂,幾分鐘傳完;如果飛到了地球另一邊,你得等它繞回來。更致命的是,地面通訊現階段存在「過境問題」,頻寬並不高。問題來了:如果衛星拍到的是森林起火、海上沉船呢?你希望地面人員立刻知道,而不是等幾小時後看一張「過期圖」。「天數天算」應運而生。衛星自帶算力和模型「看懂」這張圖,自己先做判斷,清晰地傳回地面,給出精準的結論——比如一行字、一個坐標。資料量被極致壓縮,傳輸時間從「小時級」縮短為「秒級」。把AI模型部署到衛星上,讓衛星成為隨叫隨到的算力星座。但這還不夠。共績科技和星測未來要做的是「天地同算」——讓太空算力和地面算力,像同一個大腦的兩隻手,隨時切換,無縫配合。04 「天地同算」未來的星辰大海基於這一願景,硬體與邏輯已全面打通,兩條路徑正在平行:路徑一:天數天算(應急與預警)衛星拍完資料,直接在太空處理。森林火災秒級發現、海上搜救即時定位。戰術上甚至可以「提前在衛星上預置模型」,地面只需發一條極小的指令,衛星就能在太空中生成圖片並傳回。路徑二:地數天算(算力外包)當地面算力緊張,比如突發大模型訓練需求,直接把任務「扔」到太空裡的分佈式衛星星座去算。說得直白點:只要頭頂有衛星,腳下就有算力。但這是未來的星辰大海。目前,衛星上的端側算力在幾百TOPS到1000TOPS(1P)左右,類似一台高性能伺服器。按照行業測算,明年有望發射單顆具備100P算力的節點星;到2030年,通過分佈式星座的組建,有望在太空中實現10萬P的驚人算力規模。到了那時,衛星就不只是自己用算力了。富餘出來的算力,將構成一張懸浮在地球之上的「分佈式超級電腦」。當「天地同算」的願景成為現實,當太空中的分佈式超級電腦隨時響應地面的每一個算力需求,你會發現:原來,科幻片裡的場景,早就成了現實。只是,你還沒意識到而已。而這一切,才剛剛開始。 (新智元)
Google Gemini 3 深夜炸場:沒有懸念的最強 AI
新王登基了。來了。預熱了快一個月的 Gemini 3 Pro,就在剛剛,正式在 Google AI Studio 上線 Preview 版,API 也同步開放。接下來將陸續上線Google的各項產品中。沒有任何多餘的廢話,打開 Model Card,滿眼寫著的只有兩個字:碾壓。按照 Google 披露的測試資料,Gemini 3 Pro 毫無懸念地成為了目前地球上數學最強的 AI。在數學競賽的「地獄模式」MathArena 裡,當包括 GPT-5.1 在內的其他大模型還在 1% 上下掙扎時,Gemini 3 Pro 直接幹到了23.4%。程式設計能力方面,雖然在 SWE-Bench 上未拿 SOTA——但絕對屬於第一梯隊。Live Code Bench 的 Elo 得分超過 2400 分 ,在工具呼叫和終端操作基準測試中更是名列第一。真正炸裂的是它的「視覺智能」。對螢幕截圖的理解能力高達72.7%,是目前最先進水平的兩倍。這意味著 Agent 不再是瞎子,它將徹底重塑 AI 操作電腦的模式。但這還沒完,Google 今晚還順手扔出了一個小王炸:自家的 Agentic 程式設計平台——Google Antigravity。此前網傳 Gemini 3 能實現「端到端程式設計」,大家以為是模型成精了。但看起來,並不是模型成精,而是 Google 正在探索如何用更好的系統工程實現端到端程式設計。如果說 Cursor 是目前最強的「外骨骼」,它通過 AI 補全讓你寫程式碼更快;那 Antigravity 就是奔著「自動駕駛」去的。它不再只是一個編輯器,而是一個智能體優先(Agent-first)發環境。整合了 Gemini 3 和能操控瀏覽器的 Gemini 2.5 Computer Use 模型,它的 Agent 能自己寫程式碼、自己開終端跑測試、甚至自己打開瀏覽器驗證 UI,發現報錯自己修。不講故事,只拼肌肉。Google 用這一波硬核發佈宣告:新王已至。有趣的是,這次連 Sam Altman 都獻上了自己的點贊。:)01 霸榜的暴力美學:不止是智商洗榜,更是 Agent 能力的變化在 AI 圈子裡,大家習慣了模型之間你追我趕的微弱優勢,但 Gemini 3 Pro 拋出的這份成績單,可以說十分耀眼。根據 Model Card 披露的資料,Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基準上,實現了全方位的霸榜。讓我們先看一看代表人類智力「天花板」的測試——Humanity's Last Exam(人類最終大考)。這是一個衡量學術推理極限的標尺,GPT-5.1 在此前的測試中得分為 26.5%,Claude Sonnet 4.5 僅為 13.7%。而 Gemini 3 Pro 它直接轟出了37.5%的高分。在高端推理層面,這 10 個百分點的差距,意味著模型在處理複雜學術問題時,已經具備了完全不同的理解深度。但這還不是極限。Google 甚至還藏了一手Gemini 3 Deep Think(深度推理模式),在不使用任何工具的情況下,它在 HLE 上的得分進一步飆升至41.0%。看起來人類最後的堡壘也並不能持續很久了。數理方面的每一個領域,都能看出它的統治力。AIME 2025(美國數學邀請賽):配合程式碼執行(Code Execution),Gemini 3 Pro 的精準率達到了驚人的100%。沒錯,是滿分。即便是「裸考」(無工具模式),它也有 95.0% 的精準率(相比之下,GPT-5.1 為 94.0%,Claude Sonnet 4.5 為 87.0%)。MathArena Apex(數學競賽地獄模式):當包括 GPT-5.1 在內的其他大模型還在1%上下掙扎時,Gemini 3 Pro 直接幹到了23.4%。這意味著在很多以前 AI 根本「看不懂題」的領域,Gemini 3 已經開始解題了。而更關鍵的是 Agent 相關能力的提升。Gemini 一向在多模態能力上領先,這一代更是專門最佳化了螢幕理解(Screen Understanding)。這是下一代 Agent 能否真正接管人類電腦的關鍵。看ScreenSpot-Pro這一欄資料:GPT-5.1:3.5%(這基本意味著它是個「瞎子」)。Gemini 3 Pro:72.7%。這是近乎20 倍的能力碾壓!這標誌著 Gemini 3 Pro 已經不再是一個單純的對話方塊,它具備了真正意義上的「視覺智能」,能夠像人類一樣理解複雜的作業系統介面。在一些傳統強項上,Gemini 3 Pro 仍然表現出色——比如支援1M Token的超大上下文窗口、對多模態資料的「原生支援」、長視訊和多語言處理等等。有一個很有趣的標準也被 Google 掛了上來:在 一個模擬開店賺錢的基準 Vending-Bench 2 上,Gemini 3 Pro 最終賺取了$5,478.16的淨資產,而 GPT-5.1 僅賺了 $1,473.43。不過關於之前網傳「徹底端到端終結程式設計師」的程式設計能力,Gemini 3 Pro 的狀態是在 AI 屆頂尖,但並沒有「顛覆程式設計」。在衡量軟體工程能力的SWE-Bench Verified測試中,Gemini 3 Pro 得分為76.2%,雖然很強,但並未超越 Claude Sonnet 4.5(77.2%)拿到 SOTA。這意味著在處理超長程、極其複雜的後端邏輯時,它依然有侷限性。這也很合理。每一個大模型目前都在全力卷程式設計的情況下,想要在這個領域一騎絕塵確實比較難。目前 Gemini 的能力更偏向於,還不能幫你重構整個後端架構,但如果你想寫一個極具現代設計美學的網站、一個 3D 飛船遊戲,或者生成複雜的 SVG 互動動畫,它能通過一次提示就給出極其驚豔的、可直接運行的結果。02 Antigravity,Agentic 程式設計的探索有了最強的模型和算力,Google開始在應用層「掀桌子」了。今晚,Google扔出了一個「小王炸」——Google Antigravity。前一陣新聞的風向還是模型公司努力收購 AI 程式設計應用公司呢,而 Google 這次則這麼快的就發了自己的開發平台。這不僅僅是一個新的 IDE,它是Google定義的Agent-first(智能體優先)開發平台。在這裡,開發者從「碼農」升級為「架構師」,而 Gemini 3 化身為擁有編輯器、終端和瀏覽器完整權限的「執行合夥人」。為了達成這種體驗,Google甚至在後台配置了一個「模型軍團」協同作戰:Gemini 3:作為大腦,負責高級推理和程式碼編寫。Gemini 2.5 Computer Use:作為手眼,專門控制瀏覽器進行 UI 驗證和測試。Nano Banana:作為美工,負責生成圖像和 UI 素材。這種打通了底層模型到頂層互動的閉環體驗,對於 Cursor 等現有 AI 編輯器來說,無疑是一次降維打擊。Antigravity 最有趣的能力在於平行。官方材料明確提到,開發者可以與多個智能 Agent 協作,而這些 Agent 能夠代表你同時 自主規劃並執行複雜的端到端軟體任務。想像一下這種工作流:你下達一個指令,Antigravity 瞬間分裂出多個 Agent——Agent A 負責寫後端邏輯,Agent B 負責在終端跑測試用例,Agent C 直接打開瀏覽器去驗證前端 UI 的互動效果。它們平行不悖,像是一個配合默契的敏捷開發小組,而你只需要驗收它們提交的「工件」。Antigravity 是是一個免費平台,網路上目前對於 Antigravity 的使用體驗不多,但基本上都是好評。要達到替代 Cursor 本身,肯定不太行——端到端的複雜程式設計體驗,肯定還需要模型更成熟。但是簡單的項目進行程式設計,或許會更簡單了。03 全家桶齊發力:TPU 與搜尋在大模型發展的後半程,比拚的不再是單一演算法的靈光一閃,而是誰的算力更冗餘、誰的資料更廣闊、誰的投入更持久。Gemini 3 Pro 的勝利,有一點是很特別的:Gemini 3 Pro 是使用 Google TPU 訓練的。當全世界的 AI 公司都在苦苦等待輝達 GPU 的發貨周期時,Google依然坐在自家龐大的 TPU 礦山上。TPU 專為 LLM 訓練設計,擁有極高的高頻寬記憶體(HBM),這讓它能夠輕鬆處理海量的模型參數和超大的 Batch Size。正是 TPU 的算力冗餘,給了 Gemini 3 Pro 肆意擴張參數規模的底氣。有了算力,還要有「燃料」。Gemini 3 Pro 的訓練資料是全維度的覆蓋:它吞噬了公共網路文件、程式碼庫、圖像、音訊和視訊。更關鍵的是,Google明確提到使用了User Data(使用者資料)——當然是在隱私協議框架下,來自Google龐大產品生態的使用者互動資料。最後,這種溢出的智能被注入了 Google Search。Google 這次推出了一個全新的AI Mode in Search。當你搜尋一個複雜概念(比如 RNA 聚合酶的工作原理)時,Gemini 3 不再是給你扔一堆冷冰冰的連結,而是利用其強大的推理能力,即時生成(Generated on the fly)一個沉浸式的互動圖表或模擬工具。從底層的 TPU 矽基霸權,到中間層的模型智能,再到頂層的 Antigravity 開發生態與生成式搜尋——Google這一夜展示的,不僅僅是一個滿分模型,而是一個只有巨頭才能建構的、嚴絲合縫的未來。04 實測體驗最後讓我們看看網上的一些實測體驗吧。出名的六邊形測試的升級款。不少帖子提及了設計上的美感。一些物理世界的建模。前面提到的,Gemini 對於使用者介面資料這塊做了特別的最佳化。開發應用。在今天,大模型的性能已然超越了跑分的邊界。即便是最頂尖、最複雜的前沿基準測試,其測量精度也開始失效。如何科學地量化模型之間的微妙差距,已經成為了一門專門的「量化科學」,僅憑使用者簡單的實測手感,很難窺見其中的全部玄機。實測案例更多的也就是用來看看模型本身的審美和 one-shot 直出的狀態。Gemini 3 顯然在這次的更新中,在直出的情況下,贏面很大。當模型直出能力越來越好,對於開發者來說,未來更多的是要看你的品味能不能跑過模型,你的點子是不是足夠與眾不同了。 (極客公園)