Gemini 3.0還在預熱,中國AI搶先!30秒造APP全網首測

【新智元導讀】Gemini 3.0還未殺到,一系列驚豔實測就已宣告:AI「生成湧現」時代,真的來了!幾乎同一時間,國內一款新生AI神器,竟將這股超能力塞進手機,30秒手搓一個APP。

2025年終AI壓軸大戲,本周強勢來襲!

這幾天,Google下一代AI模型預熱引爆全網,Gemini 3.0「全家桶」多款模型蓄勢待發。

此時此刻,全網都在坐等這場王炸發佈。

畢竟,OpenAI GPT-5.1小修小補,並未觸發所有人的G點。如今,Gemini 3.0幾乎成為「全村人」的希望。

社交媒體上,更多的驚豔實測demo曝光:一句話即生前端UI、作業系統介面,以及複雜的SVG動畫等等。


在這熱鬧喧囂之中,我們看到了——AI的下一個未來,是「生成湧現」

當前,AI正經歷一場深刻的範式轉變,從單一模態如文字/圖像的生成,逐步演進至「生成湧現」的新階段。

在這一全新範式下,Gemini 3.0正作為引領者,驅動著無限概念的生成與實現。

恰在今天,螞蟻靈光正式上線,一款集閃應用、對話、開眼於一體的全模態通用AI助手。

它的誕生,打開了「生成湧現」的另一種方式。

AI進入「生成湧現」時代

生成湧現,本質上是AI生成能力的「爆炸式擴展」。

提到「湧現」一詞,我們並不陌生。2022年,GoogleDeepMind史丹佛等在一篇論文中驗證了:

隨著模型的參數規模擴大,性能也會隨之提升,還能解鎖不可預測的全新能力。

他們將其稱之為,「大模型湧現」。它從新的維度,再次印證了Scaling Law不死。

論文地址:https://arxiv.org/pdf/2206.07682

而這裡的「生成湧現」,不在於內容本身,而在於前端與系統設計更高層次的應用重塑。

ChatGPT誕生後很長一段時間,傳統生成式AI更擅長「線性輸出」:prompt輸入,文字/圖片等單一模態輸出。

這種以單一模態的輸出,在2025年迎來一個新的拐點。

這一年,我們已見證了太多標誌性大事件——

原生多模態模型:Gemini 2.5、GPT-5、Grok 4等最具代表性
圖像模型:GPT-4o掀起吉卜力熱狂潮;Nano Banana引爆AI圖像編輯的熱潮
視訊模型:Veo 3首次實現音畫同步;Sora 2坐享創意領域的ChatGPT時刻
世界模型:李飛飛Marble一句話即生3D世界;GoogleGenie 3直出可互動環境



前沿模型的每一次進化,都在向著原生多模態方向演進,最終導向了「湧現式生成」。

也就是說,AI會像生態系統般,逐漸具備自主擴展能力,並融合多模態、即時編碼、動態應用的生成。

當參數超越更大的閾值時,模型不再侷限於線性預測,而會湧現出「系統級」的能力。

這種趨勢,在尚未真正露面的Gemini 3.0身上,愈發明顯。

一句指令,它便能一次性建構可用的Windows、macOS作業系統,一鍵克隆YouTube網站視訊可看、可互動小遊戲......

Karpathy調侃道,Gemini 3.0在你沒開口就能讀懂人類心思,甚至,還能和你的貓聊天

Gemini 3.0還把AI編碼上限推到一個全新高度,語言一鍵遷移,複雜的前端UI互動。

這種生成湧現的爆發力,就連「股神」巴菲特也為之動容。

可以篤定的是,未來AI的發展方向,或說下一個趨勢,便是朝著「生成湧現」這一範式演進。

要說生成,其能力邊界可以大到所有人無法想像,但最終落地時會是怎樣的一種形態?

同一時間點上,螞蟻靈光的登場,給業界提供了一條可行的路徑。

從模型層面上看,Gemini 3.0可以驗證系統、前端設計無限生成。但從產品層面看,靈光正開啟「生成湧現」普惠化的探索。

一個人人皆可在移動端,短短30秒內,一鍵建立日常小應用的神器。

靈光真正實現了「人人手搓AI」的夢想,完美詮釋了「生成湧現」的落地。

靈光一閃,人人進入生成時代

在這個人人皆可生成的時代,最不缺的就是「半成品」。

尤其在當下,氛圍程式設計、生成式音樂、生成式網頁、生成式視訊...似乎一切皆可由AI完成。

所有人都在瘋狂地「玩麵粉」,但很多AI生成的內容都是半成品,或者壓根不可用。

可人們真正想要的,從來不是麵粉、麵糰等,而是可以直接端上桌的饅頭、包子,甚至是要「好看又好吃」的那種。

這正是,靈光誕生的契機。

不管是打工人,還是學生,不管是老闆,還是普通人,皆需要一個既能生成「最終好用產品」的AI工具,而且生成的內容還要「好看」。

你需要什麼,就去造

靈光裡最強大的一個功能就是閃應用。

在對比了眾多國內外的通用AI產品後,靈光稱得上國內通用AI助手裡的一股清流,甚至可以說是獨特的一種存在。

靈光使用下來,給人一種,這是通用AI產品中的「iPhone」。

iPhone好用在於它開創了 「App Store」,定義了「下載應用」的時代,將手機從「通訊工具」變成了「萬能掌上型電腦」。

而靈光正在用「靈光閃應用」開啟下一個時代:從下載海量應用進化為即時生成專屬應用

  • iPhone App Store:你需要什麼,就去找
  • 靈光閃應用:你需要什麼,就去造

這是一種範式革命,它用30秒的「即時生成」取代了「搜尋、篩選、下載、安裝」的漫長鏈路,把創作權交給了普通人。

這個30秒的應用生成速度,體驗真香。

比如製作一個能夠分享,能夠解釋清楚最近網路熱梗「哈基米南北綠豆」的來龍去脈。

可以看到,閃應用不止於「靜態展示」,更擁有強大的「動態互動」能力。

這是因為,每個輕量級應用都可直接呼叫大模型等後端能力,不僅能展示結果,更能即時與外部進行互動。

這些應用真的就和APP一樣,在你的閃應用列表中,隨時可以呼叫。

不管是運動健⾝、旅⾏規劃,還是健康⻝譜、理財規劃,或者購物決策,這裡全靠發揮你的想像力!

當Cursor為首的程式設計IDE讓普通人離AI越來越遠時,當氛圍程式設計只屬於部分懂技術的「特權」時。

其實從這次Gemini 3的「路透」就能看出來,未來所有的產品都能「AI生成」,而且也必將AI生成。

AI會不斷吞噬掉所有工作內容。

於是,靈光也做了一次「減法」。

他們用「資訊美學」的方式,讓靈光的介面做到了極簡。

它不再讓你從紛繁的多模態工具中進行選擇,而是一次性「生成」一切。

用「資訊美學」融合全模態

簡單來說,資訊美學就是讓資訊變得既「好看」又「好懂」的藝術!

在AI時代,我們被捲入資訊的洪流。

從社交媒體,到新聞、報告充斥著冗餘的內容,其中大量還是AI生成的同質化、低價值的,讓獲取真實價值的資訊變得愈發困難。

所以AI時代最大問題並不是獲取知識,而是如何更好的組織知識,從繁雜的資訊海洋中撈到真正的珍珠。

一個有用的資訊不應該是深藏不露的或者長篇大論的,而應當是「恰到好處」。

比如雖然ChatGPT、Gemini等目前基礎功能都很強大,但是每次問題都要輸出一篇千字長文,讓關鍵資訊淹沒在長上下文裡。

或許,在底層模型卷無可卷的當下,我們需要一種新的AI產品形態。

全模態通⽤AI助⼿靈光,就是一個能把資訊變成藝術品的AI工具。

它不僅僅是把知識內容和資訊結構做得非常漂亮,而是提供了一種設計哲學,認為「美」本身就是一種功能

它通過視覺、聽覺甚至觸覺(如3D互動)來組織資訊,讓你在接收資訊的過程中感到愉悅、高效,並且能「秒懂」。

接觸資訊,感到愉悅,是的,這就是想像中,通用智能的那種感覺。

你沒有看錯,你甚至可以在靈光中創造3D模型,這已經脫離了一個對話AI的層面。

這一能力的實現,是因為靈光建構了「多智能體協作的Agentic架構」,讓生成不再是單一工具的線性操作。

在生成可視化內容時,它會調度圖像、3D、動畫等不同領域的專業AI智能體,讓其即時協作,提供更完整、更豐富、更沉浸的檢視體驗。

更值得一提的是,這一切皆可在移動端就能實現,在業界實屬罕見。

總結來說,靈光帶了一次內容生成的革新:它是首個實現了基於全程式碼生成的多模態內容輸出

當提出一個問題,它不只是「回答」,它會自動理解真實意圖,並立即以程式碼為核心,即時建構出結構化、個性化,且高度美觀可互動的可視化內容。

開眼:探索未來AI的產品形態

更令人欣喜的是,靈光這次探索了一種新的AI形態,攝影機+AI。

靈光開眼,這次讓AI睜眼看世界

雖然手機攝影機的參數已經捲到天際,但它還是一個死物,只負責記錄。

而在AI加持下,未來的攝影機,可以說是「具身智能」史前時代的最佳載體。

靈光開眼的識別成功率和速度很難讓人相信。

靈光開眼能夠準確識別生活中的幾乎任何物體。

甚至你還可以用靈光開眼來「找不同」,識別中容易被混淆的對象。

甚至可以用靈光總結了2025年9月份的阿里財報,還順便算出了同比(有點東西)。

再讓它解讀一篇論文,看看能否勝任?

打開Transformer經典之作,靈光一眼識別出這篇論文,並在接下來回答中,關於論文主旨、架構性能,全部給出了正確的解析。

讓普通人提前進入未來世界

如今,生成式AI發展的問題已經不是「生成」,而是AI的天花板到底有多高?

未來是不是,任何作品、任何工作內容、任何創作都可以由AI生成?

AI在發生大的變化,生成式也在發生大的變化,Google的Gemini 3預示著未來一種全新的趨勢。

很多提前體驗到Gemini 3的使用者都認為,新模型在美學與資訊量之間找到了前所未有的平衡。

文字更有審美密度,結構更清晰,內容更飽滿,同時生成失誤率大幅降低。這種一致性,正與靈光的方向不謀而合。

靈光的核心不是炫技,而是把高級能力包裝成人人都能用的體驗。

當模型本身的審美能力、穩定性和知識密度提升後,靈光就能把這些底層優勢轉譯成更可靠的場景輸出:

可以說,Gemini 3的出現,讓靈光一直堅持的方向被再次證明。

靈光要做的,就是把「好」變得可感,把「穩」變得可依賴,讓每一個普通使用者都能享受到這場升級,而不需要成為提示詞專家。

這裡再次引用大神卡帕西對於Gemini 3的評價。

當一個AI在你提問前就猜到了你的想法,並且還給你答案,相信我們離真正的AGI世界不會太遠。

靈光不追求一口氣摸到天花板,而是先把地板墊高。

把複雜性藏起來,把確定性交給使用者,讓第一次用AI的普通人也能穩穩落地。

讓更多人走進來,提前感受到未來的AI世界。

在這一點上,最近剛剛上線的千問APP也印證了這個趨勢。

千問APP攜帶阿里「公司級」戰略的雷霆之勢轉向C端。

意味著AI從「技術展示」走向「結果交付」:普通人也能隨手可得。

靈光想做的,就是讓這個複雜的AI時代,變得更簡單一些~ (新智元)