Gemini 3.0還在預熱，中國AI搶先！30秒造APP全網首測

2025/11/18

•

【新智元導讀】Gemini 3.0還未殺到，一系列驚豔實測就已宣告：AI「生成湧現」時代，真的來了！幾乎同一時間，國內一款新生AI神器，竟將這股超能力塞進手機，30秒手搓一個APP。

2025年終AI壓軸大戲，本周強勢來襲！

這幾天，Google下一代AI模型預熱引爆全網，Gemini 3.0「全家桶」多款模型蓄勢待發。

此時此刻，全網都在坐等這場王炸發佈。

畢竟，OpenAI GPT-5.1小修小補，並未觸發所有人的G點。如今，Gemini 3.0幾乎成為「全村人」的希望。

社交媒體上，更多的驚豔實測demo曝光：一句話即生前端UI、作業系統介面，以及複雜的SVG動畫等等。

在這熱鬧喧囂之中，我們看到了——AI的下一個未來，是「生成湧現」。

當前，AI正經歷一場深刻的範式轉變，從單一模態如文字/圖像的生成，逐步演進至「生成湧現」的新階段。

在這一全新範式下，Gemini 3.0正作為引領者，驅動著無限概念的生成與實現。

恰在今天，螞蟻靈光正式上線，一款集閃應用、對話、開眼於一體的全模態通用AI助手。

它的誕生，打開了「生成湧現」的另一種方式。

AI進入「生成湧現」時代

生成湧現，本質上是AI生成能力的「爆炸式擴展」。

提到「湧現」一詞，我們並不陌生。2022年，GoogleDeepMind史丹佛等在一篇論文中驗證了：

隨著模型的參數規模擴大，性能也會隨之提升，還能解鎖不可預測的全新能力。

他們將其稱之為，「大模型湧現」。它從新的維度，再次印證了Scaling Law不死。

而這裡的「生成湧現」，不在於內容本身，而在於前端與系統設計更高層次的應用重塑。

ChatGPT誕生後很長一段時間，傳統生成式AI更擅長「線性輸出」：prompt輸入，文字/圖片等單一模態輸出。

這種以單一模態的輸出，在2025年迎來一個新的拐點。

這一年，我們已見證了太多標誌性大事件——

原生多模態模型：Gemini 2.5、GPT-5、Grok 4等最具代表性

圖像模型：GPT-4o掀起吉卜力熱狂潮；Nano Banana引爆AI圖像編輯的熱潮

視訊模型：Veo 3首次實現音畫同步；Sora 2坐享創意領域的ChatGPT時刻

世界模型：李飛飛Marble一句話即生3D世界；GoogleGenie 3直出可互動環境

前沿模型的每一次進化，都在向著原生多模態方向演進，最終導向了「湧現式生成」。

也就是說，AI會像生態系統般，逐漸具備自主擴展能力，並融合多模態、即時編碼、動態應用的生成。

當參數超越更大的閾值時，模型不再侷限於線性預測，而會湧現出「系統級」的能力。

這種趨勢，在尚未真正露面的Gemini 3.0身上，愈發明顯。

一句指令，它便能一次性建構可用的Windows、macOS作業系統，一鍵克隆YouTube網站視訊可看、可互動小遊戲......

Karpathy調侃道，Gemini 3.0在你沒開口就能讀懂人類心思，甚至，還能和你的貓聊天

Gemini 3.0還把AI編碼上限推到一個全新高度，語言一鍵遷移，複雜的前端UI互動。

這種生成湧現的爆發力，就連「股神」巴菲特也為之動容。

可以篤定的是，未來AI的發展方向，或說下一個趨勢，便是朝著「生成湧現」這一範式演進。

要說生成，其能力邊界可以大到所有人無法想像，但最終落地時會是怎樣的一種形態？

同一時間點上，螞蟻靈光的登場，給業界提供了一條可行的路徑。

從模型層面上看，Gemini 3.0可以驗證系統、前端設計無限生成。但從產品層面看，靈光正開啟「生成湧現」普惠化的探索。

一個人人皆可在移動端，短短30秒內，一鍵建立日常小應用的神器。

靈光真正實現了「人人手搓AI」的夢想，完美詮釋了「生成湧現」的落地。

靈光一閃，人人進入生成時代

在這個人人皆可生成的時代，最不缺的就是「半成品」。

尤其在當下，氛圍程式設計、生成式音樂、生成式網頁、生成式視訊...似乎一切皆可由AI完成。

所有人都在瘋狂地「玩麵粉」，但很多AI生成的內容都是半成品，或者壓根不可用。

可人們真正想要的，從來不是麵粉、麵糰等，而是可以直接端上桌的饅頭、包子，甚至是要「好看又好吃」的那種。

這正是，靈光誕生的契機。

不管是打工人，還是學生，不管是老闆，還是普通人，皆需要一個既能生成「最終好用產品」的AI工具，而且生成的內容還要「好看」。

你需要什麼，就去造

靈光裡最強大的一個功能就是閃應用。

在對比了眾多國內外的通用AI產品後，靈光稱得上國內通用AI助手裡的一股清流，甚至可以說是獨特的一種存在。

靈光使用下來，給人一種，這是通用AI產品中的「iPhone」。

iPhone好用在於它開創了「App Store」，定義了「下載應用」的時代，將手機從「通訊工具」變成了「萬能掌上型電腦」。

而靈光正在用「靈光閃應用」開啟下一個時代：從下載海量應用進化為即時生成專屬應用。

iPhone App Store：你需要什麼，就去找。
靈光閃應用：你需要什麼，就去造。

這是一種範式革命，它用30秒的「即時生成」取代了「搜尋、篩選、下載、安裝」的漫長鏈路，把創作權交給了普通人。

這個30秒的應用生成速度，體驗真香。

比如製作一個能夠分享，能夠解釋清楚最近網路熱梗「哈基米南北綠豆」的來龍去脈。

可以看到，閃應用不止於「靜態展示」，更擁有強大的「動態互動」能力。

這是因為，每個輕量級應用都可直接呼叫大模型等後端能力，不僅能展示結果，更能即時與外部進行互動。

這些應用真的就和APP一樣，在你的閃應用列表中，隨時可以呼叫。

不管是運動健⾝、旅⾏規劃，還是健康⻝譜、理財規劃，或者購物決策，這裡全靠發揮你的想像力！

當Cursor為首的程式設計IDE讓普通人離AI越來越遠時，當氛圍程式設計只屬於部分懂技術的「特權」時。

其實從這次Gemini 3的「路透」就能看出來，未來所有的產品都能「AI生成」，而且也必將AI生成。

AI會不斷吞噬掉所有工作內容。

於是，靈光也做了一次「減法」。

他們用「資訊美學」的方式，讓靈光的介面做到了極簡。

它不再讓你從紛繁的多模態工具中進行選擇，而是一次性「生成」一切。

用「資訊美學」融合全模態

簡單來說，資訊美學就是讓資訊變得既「好看」又「好懂」的藝術！

在AI時代，我們被捲入資訊的洪流。

從社交媒體，到新聞、報告充斥著冗餘的內容，其中大量還是AI生成的同質化、低價值的，讓獲取真實價值的資訊變得愈發困難。

所以AI時代最大問題並不是獲取知識，而是如何更好的組織知識，從繁雜的資訊海洋中撈到真正的珍珠。

一個有用的資訊不應該是深藏不露的或者長篇大論的，而應當是「恰到好處」。

比如雖然ChatGPT、Gemini等目前基礎功能都很強大，但是每次問題都要輸出一篇千字長文，讓關鍵資訊淹沒在長上下文裡。

或許，在底層模型卷無可卷的當下，我們需要一種新的AI產品形態。

全模態通⽤AI助⼿靈光，就是一個能把資訊變成藝術品的AI工具。

它不僅僅是把知識內容和資訊結構做得非常漂亮，而是提供了一種設計哲學，認為「美」本身就是一種功能。

它通過視覺、聽覺甚至觸覺（如3D互動）來組織資訊，讓你在接收資訊的過程中感到愉悅、高效，並且能「秒懂」。

接觸資訊，感到愉悅，是的，這就是想像中，通用智能的那種感覺。

你沒有看錯，你甚至可以在靈光中創造3D模型，這已經脫離了一個對話AI的層面。

這一能力的實現，是因為靈光建構了「多智能體協作的Agentic架構」，讓生成不再是單一工具的線性操作。

在生成可視化內容時，它會調度圖像、3D、動畫等不同領域的專業AI智能體，讓其即時協作，提供更完整、更豐富、更沉浸的檢視體驗。

更值得一提的是，這一切皆可在移動端就能實現，在業界實屬罕見。

總結來說，靈光帶了一次內容生成的革新：它是首個實現了基於全程式碼生成的多模態內容輸出。

當提出一個問題，它不只是「回答」，它會自動理解真實意圖，並立即以程式碼為核心，即時建構出結構化、個性化，且高度美觀可互動的可視化內容。

開眼：探索未來AI的產品形態

更令人欣喜的是，靈光這次探索了一種新的AI形態，攝影機+AI。

靈光開眼，這次讓AI睜眼看世界。

雖然手機攝影機的參數已經捲到天際，但它還是一個死物，只負責記錄。

而在AI加持下，未來的攝影機，可以說是「具身智能」史前時代的最佳載體。

靈光開眼的識別成功率和速度很難讓人相信。

靈光開眼能夠準確識別生活中的幾乎任何物體。

甚至你還可以用靈光開眼來「找不同」，識別中容易被混淆的對象。

甚至可以用靈光總結了2025年9月份的阿里財報，還順便算出了同比（有點東西）。

再讓它解讀一篇論文，看看能否勝任？

打開Transformer經典之作，靈光一眼識別出這篇論文，並在接下來回答中，關於論文主旨、架構性能，全部給出了正確的解析。

讓普通人提前進入未來世界

如今，生成式AI發展的問題已經不是「生成」，而是AI的天花板到底有多高？

未來是不是，任何作品、任何工作內容、任何創作都可以由AI生成？

AI在發生大的變化，生成式也在發生大的變化，Google的Gemini 3預示著未來一種全新的趨勢。

很多提前體驗到Gemini 3的使用者都認為，新模型在美學與資訊量之間找到了前所未有的平衡。

文字更有審美密度，結構更清晰，內容更飽滿，同時生成失誤率大幅降低。這種一致性，正與靈光的方向不謀而合。

靈光的核心不是炫技，而是把高級能力包裝成人人都能用的體驗。

當模型本身的審美能力、穩定性和知識密度提升後，靈光就能把這些底層優勢轉譯成更可靠的場景輸出：

可以說，Gemini 3的出現，讓靈光一直堅持的方向被再次證明。

靈光要做的，就是把「好」變得可感，把「穩」變得可依賴，讓每一個普通使用者都能享受到這場升級，而不需要成為提示詞專家。

這裡再次引用大神卡帕西對於Gemini 3的評價。

當一個AI在你提問前就猜到了你的想法，並且還給你答案，相信我們離真正的AGI世界不會太遠。

靈光不追求一口氣摸到天花板，而是先把地板墊高。

把複雜性藏起來，把確定性交給使用者，讓第一次用AI的普通人也能穩穩落地。

讓更多人走進來，提前感受到未來的AI世界。

在這一點上，最近剛剛上線的千問APP也印證了這個趨勢。

千問APP攜帶阿里「公司級」戰略的雷霆之勢轉向C端。

意味著AI從「技術展示」走向「結果交付」：普通人也能隨手可得。

靈光想做的，就是讓這個複雜的AI時代，變得更簡單一些～ (新智元)