#ai
“強到可怕!”字節Seedance2.0灰度測試爆火,黑悟空老闆:AIGC的童年結束了
全模態素材都能參考,鏡頭切回來還保持原樣。智東西2月9日報導,2月7日,字節跳動AI視訊生成模型Seedance2.0開啟灰度測試,該模型支援文字、圖片、視訊、音訊素材輸入,可以完成自分鏡和自運鏡,鏡頭移動後人物特徵能夠保持一致。字節Seedance團隊釋放出的飛書文件中介紹到,Seedance2.0可精準還原參考圖的畫面構圖、角色細節,可以復刻參考視訊的鏡頭語言、複雜的動作節奏和創意特效。其所生成的視訊支援平滑延長與銜接,可按使用者提示生成連續鏡頭。Seedance2.0的編輯能力同步增強,支援對已有視訊進行角色更替、刪減、增加。▲女士優雅地曬衣服(來源:Seedance官方)在海外社交平台X上,Seedance2.0的討論熱度居高不下。一位學習了7年數字電影製作的網友在體驗後說,這個模型(Seedance2.0)是唯一一個讓他感到害怕的模型,電影行業的所有崗位幾乎都要消失了。90%他所學習到的技能,Seedance2.0都能實現。▲數字電影製作學習者評論(來源:X)產品設計師、使用者體驗(UX/UI)設計師Linus Ekenstam看完Seedance2.0的案例後說:“它會讓網際網路崩潰,百分之百。 ”▲產品設計師評價(來源:X)遊戲科學創始人兼CEO、《黑神話·悟空》製作人馮驥在體驗了Seedance2.0後還專門發了微博,稱讚該模型為“當前地表最強的視訊生成模型。”並且很慶幸今天的Seedance2.0來自中國。但他也從其中看出了假視訊氾濫與信任危機,因為“逼真的視訊將變得毫無門檻。”▲馮驥微博(來源:新浪微博)但是Seedance2.0也並不完美,在字節Seedance團隊發出的飛書文件《Seedance2.0使用手冊》中,有使用者在評論區中反映,使用同樣的提示詞和素材,生成的視訊在精細化控制上卻不太行。▲飛書文件使用者評論(來源:飛書)並且在一個官方案例中,Seedance2.0生成視訊的中文字幕還是會出現老生常談的中文亂碼情況。▲官方案例錯誤(來源:飛書)這個模型真的有一眾網友說得這麼“恐怖”嗎?智東西第一時間體驗了Seedance2.0,Seedance2.0所生成的視訊畫風、場景和人物的一致性較高,不會發生畸變現象。模型可以根據其自己對劇情的理解加入運鏡和剪輯,聲效上也可以實現提示詞和參考素材的要求。但在提示詞較為簡單或模糊的情況下,Seedance2.0在動畫人物的面部情感表達上還有些僵硬。01. 能自動加入運鏡 全模態素材均可參考2025年12月16日,Seedance1.5 pro模型發佈,在音視訊聯合生成、音畫同步、多語言、運鏡以及語言理解方面進行了提升。Seedance2.0預計在明天正式發佈,目前在即夢AI官網可以充值會員付費體驗,在小雲雀App中則有三次免費體驗機會。Seedance2.0支援文字、圖片、視訊和音訊作為參考素材輸入。使用者可以同時給它最多9張圖片、3段視訊和3段音訊作為參考,指定動作、運鏡、人物、場景、特效、聲效等,Seedance2.0就可以根據參考材料和提示詞要求,合成視訊。但為了保護隱私,Seedance2.0目前暫不支援上傳包含寫實真人臉部的圖片素材。Seedance2.0可精準還原參考圖的畫面構圖、角色細節,還支援鏡頭語言、複雜的動作節奏、創意特效的復刻。其所生成的視訊支援平滑延長與銜接,可按使用者提示生成連續鏡頭。Seedance2.0的編輯能力也同步增強,支援對已有視訊進行角色更替、刪減、增加。如果沒有參考素材也沒關係,只需要一段簡單的提示詞,該模型就可以根據所描述的情節自動規劃分鏡以及運鏡,還能在劇情需要的地方實現慢動作、鏡頭搖晃等效果。在一致性上,Seedance2.0在生成視訊的同時就可以生成匹配的音效和配樂,並且支援口型同步和情緒匹配。Seedance2.0所生成視訊中的角色和場景還可以在多個鏡頭之間保持一致性,使用者可以用該模型生成一段包含多個鏡頭切換的完整片段。02. 體驗:人物場景一致性高 汗水灑落可以“以假亂真”智東西上手體驗了Seedance2.0模型,主要考察模型的自運鏡、角色場景一致性和角色替換方面的能力。Seedance2.0所生成的視訊畫風、場景和人物的一致性較高,不會發生畸變現象。模型可以根據其自己對劇情的理解加入運鏡和剪輯,聲效上也可以實現提示詞和參考素材的要求。但在提示詞較為簡單或模糊的情況下,Seedance2.0在動畫人物的面部情感表達上還有些僵硬。首先,我們輸入提示詞:特寫,焦距50mm,扎馬尾的女生坐在窗邊,微笑時有梨渦,在咖啡廳的桌面上的筆記本上寫著什麼,偶爾有思考的停頓,背景虛化呈現,咖啡館的木質桌沿,柔光打在面部,突出輕鬆的氛圍,咖啡廳中放著鋼琴曲。Seedance2.0生成的視訊如下:▲咖啡廳女孩生成片段(來源:智東西體驗)在生成速度上,Seedance2.0生成一段10秒的視訊需要5分鐘左右。從視訊的畫面上來看,在提示詞沒有說如何運鏡的情況下,該模型自動在開頭加了一個漸進的運鏡,讓畫面劇情更加自然和流暢。在漸進的過程中,畫面中的人物、場景都沒有發生畸變,保持了一致性。Seedance 2.0也可以很準確地還原國漫風,我們上傳了一張國風動漫角色圖,要求Seedance2.0參考圖片,生成一段人物自述片段。▲國風參考圖(來源:Seedance2.0)Seedance 2.0生成的視訊就像是某個遊戲的過場CG動畫,視訊的畫風和人物特點都與素材圖片一致,隨風飄動的絲帶和花瓣邊緣輪廓清晰,運動軌跡合乎常理,人物的嘴型和台詞也可以對得上。但是,在人物情緒的表達上,視訊中人物的面部肌肉沒有明顯的變化,情緒表達不夠飽滿。▲國漫生成片段(來源:智東西體驗)最近,一個韓國AI小狗接受採訪的視訊非常火,我們將視訊截圖發給Seedance2.0,讓它將原圖中的小狗換成小貓。▲AI小狗視訊截圖(來源:小紅書)可以看到,Seedance2.0生成的視訊很完整地保留了參考素材的風格,給小貓穿上了睡衣,並且讓小貓雙手張開,並不是簡單地換頭,小三花貓沒有被睡衣覆蓋的肚子部分也還原了真實小貓崽肚子的質感。而且,在音訊上,Seedance2.0也精準地實現了提示詞中所說的25歲女記者和小孩的聲線。▲AI小貓生成片段(來源:智東西體驗)在X上,自媒體博主冰河用Lovart的Skill生成分鏡故事板,直接複製到Seedance2.0中,他說該模型所生成的視訊比他用ComfyUI做的還細緻。▲自媒體博主冰河製作視訊片段(來源:X)AIGC藝術家DynamicWang用Seedance2.0製作了一個模仿Nike品牌廣告風格的短片,短片中共出現了四位不同族裔的女性,每一位角色的身材和肌肉線條都很符合其所進行的運動的標準,且鏡頭角度變動後,角色的臉部特徵依舊保持一致。短片中的運鏡也十分自然,沒有拼接痕跡,慢動作、角度移動的位置都很準確,符合劇情需要。從第一位體操女孩流暢的翻轉跳躍可以看到,Seedance2.0直接攻破了“AI生成不了體操視訊”這個難題。拳擊女生和跑步女生的汗水以及游泳女生濺起的水花,都沒有了此前AI生成的“黏膩感”。在小雲雀App中,有不少使用者都上傳了自己用Seedance2.0生成的視訊片段。有李小龍對戰日本武士:▲使用者上傳案例(來源:小雲雀App)真人版七龍珠:▲使用者上傳案例(來源:小雲雀App)還有仙俠竹林對決:▲使用者案例(來源:小雲雀App)03. 結語:Seedance2.0降低表達門檻 但提高了對創作者的敘事能力要求從各路大神的體驗、官方案例以及智東西自己的體驗視訊看下來,Seedance2.0最突出的就是運鏡和剪輯能力以及人物和場景的一致性。但其在情感表達的細膩度、中文文字的呈現等方面仍有提升空間。從這一點看,或許Seedance2.0還不足以徹底改變影視界,但Seedance2.0的出現,無疑降低了專業表達的門檻,讓更多人有工具可以將想法可視化。同時,此類AI視訊製作模型也可能加劇內容市場的同質化競爭,並對創作者的原創性、審美和敘事能力提出更高要求。 (智東西)
曝OpenAI 首款硬體定名「Dime」,壞消息:成本太高,9月首發只有「閹割版」
OpenAI 的硬體產品,真的要來了,但可能會是個「閹割版」。據智慧皮卡丘最新爆料,OpenAI 首款面向消費者的 AI 耳機命名將定為「Dime」(即 10 美分硬幣),大概也是形容其極度小巧精緻。與此同時,其相關硬體產品的專利申請已於昨日在國家智慧財產權局(CNIPA)正式公示,意味著我們很快就能看到這款裝置的真容。不過在產品策略上,OpenAI 不得不做出妥協。受限於 HBM 短缺導致 2nm 晶片成本過高,原計畫中帶有計算單元的「類手機」全能形態已被推遲。目前的計畫是先在 2026 年推出一款純音訊功能的簡版耳機,待元件成本下降後,才會發佈配置更強的高級版本。「Dime」是就此前曝光的 OpenAI 音訊裝置項目,代號為「Sweetpea(甜豌豆)。這絕不是一款普通的耳機,此前根據供應鏈消息, 這款裝置的硬體設計被形容為「獨特且前所未見」:它意在取代 AirPods,不採用骨傳導,而是使用了更接近手機等級的用料。主處理器目標直指 2nm 智慧型手機級晶片(Exynos 方案呼聲最高)。主體採用金屬材質,外形類似卵石。內部藏有兩顆可取出的膠囊狀耳機,佩戴方式獨特,是置於耳後,而非傳統的入耳。正在開發定製晶片,目標是讓裝置能通過語音直接執行 iPhone 上的 Siri 指令,打通生態壁壘。據悉在內部,這塊裝置被 Jony Ive 團佇列為最高優先順序。OpenAI 對其寄予厚望,按照計畫產品將在 9 月左右發佈,首年出貨量目標竟高達 4000 到 5000 萬台。而且富士康已接到通知, 需在 2028 年第四季度前為 OpenAI 五款裝置做好產能準備。為什麼做大模型和 AI 軟體的 OpenAI 非要死磕這種高成本的硬體?OpenAI CEO Sam Altman(山姆· 奧特曼)就曾在紐約的一場午餐會上直言:大家別盯著 Google 了,OpenAI 真正的宿敵,是蘋果。在他看來,未來 AI 的主戰場不在雲端,而在終端。Altman 認為,現在的智慧型手機根本承載不了真正的 AI 伴侶體驗——螢幕太小、互動方式太侷限、隱私保護機制太僵化。誰能率先打造出「AI 原生裝置」,誰就能在下一個十年佔據制高點。「智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間『湖畔小屋』——讓你在需要專注時,能關上門,遮蔽噪音。」Altman 如此形容他對硬體的願景。在這個願景下,除了這顆被寄予厚望的「甜豌豆」耳機,一支神秘的智能筆,也在核心考慮之中。當科技巨頭們正扎堆把 AI 塞進眼鏡、手錶時,過去一年 CHatGPT 市場份額不斷被蠶食的 OpenAI ,也開始了一場新的入口爭奪之戰。OpenAI 花 65 億美元 就是為了造支筆?供應鏈爆料雖然明確,但「AI 筆」這個答案仍讓人半信半疑——直到我們把 Altman 和 Ive 過往透露的線索串聯起來,才發現這個看似離奇的猜想,實則有跡可循。去年 5 月,OpenAI 砸下 65 億美元收購由 Jony Ive 創辦的硬體公司 io,後續卻因商標糾紛(遭音訊公司 iyO 起訴)被迫剝離品牌。io 聯合創始人兼首席產品官 Evans Hankey 在法庭聲明中明確表態:「io 目前並無推出定製耳機的計畫。」另一位聯合創始人 Tang Tan 則直接劃清界限:io 產品原型既非入耳式裝置,也不是可穿戴裝置。圖片源自 Tang Tan 法庭訴狀兩項聲明疊加,基本排除了 OpenAI 首款 AI 硬體涉足眼鏡、手錶、耳機等成熟賽道的可能。而關於這款裝置,Altman 自己已經劇透過很多次了:體積小巧,能塞進口袋也能擺在桌上,具備環境感知能力。重點是,它不是來搶手機和電腦飯碗的,而是要填補那些「不方便掏手機」或者「需要深度專注」的場景。他曾如此形容:智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間「湖畔小屋」——讓你在需要專注時,能關上門,遮蔽噪音。從這個邏輯看,筆確實是個聰明的選擇。對比 Friend 那種 24 小時線上的 AI 吊墜,筆的認知門檻低,放桌上不突兀,隱私侵入感也比穿戴裝置低得多。Friend AI 吊墜設計層面,Ive 曾表示偏愛內在極度複雜智能,外在卻讓人想隨手觸摸、輕鬆使用的產品,甚至戲言,設計成功的終極標準是「讓人忍不住想舔一口、咬一口」。Altman 後續直接佐證了這一點:原型機的顏值,確實讓他產生了「想舔一口」的衝動,還精準概括其外觀——極簡優雅,又帶點俏皮與幽默感。Ive 還透露,這款 AI 硬體傾向於陶瓷等高質感材料,核心是追求「近乎天真的簡潔感」。據此可推斷,裝置互動會極度簡化,大機率只保留少量物理按鍵。除了產品理念與形態的高度契合,Jony Ive 與 Sam Altman 對「筆」的個人偏好,更讓這一猜想增添了幾分可信度。是的,Jony Ive 本身就是個資深筆具藏家。他的藏品涵蓋 Montegrappa 復古鋼筆、Marc Newson 設計的愛馬仕鋼筆。他的職業生涯早期就曾靠一款運動感十足的 TX2 圓珠筆賺到第一桶金,後續又深度參與 Apple Pencil 設計,對筆的形態設計積累深厚。由 Jony Ive 設計的 TX2Sam Altman 更是同道中人,甚至有過之而無不及。2024 年 9 月的《How I Write》播客中,Altman 自曝是「超級筆記控」,平均兩三周就能用完一本筆記本,還特別推薦了兩支筆:Uni-Ball Micro 0.5 和無印良品 0.36/0.37 款,搭配深藍色墨水最佳。用他的原話來說,「這類筆記本搭配其中一支筆,就是最理想的書寫組合」。早在 2018 年 4 月,他就在部落格裡寫過自己喜歡用紙筆記錄想法的好處:「我更喜歡寫在紙上的清單。這樣可以很方便地加入或刪除任務。開會時也能隨時查看,不會顯得不禮貌。」兩個對筆都有執念的人湊一塊,造出一支 AI 筆,似乎也順理成章。音訊模型狂飆 OpenAI 在憋 AI 硬體大招兩個愛筆的人造筆,顯然不會只是為了打造一批平平無奇的筆。據外媒 The Information 的爆料,OpenAI 正加速迭代音訊 AI 模型,核心目標就是為這款 AI 個人裝置築牢技術根基。知情人士透露,裝置將以語音互動為核心場景。過去兩個月,OpenAI 已完成工程、產品、研究多團隊的整合攻堅,全力最佳化音訊模型。目前新一代模型架構已初顯成效:不僅能生成更自然、更有人情味的語音回應,內容的精準性與深度也大幅提升。更關鍵的是,該模型將支援與使用者同步對話,能流暢應對打斷,預計今年第一季度正式發佈。報導稱,從去年夏天內部展示的方案來看,OpenAI 首款 AI 硬體的定位是「智能夥伴」——不是簡單的軟體介面,而是能主動與使用者協作,主動提供建議,幫使用者達成目標。在獲得使用者授權的前提下,它還能通過音視訊採集感知使用者及周邊環境,進一步提升互動精準度。目前 OpenAI 已組建覆蓋供應鏈、工業設計、模型研發的跨領域團隊,足見其對硬體賽道的野心。這個音訊 AI 項目的核心班底也已經敲定:負責人 Kundan Kumar 去年夏天從 Character.AI 跳槽加入;產品研究主管 Ben Newhouse 主導文字技術架構的音訊適配;多模態 ChatGPT 產品經理 Jackie Shannon 負責最佳化互動體驗,三人各司其職,構成項目支柱。但 OpenAI 面前橫亙著一個核心障礙:多數 ChatGPT 使用者還沒養成語音互動習慣。究其原因,現有語音模型體驗拉胯,以及使用者對這些功能認知為零。因此,報導直言,OpenAI 當務之急應該是先教會使用者「用語音跟 AI 對話」。而一旦這款裝置落地,且具備環境感知與線上聆聽能力,必將攪動現有 AI 硬體市場的格局——AI 錄音硬體可能迎來最強勁的對手。現有 AI 錄音硬體大多隻做錄音轉文字和摘要等功能;而 OpenAI 這款裝置若落地,錄音摘要只是其眾多原生技能之一,絕非全部。就像智慧型手機出現後順便幹掉了 MP3 播放器,當一個多場景通用裝置包含了你的所有功能時,垂直單品的生存空間就被徹底壓縮了。與此同時,按照硬體+訂閱的常規操作,OpenAI 大機率會把軟體服務直接打包進 ChatGPT 訂閱體系,憑藉龐大的使用者基數和極低的邊際成本,快速收割市場。值得一提的是,結合 OpenAI 的技術佈局與筆的形態,舊金山創業公司 Volley 創始人 Max Child 去年就曾提出了一個頗具想像力的猜想:這款 AI 筆頂部可能整合微型投影儀,將圖像投射到桌面,以此解決無螢幕互動的核心痛點。筆夾部分可能整合麥克風甚至攝影機,不僅能解析文字,還能感知更廣泛的環境。這意味著,使用者在任意紙張上書寫時,AI 不僅能將筆跡數位化,還能即時解讀內容:手寫數學公式,直接給出答案;手寫會議紀要,自動生成待辦事項並同步到手機。它甚至可能成為智能中樞:控制周邊數字介面,或作為平板電腦的高級輸入端,把 ChatGPT 的能力直接注入筆尖的創作中。由 Nano Banana Pro 生成的假想圖值得關注的是,知情人士還透露,OpenAI 並非只計畫發佈一款裝置,而是會陸續推出一系列裝置,以覆蓋更多元的使用場景。Altman 和 Ive 去年已親口證實,首批原型機已經造出,根據 The Information 的報導,首款 AI 裝置預計還要等約一年才會正式亮相。這個時間節點的規劃,也與當前 AI 硬體市場的競爭節奏相契合。科技巨頭們正加速佈局,搶灘 AI 硬體賽道:Meta、Google 都在悶頭做智能眼鏡;彭博社記者 Mark Gurman 爆料,蘋果也在考慮給 AirPods 加攝影機,打造新型 AI 裝置。在巨頭貼身肉搏的戰場之外,OpenAI 這樣一支能聽、能看、還能思考的 AI 筆,反而可能以極低的認知成本,撬開一個長期被忽略、卻高度專注的使用場景。而相比無處不在,這種只在需要時出現的 AI 硬體,或許才更接近下一階段的答案。 (創業邦)
深度訪談─a16z 揭秘 AI 時代的三個頂級致富模式,從0到1億美金只需兩年
核心速覽底層動力: AI 爆發源於人類對“更富有、更懶惰”的終極追求——即用更少的勞動,創造更高的經濟價值。三大核心賽道:AI 原生軟體: 在“綠地機會”中挑戰傳統巨頭,提供全自動化閉環。軟體替代人工: 從“賣工具”轉向“賣結果”,直接切入勞動力市場。私有資料圍牆: 掌控大模型無法獲取的行業私有資料,建構長期防禦力。護城河本質: AI 公司必須成為企業的“記錄系統(System of Record)”。最好的公司擁有“人質”而非客戶。增長神話: AI 極大地縮短了軟體周期。以往需 10 年達成的 1 億美金 ARR,現在最快僅需 2 年。在 AI 浪潮爆發兩年後的今天,市場對於“AI 是否是泡沫”的爭論從未停止。然而,a16z 合夥人 Alex Rampell 在最新訪談中給出了答案:這不是泡沫,而是軟體行業的“黃金時代”。商業的底層邏輯:人類永遠追求“更富有、更懶惰”Alex 認為,所有偉大的技術革命,本質上都在滿足人類的兩個終極本能:Richer & Lazier(變得更富有,以及更懶惰)。更懶惰: 用更少的工作量完成任務。更富有: 創造更高的經濟價值。從 1977 年至今,科技行業經歷了 PC、網際網路、雲、移動網際網路四大周期。AI 是第五個。它並非橫空出世,而是站在前四個周期的肩膀上。現在,AI 已經從“寫個劇本”的魔術表演,正式進入了企業核心流程,開始真金白銀地省錢、賺錢。a16z 看好的三個 AI 投資主題如何建構一家長青的 AI 公司?Alex 總結了三個核心範式:1. 傳統軟體的 AI 原生化 (AI-Native Trad Software)這是在已有的“Bingo 遊戲板”上玩新遊戲。綠地機會 (Greenfield) vs 棕地機會 (Brownfield): 去搶 Adobe 的老客戶是“棕地”,極其困難。但在新公司成立或系統升級的拐點切入,則是“綠地”。核心邏輯: 像 Real 這樣的公司,它不僅是 ERP,更能自動平帳(Close the books)。對於新公司來說,選一個自帶 AI 功能的原生系統是“腦殘決策(No-brainer)”。2. 軟體正在“吃掉”勞動力 (Software Eating Labor)這是 Alex 最興奮的領域,其市場規模遠超傳統的軟體市場。從“買工具”到“買結果”: 以前你買軟體是給員工用,現在軟體就是“員工”。價值定價: 債務催收 AI Salient 的軟體不僅能講 21 種語言,甚至能比人類多催回 50% 的欠款。客戶不再是付訂閱費,而是為增加的收入買單。3. “圍牆花園”:私有資料模型 (Walled Gardens)當底層大模型變得像電力一樣廉價時,勝負手在於誰擁有“稀缺礦產”。原始蔬菜 vs 成熟大餐: OpenAI 像是賣蔬菜(Token)的農場。但它不知道 1992 年的融資價格,也不知道西班牙 80 年代的法律判例。資料護城河:Open Evidence 擁有醫學期刊獨家授權,Vlex 數位化了海量法律記錄。這些“ChatGPT 抓取不到”的資料是核心防禦力。護城河:最好的公司擁有“Hostages”,而非客戶在 AI 時代,程式碼極易被模仿,因此必須建立極致的粘性。a16z 提出了一個深刻的觀點:偉大的公司擁有“人質(Hostages)”,而非客戶。什麼是“人質”?當你的軟體成為了企業的“記錄系統(System of Record)”,承載了所有核心流程和私有資料時,替換你的成本將高到不可接受。以法律 AI Eve 為例,它管理著律師從接案到結案的整個工作流。即使以後大模型出了更強的總結功能,律師也不會搬家,因為他們的資料和流程都“鎖”在 Eve 裡。巨頭會贏嗎?創業者的勝算在那?Alex 對傳統巨頭(Incumbents)持看好態度。與“雲轉型”時期不同,現在的巨頭(如 Microsoft, Adobe, Intuit)反應極快。他們手握大量“人質(老客戶)”,只要加入 AI 功能就能通過加價賺得盆滿缽滿。創業者的三條活路:極度垂直: 尋找巨頭看不上的細分專業領域。模式創新: 利用 AI 實現按效果計費。深挖資料: 掌控那些物理世界或歷史檔案中的獨佔資料。我們正處於從“工具時代”向“代理時代”跨越的節點。AI 不僅僅是效率的提升,它正在重定義什麼是“公司”。正如 Alex 所言,a16z 並非只是在投 AI,而是在投那些能讓使用者更富有、更懶惰的未來。在這個時代,“速度”是入場券,“資料”是護城河,而“結果”才是真正的商品。 (GD梯度下降)
凌晨三點,徹底失眠:Seedance2.0告訴我們,AI正在瘋狂“壓縮”現實世界工作流
凌晨三點,看到影視颶風Tim更新的字節即夢Seedance 2.0視訊,我徹底睡不著了。這是過去一年多來,AI的進步第一次讓我感到如此興奮。或者說,顫慄。很多人都在等視訊領域的GPT-3.5時刻,大家覺得那還要兩三年。Seedance 2.0告訴我們,它已經近在眼前了。它的強悍之處,在於它把運鏡、分鏡、音畫匹配,全部AI化了,並且做到很棒。它理解了光影、透視、鏡頭語言。Tim在視訊裡展示的,是控制,是AI對物理世界的完美復刻。AI的邏輯正在變得清晰而簡單,AI正在瘋狂壓縮我們的工作流:從導演、拍攝到剪輯、配樂;從產品經理、開發到測試、交付。所有的中間環節都在逐步壓縮。這篇文章,我想聊聊AI正在如何改變工作流、如何重構我們的工作。01 視訊工業的GPT3.5時刻Tim在視訊裡那種抑制不住的興奮,我感同身受。以前我們認為運鏡是物理世界的特權,滑軌、搖臂、無人機、斯坦尼康。這些裝置很貴,操作這些裝置的人更貴。Seedance2.0把這些都變成了參數,視訊裡演示的圖生視訊,一張主角的照片+一張場景的照片。它能讓這個主角,在這個場景裡,按照你指定的運鏡方式動起來,多主體一致性得到了驚人的保持。推拉搖移,以前需要鋪設軌道,需要燈光師配合調整每一秒的光位。現在這只是Prompt裡的一行字,物理世界的物理限制,被數學世界的參數限制取代了。Seedance 2.0似乎理解了三維空間的一致性。它知道當鏡頭左移時,背景物體應該如何產生視差。它知道當光線從右邊打來時,影子的長度應該如何變化。Seedance 2.0開始涉足剪輯,AI能夠理解視訊的節奏,能識別畫面中的情緒高點,能自動匹配音樂的鼓點。對於剪輯師來說,以前需要耗費幾個小時的“粗剪”工作,現在可能只需要幾秒鐘。聲音也是一樣,畫面裡籃球場,賽場複雜的聲音同步出現。這種感知上的一致性,是人類大腦判斷“真實”的重要依據,AI做到了。影視後期原本是一個極度複雜的系統工程。導演負責構思,攝影師負責將構思轉化為光影,剪輯師負責將光影重新組合成敘事,配樂師負責用聲音調動情緒。這是一個極其昂貴、低效、且充滿摩擦的線性工作流。Seedance 2.0把這個鏈條打碎了,它把這些工種全部壓縮排了一個模型裡。本質上,AI現在在做的內容就是不斷壓縮我們的各種工作流。從Seedance 2.0看到了AI在壓縮導演、拍攝、剪輯、配樂這些人員的工作流雛形。視訊領域的GPT-3.5時刻已經到來。接下來的兩三年,將是行業洗牌的時刻,舊的秩序正在崩塌。02 AI正在極致壓縮我們的工作流視訊領域的變革只是AI重塑工作流的一個切面,更深刻的變革,發生在軟體領域,發生在我們的手機螢幕上。最近用阿里千問點了一次奶茶,這個體驗讓我思考了很多。它可能預示了App時代的終結,或者說,它預示了“即時軟體”時代的到來。我們現在的網際網路體驗,是被“App”這個形態鎖死的。你想點一杯奶茶,你需要解鎖手機,找到外賣App,點選進入,等待開屏廣告,點選搜尋框,輸入“奶茶”,在幾十個商家列表中篩選,點選進入商家頁面,在幾十種商品中選擇,選擇甜度,冰度,點選下單,支付。這是一個極其冗長的鏈路。為什麼我們要經歷這個過程?因為App在試圖滿足所有人的需求,它在找最大公約數,它不得不把低頻需求塞進二級頁面,它不得不為了商業化加入各種推薦。對於我來說,我不需要這些,我常點的就是那3家店,我知道那家的檸檬茶最好喝,知道那家的後廚最乾淨。我只需要:“幫我點一杯我常喝的那家,無糖。”千問現在的能力,正在接近這個理想狀態。你給它一個指令,它在後台通過程式碼,通過Agent,直接呼叫介面,完成交付。這就是“意圖介面”,你輸出意圖,AI交付結果。中間的UI、互動、跳轉,全部被壓縮了。當AI的能力從Andrej Karpathy提出的“Vibe Coding”進化到足夠強大的Agent,我們的每一個需求都將通過即時生成的“一次性App”來交付。傳統的“產品經理需求文件-開發編寫程式碼-測試找Bug-最終交付”這一長達數周甚至數月的鏈路,將被AI瞬間壓縮至1分鐘以內。這引發了一個根本性的商業追問:既然我可以用1分鐘生成一個“App”來滿足我當下的需求,那我為什麼還要下載一個幾百兆的App?現有的App生態存在著無法克服的結構性矛盾,每個人的需求都是獨特的,AI可以通過即時程式碼將使用者的自然語言需求直接轉化為交付結果。這實際上是AI為使用者量身定製了一個“專屬App”,用完即走,無需留存。這對於現在的網際網路巨頭是巨大的挑戰,他們的護城河建立在App的裝機量上,建立在使用者的使用時長上。如果App消失了,如果入口變成了AI Agent,那他們的流量從那裡來?廣告往那裡投?下一個時代的入口可能逐漸清晰。為什麼所有大廠都在瘋狂做大模型,爭奪那個唯一的“超級Agent”的答案呼之慾出。對於很多App這種集合需求形態的產品,是不是在AI時代會轉向個性化需求的AI內產品呢?現在的App開發商,可能會變成“資料API服務商”,隨著交付鏈路的大幅壓縮和成本降低,App需求實際變成了API需求。每一次產品對話,都是自己作為產品經理的一次結果交付。最終,傳統工作流的消失,意味著公司組織的解體。公司這種組織形式,本質上是為了降低交易成本而存在的。因為溝通很貴,信任很貴。所以我們要把人聚在一起,簽合同,發工資。當一個人+AI就能完成以前需要一個團隊做的事情,龐大的組織就變得沒有必要了,我們會看到越來越多的“一人公司”……這樣看,我相信,AI對世界的改變,正在加速。 (華爾街見聞)
經濟學人丨馬斯克把全部家當壓在了AI上
Elon Musk is betting his business empire on AI. THOSE WHO believe in Elon Musk are convinced both by his vision to go where no one has ventured before and his ability to pay for it—what some call the “Elon backstop”. Mr Musk’s announcement on February 2nd that he will merge SpaceX, which builds rockets and sells satellite broadband, with xAI, his artificial-intelligence lab, was not short of ambition. The world’s richest man declared that the new company would “extend the light of consciousness to the stars”. Back on Earth, however, it is getting harder to see how Mr Musk’s numbers add up.埃隆·馬斯克正將其商業帝國押注在人工智慧上。那些相信馬斯克的人,既折服於他前往無人涉足之地的願景,也相信他為此買單的能力——即所謂的“馬斯克式兜底”。馬斯克在2月2日宣佈,他將把製造火箭並銷售衛星寬頻的SpaceX,與他的人工智慧實驗室xAI合併,這一計畫可謂野心勃勃。這位世界首富宣稱,新公司將“把意識之光延伸到群星之間”。然而,回到地球現實,馬斯克帳面上的數字卻越來越難以自圓其說。The transaction values the new entity at $1.25trn; investors in SpaceX will be entitled to 80%, with the remainder going to xAI’S owners (Mr Musk holds a controlling stake in both). The stated rationale behind the tie-up is that the companies will work together to launch a fleet of data centres into space, giving xAI a big advantage in the race to develop cutting-edge models while furnishing SpaceX with a new line of business. More immediately, combining the two could further boost interest in a public listing expected this summer.該交易對新實體的估值為1.25兆美元;SpaceX的投資者將持有80%的股份,其餘歸xAI的所有者(馬斯克在這兩家公司中均持有控股權)。這次合併的官方理由是,兩家公司將合作向太空發射一批資料中心,讓xAI在開發尖端模型的競賽中獲得巨大優勢,同時為SpaceX提供新的業務線。更直接的影響是,兩者的合併可能進一步推高外界對預計於今年夏天上市的興趣。By bringing SpaceX and xAI together, however, Mr Musk is saddling a money-spinning space champion with a loss-making AI laggard. At the same time, he is reshaping Tesla, the carmaker he runs, into a “physical-AI company” focused on self-driving taxis and humanoid robots. If the latest wave of AI proves as transformative as some expect, these bold gambles might just pay off. If not, Mr Musk’s business empire could well be in jeopardy.然而,通過將SpaceX與xAI強行揉捏,馬斯克實際上是在給一個日進斗金的航天冠軍套上了一輛虧損的AI“破車”。與此同時,他正在將他經營的汽車製造商特斯拉重塑為一家專注於無人駕駛計程車和人形機器人的“物理AI公司”。如果這一波AI浪潮被證明像某些人預期的那樣具有顛覆性,這些大膽的賭博或許能獲得回報。否則,馬斯克的商業帝國很可能陷入危機。Start with the mega-merger. SpaceX is a jewel. In 2025 it launched close to 4,000 satellites into space, accounting for about 85% of the global total for the year (see chart 1). It can send objects into orbit far more cheaply than any competitor. Starlink, a satellite-broadband service that is its primary source of revenue, has around 9m subscribers worldwide, according to Deutsche Bank, more than triple the number two years ago. The company also has lucrative government contracts. All together, it reportedly generated as much as $16bn in revenue in 2025 and around $8bn in operating profit (before depreciation and amortisation).首先看這項巨型合併。SpaceX是一塊瑰寶。2025年,它向太空發射了近4000顆衛星,約佔當年全球發射總量的85%。它進入軌道的成本遠低於任何競爭對手。德意志銀行的資料顯示,其主要收入來源——衛星寬頻服務“星鏈”在全球擁有約900萬使用者,是兩年前的三倍多。該公司還擁有豐厚的政府合同。據報導,2025年其總收入高達160億美元,營運利潤約80億美元(折舊及攤銷前)。It is a far different picture at xAI. The AI lab last year made on the order of $500m in revenue from its Grok models; OpenAI, maker of ChatGPT, brought in about $13bn. X, the social-media platform with which xAI merged last year, brought in perhaps an extra $3bn in sales. Even so, the business as a whole is reportedly bleeding cash at the rate of about $1bn a month as it invests vast sums in data centres.然而,xAI的情況截然不同。這家AI實驗室去年通過其Grok模型獲得了約5億美元的收入,而ChatGPT的開發商OpenAI的收入約為130億美元。去年與xAI合併的社交媒體平台X,可能貢獻了額外的30億美元銷售額。儘管如此,據報導,由於在資料中心上投入巨資,整個業務正以每月約10億美元的速度“失血”。The company brings with it other problems, too. X is under investigation in the European Union and Britain over potential breaches of data regulations and for its launch over Christmas of an image generator that was widely used to produce nude deepfakes, including reportedly of children; on February 3rd its offices in Paris were raided by French authorities. Mr Musk has denied that the company has done anything wrong. If courts find otherwise, the EU could fine it up to 6% of its global revenue, while Britain could fine it up to 10%.該公司還帶來了其他麻煩。由於潛在的資料監管違規,以及聖誕節期間推出的圖像生成器被廣泛用於製作色情深偽影像(據報導甚至涉及兒童),X正受到歐盟和英國的調查;2月3日,其巴黎辦事處遭到了法國當局的突擊搜查。馬斯克否認公司有任何不當行為。如果法院裁定違規,歐盟可能對其處以高達全球收入6%的罰款,而英國的罰款比例可能高達10%。Then there are its various debts. Last year xAI borrowed $5bn to fund its data-centre binge. With Valor Equity Partners, a long-time backer of Mr Musk’s ventures, it has also set up an off-balance-sheet vehicle financed by around $3.5bn of debt in order to buy yet more AI chips. The merger with X last year left the AI lab with another $12bn or so of borrowings remaining from Mr Musk’s purchase of the social network. SpaceX, for its part, is on the hook to cover $2bn of interest owed by EchoStar as part of a deal last year to acquire mobile spectrum from the struggling satellite company. These combined obligations will strain the business at a time when xAI continues to operate at a loss and SpaceX is investing heavily in its new “Starship” launch system, which is behind schedule.接下來是各種債務。去年,xAI借款50億美元用於資料中心建設。通過與馬斯克企業的長期支持者Valor Equity Partners合作,它還設立了一個表外融資實體,借入約35億美元債務以購買更多AI晶片。去年與X的合併又讓這家AI實驗室背負了馬斯克當年收購該社交平台時留下的約120億美元債務。SpaceX方面,作為去年從陷入困境的衛星公司EchoStar收購移動頻譜交易的一部分,它有義務承擔該公司20億美元的利息。在xAI持續虧損、SpaceX正巨資投入進度落後的“星艦”發射系統之際,這些債務負擔將使業務面臨巨大壓力。Seeking stardust. A shot of equity from a public listing would help ease the burden. The merged company reportedly has plans to raise $50bn at a valuation of at least $1.5trn. It is a lofty sum even by Mr Musk’s standards. Tesla is valued at $1.5trn, but last year generated $95bn in sales—around five times as much as SpaceX and xAI combined. Some fuddy-duddy institutional investors will balk at the price tag. Others will be turned off by the association with Grok. But they will not be Mr Musk’s target audience. His pitch will no doubt present data centres in space as a prelude to factories on the Moon and cities on Mars. Retail investors will lap it up.尋求“星塵”光環。公開上市帶來的股權融資將有助於緩解負擔。據報導,合併後的公司計畫以至少1.5兆美元的估值融資500億美元。即使按馬斯克的標準,這也是個天文數字。特斯拉估值1.5兆美元,但去年創造了950億美元的銷售額——約為SpaceX和xAI總和的五倍。一些古板的機構投資者會對這個價格望而卻步,另一些人則會因為與Grok的關係而退縮。但這並非馬斯克的目標受眾。他的說辭無疑會將太空資料中心描繪成月球工廠和火星城市的序曲。散戶投資者們會對此趨之若鶩。Mr Musk’s willingness to merge SpaceX with xAI shows how committed he has become to dominating the AI industry. It is personal: he loathes Sam Altman, the boss of OpenAI, which Mr Musk co-founded and is now suing for abandoning its original non-profit structure. Mr Altman is also eyeing a giant listing this year.馬斯克合併SpaceX和xAI的意願表明,他已下定決心要統治AI產業。這帶有私人色彩:他痛恨OpenAI的老闆薩姆·奧爾特曼,馬斯克曾參與創立該公司,現在正起訴其背棄了最初的非營利結構。奧爾特曼今年也在謀劃大規模上市。In theory, using SpaceX to build orbital data centres might help Mr Musk gain the upper hand over his rival. Mr Altman has reportedly sought to acquire, team up with or build a space company to rival SpaceX, and has long mused about the benefits of space-based data centres. Google, a search giant whose Gemini model competes with both ChatGPT and Grok, is planning to send a test satellite containing its in-house AI chip into orbit in 2027.理論上,利用SpaceX建立軌道資料中心可能幫助馬斯克在競爭中佔據上風。據報導,奧爾特曼一直尋求收購、合作或建立一家與SpaceX匹敵的航天公司,並長期思考天基資料中心的優勢。搜尋巨頭Google的Gemini模型正與ChatGPT和Grok競爭,其計畫在2027年將一顆搭載自研AI晶片的測試衛星送入軌道。Mr Musk is eager to get a head start. On January 30th SpaceX filed a request to the Federal Communications Commission, an American regulator, to put a 1m-strong constellation of satellite-based data centres into orbit. Mr Musk argued that within two to three years, the cheapest place to provide computing capacity would be in space, by harnessing solar power that is undiminished by the atmosphere. Starlink satellites can then beam the data back down to Earth.馬斯克渴望搶佔先機。1月30日,SpaceX向美國監管機構聯邦通訊委員會提交申請,計畫向軌道發射由100萬個衛星資料中心組成的星座。馬斯克辯稱,在兩三年內,由於可以利用不受大氣層衰減的太陽能,太空將成為提供計算能力最便宜的地方。隨後,星鏈衛星可以將資料傳回地球。Yet much is still to be proven. The main question, says Sir Peter Beck, founder of Rocket Lab, a smaller rival to SpaceX, is which is cheaper: the cost of electricity on Earth, where power is scarce, or the launch costs to get to space, where energy is abundant? For now, the latter are prohibitive. In a study last year, researchers at Google said the launch cost per kilogram was not likely to fall to a level equivalent to the cost of running terrestrial data centres for at least a decade. A significant increase in computing capacity will be required for xAI well before that.然而,許多想法仍有待證實。SpaceX的小型競爭對手Rocket Lab的創始人彼得·貝克爵士指出,核心問題在於那種方式更便宜:是在電力稀缺的地球上的電費支出,還是去往能源充沛的太空的發射成本?目前,後者是極其昂貴的。在去年的一項研究中,Google研究人員表示,至少在未來十年內,每公斤的發射成本不太可能降至與營運地面資料中心相當的水平。而xAI早在那個時間節點到來之前,就需要大幅提升計算能力。There are also a number of technical hurdles. Orbital data centres will need large radiators for cooling, and cosmic rays could damage equipment. Chris Kemp, the founder of Astra, another rocket company, notes that AI chips tend to quickly become obsolete and need replacing. “You are going to have to refresh your satellites every few years, which further compounds the problem,” he says.此外還有諸多技術障礙。軌道資料中心需要巨大的散熱器進行冷卻,且宇宙射線可能會損壞裝置。另一家火箭公司Astra的創始人克里斯·坎普指出,AI晶片往往很快就會過時並需要更換。“你必須每隔幾年更新一次衛星,這進一步加劇了問題的複雜性。”Tesla, which in the past few years has stopped guzzling cash, could be enlisted to help. On January 28th the carmaker stated that it had invested $2bn in xAI. The two companies are increasingly sharing software, data and chips. Some speculate that Tesla could even be folded into the rest of Mr Musk’s empire, though doing so would be complicated by the fact that he does not own a controlling stake in the company, and as its chief executive recently secured a pay deal worth up to $1trn that may be put in doubt by a merger.在過去幾年已停止瘋狂燒錢的特斯拉,可能會被徵召來提供幫助。1月28日,這家汽車製造商聲明已向xAI投資20億美元。這兩家公司正越來越多地共享軟體、資料和晶片。有人推測特斯拉甚至可能被併入馬斯克帝國的其他部分,但這樣做會非常複雜,因為馬斯克並未持有該公司的控股權,且他作為首席執行長最近獲得了一份價值高達1兆美元的薪酬方案,合併可能會讓這一方案產生變數。Even so, Mr Musk is steering his carmaker straight into the AI hype-cycle. It will soon cease making its Model S, its first mass-produced electric car, and Model X, its gull-winged SUV. Together the two models accounted for just 2% of Tesla’s vehicle production in 2025. More telling was the fact that the factory space currently devoted to them will be repurposed to manufacture Optimus, Tesla’s humanoid robot. Mr Musk has set a target of making 1m of them a year by the end of 2027. At the same time, Tesla is investing heavily to develop its Cybercab, a two-seater self-driving taxi that is set to go into full production in April. Mr Musk has declared that by the end of this year his robotaxis will have broken free from a handful of testing areas and be available for up to half the population of America.儘管如此,馬斯克正帶領他的車企直接衝進AI炒作周期。特斯拉很快將停止生產其首款量產電動車Model S和鷗翼門SUV Model X。2025年,這兩款車型合計僅佔特斯拉產量的2%。更具指向性的事實是,原本用於這些車型的工廠空間將改建用於製造特斯拉的人形機器人Optimus。馬斯克設定的目標是到2027年底每年生產100萬台機器人。與此同時,特斯拉正投入巨資開發其雙座自動駕駛計程車Cybercab,計畫於4月進入全面量產。馬斯克宣稱,到今年年底,他的無人駕駛計程車將走出少數測試區,覆蓋全美高達一半的人口。Sub-Optimus. In reality, self-driving taxis and humanoid robots will take years to mature into cash-generating businesses. In the meantime, they will require vast investments just as Tesla’s core business is stalling. Vehicle sales in 2025 fell by 9%, the second year of decline (see chart 2). In Europe they plunged by a quarter. Some buyers have been turned off by Mr Musk’s political antics. The deeper problem, though, is stiffening competition in electric vehicles, both from legacy carmakers and Chinese newcomers. Tesla’s remaining line-up, starved of investment, will continue to become less attractive.“次優”現實。事實上,自動駕駛計程車和人形機器人需要多年才能成熟並成為盈利業務。與此同時,在特斯拉核心業務陷入停滯之際,這些領域仍需海量投入。2025年特斯拉汽車銷量下降了9%,這已是連續第二年下滑。在歐洲,銷量暴跌了四分之一。馬斯克的政治怪癖勸退了一些買家。然而更深層的問題在於,無論是傳統車企還是中國新秀,電動汽車領域的競爭正在加劇。由於缺乏投資,特斯拉現有的產品陣容吸引力將持續下降。As with SpaceX, then, Mr Musk is gambling Tesla’s future on AI, and his belief that he can harness his existing businesses to dominate the technology. Plenty of doubters have scoffed at his grand ambitions before. But never has Mr Musk put so much on the line. ■因此,正如對待SpaceX一樣,馬斯克正將特斯拉的未來押在AI上,押在他能利用現有業務主導這項技術的信念上。過去曾有無數質疑者嘲笑他的宏偉藍圖,但馬斯克從未像現在這樣,賭得如此之大。 (熊見)
聊一聊歐洲的AI公司
最近在學 ComfyUI,前幾天同事和我說,Flux 又出新的模型了——Flux 2 Klein,模型小,改圖能力很強。我拼寫的時候還以為他說的是 client,他糾正說 K-l-e-i-n,我一看,這不是德語裡面表示"小"的意思那個單詞嘛。他說 Flux 模型是由 Stable Diffusion 那個團隊的核心人員開發的。我看著"klein"這個單詞,猜想這是不是一家德國的團隊,就去查了查背後的故事,好傢伙,整個故事還是很精彩的。我們都知道,OpenAI 之前或者之後發佈的文生圖模型 DALL-E 2 和 DALL-E 3 都是閉源模型,之前很火的 Midjourney 也只能付費使用。但是 2022 年,大家的視野中出現了一個叫 Stability AI 的公司,這個公司發佈了一系列的 Stable Diffusion 模型,爆火全球。毫不誇張的說,Stable Diffusion 模型之於文生圖,類似於 ChatGPT 之於聊天模型。其中 22 年 10 月發佈的 SD1.5 以及 23 年 7 月發佈的 SDXL 是其中最最經典的模型,也是那個時期被使用最多的模型,那怕我一個新手開始學習 ComfyUI,回望文生圖的來時路,這兩個模型也是不能不學習的模型。這些模型的開源催生了很多的微調模型和 LoRA 外掛,極大地推動了文生圖整個行業的生態。故事的開始但是真正的故事要從 2021 年說起。那一年,德國慕尼黑大學的 CompVis 小組發了一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,這篇論文的作者是 Robin Rombach、Andreas Blattmann、Dominik Lorenz、Patrick Esser 和 Björn Ommer。這篇論文裡開發出了 Latent Diffusion Model (LDM),只用了幾十個 GPU 訓練。這篇論文已經獲得了超過 29000 次引用。2022 年,Stability AI 給這個團隊提供了算力支援,改進模型,改進後的模型被改名為 Stable Diffusion,以 Stability AI 的名義推出,此後發佈的所有的模型都叫 Stable Diffusion,成為一個系列。所以,Stability AI的 CEO Emad Mostaque 的貢獻主要是商業化包裝和算力支援,但他在宣傳中把自己塑造成了技術締造者,這引起了原團隊的一些不滿。慕尼黑大學的 Ommer 教授曾表示:"據我所知,在我們發佈 Latent Diffusion 時,Stability AI 根本不知道這回事,他們是後來才跳上這架馬車。"(原文在此:"Stability, as far as I know, did not even know about this thing when we created it," Björn Ommer, the professor who led the research, tells Forbes. "They jumped on this wagon only later on." )後來,迫於資金壓力,Stability AI 想要商業化文生圖模型,不再想要發佈開源模型,但是技術團隊堅持開源。於是 2024年 3月,Stability AI 的核心技術團隊離職。2024 年 8 月,他們創立了黑森林實驗室(Black Forest Labs),黑森林實驗室團隊的核心成員包括上面那篇論文的所有作者。 這個實驗室在弗萊堡創立,這座城市就在著名的黑森林地區,著名的黑森林蛋糕就是那裡的。這個團隊發佈了 Flux 模型,Flux 的成績很耀眼,那個時候大家的使用逐漸從 SD1.5 和 SDXL 轉向了 Flux 模型。兩家公司的不同命運兩周之前我開始學習 ComfyUI 的時候,發現現在業界普遍在用阿里出的開源圖像模型,Flux 1 沒有那麼多人使用了,黑森林實驗室 11 月發佈的的 FLUX.2 [pro]、FLUX.2 [flex]、FLUX.2 [dev] 沒有同期發佈的 Z-Image-Turbo 效果好,但是他們 2026 年 1 月又發佈了 Flux 2 Klein,重新回到大家的視野。同時他們也拿到了很多融資,2025 年 12 月完成 3 億美元 B 輪融資,估值 32.5 億美元,累計融資 4.5 億美元,黑森林實驗室的商業模式是大客戶戰略,他們不燒錢做 C 端,專注 B2B API 服務,有一些大客戶比如 Meta、Adobe 和 xAI 等。而之前的 Stability AI 這個公司,現在的前景不容樂觀。2024 年 Q1 收入不足 500 萬美元,虧損超 3000 萬美元,欠債近 1 億美元,創始人已辭職,2025 年面臨嚴重現金流斷裂,正在進行重組引入外部資本。最前沿的研究裡,人才是最重要的。離開了 Stability AI,Rombach 團隊也能做出同樣好的成績,但是反觀 Stability AI,現在的發展就不行。Rombach 團隊支援開源,Flux 1 和 Flux2 開源,對於行業來說就是一個台階一個台階往上走,每個模型比之前的要好一點,讓人敬佩。(同樣感謝一直開放原始碼的國產模型。)同時黑森林實驗室的商業路線,既保證了開放原始碼的初心,又保證了盈利的可能性。歐洲的其他AI公司除了黑森林實驗室,歐洲還有幾家值得關注的 AI 公司。Mistral AI 是法國的大語言模型公司,做開源和閉源的 LLM。 他們發展勢頭最猛,2025 年 9 月完成 17 億歐元 C 輪融資,估值達 117 億歐元,ASML 投資 13 億歐元成為最大股東。2024 年收入 3000 萬美元,2025 年預計增至 6000 萬美元。HuggingFace 也是法國的做開源模型社區和開發者平台的公司,有點像 AI 界的 GitHub。 最新融資是 2023 年 8 月的 D 輪 2.35 億美元,目前估值 45 億美元(約 330 億人民幣)。它目前的挑戰是盈利路線不清晰,估值遠超營收,需要持續證明商業價值。DeepL 是德國的翻譯公司。 DeepL 的發展讓人驚訝,因為 LLM 出現之後,翻譯被認為是最容易被大模型替代的方向,沒想到 DeepL 能藉著大語言模型的浪潮打一個翻身仗。我感覺主要有兩個原因,一是 DeepL 在翻譯精準性、專業術語和語境理解方面比通用大語言模型效果要好,特別是德語、法語等的翻譯。二是歐洲企業對資料隱私極為敏感,DeepL 提供本地部署和嚴格的資料保護承諾,因而有大量的企業客戶。另外,還有來自德國柏林的 n8n,來自瑞典的 AI 程式設計平台 Lovable 等等。歐洲 AI公司的困境我之所以關注歐洲的 AI 發展,除了 AI 產品本身有趣,也是期待在歐洲這些國家能有一些 AI 的應用和突破,而不是死守著資料隱私法過日子。之前 Jina AI 被收購時,CEO 肖涵對德國和歐洲的AI 環境提出了很尖銳的批評。他說:"雖說強者不抱怨環境,可我覺得我另一個錯誤就是對歐洲和德國抱有太多的期待和幻想。直到 2024 年我來到美國灣區後,我發現自己在一個過分平庸的地方浪費了很多寶貴的時間。對於整個德國和歐洲社會的左和保守,對 AI 紙上談兵和杞人憂天,勞動法對創業者缺乏理解尊重,及對優秀人才的冷漠無視,這些都讓我在 2023 年後對歐洲和德國無比失望。"他還提到,2023 年在公司裡叫上幾個德國同事一起去做一些 lobby 遊說,希望多參與到歐洲議會和德國政界來獲取關注和資源,一年下來活動參加不少,進展為零。直到有一天他明白了,他們邀請他去參加這些議會完全是把他看做一個 Diversity Guest,他們不需要他的專業知識,只需要那張亞洲面孔。Jina AI 本身是一家很厲害的德國 AI 創業公司,現在已經被Elastic 收購了,但是創始人對德國和歐洲有這樣的評價,實在是令人惋惜。這幾年歐洲出現的能打的 AI 公司也確實很少,因為歐洲 AI 公司的挑戰是很多的——面臨算力成本高,沒有自己的雲基礎設施,市場規模小並且歐洲市場分散,人才流失嚴重(頂尖人才去了美國和英國),政府和法律缺乏支援和融資環境差等等問題。但話說回來,黑森林實驗室的故事也證明了德國學術界的技術實力還是很強的,Flux 系列絕對是第一梯隊的模型。問題不在於技術能力,而在於是否有土壤和文化支援吧。 (地球美好不)
《洞察節拍》 掌握「盛極必衰」的洞察心法—從電動車「物理 AI」的轉折,聽見趨勢的低語#盛極必衰 #車用半導體 #AI轉機 #物理AI #道術合一 #投資心法 #趨勢洞察今晚我們將從車用半導體產業的AI轉機出發,特別聚焦「物理AI」所帶來的實體經濟重塑。深入探討「盛極必衰,陽極生陰」的核心意象,直搗先道後術的投資心法(M)。你是在尋找下個飆股,還是想掌握看懂市場轉折背後「心態」的能力,尤其是在「物理AI」浪潮下?召喚一起練穩現金流節奏的夥伴-----------------------------------------------------👉 MK郭俊宏陪伴式學習訂閱專案(網校平台)https://happy2brich.com/course/weeklyreport-----------------------------------------------------
科技股,大漲!Google 200億美元大動作,加碼AI支出!
大型科技股多數上漲,甲骨文大漲超9%。當地時間2月9日(周一),美股三大指數集體收漲,道指漲0.04%,再創歷史新高,納指漲0.9%,標普500指數漲0.47%。大型科技股多數上漲,甲骨文漲超9%,AMD、微軟、博通漲超3%,輝達、Meta漲超2%,特斯拉、台積電漲超1%。美股財報繼續密集出爐,可口可樂和福特汽車均定於周二公佈財報。分析師稱,如果本周的企業財報表現良好,市場近期從科技股輪動的趨勢可能會再次上演。投資者還關注勞工統計局推遲至本周三(2月11日)將發佈的1月份就業報告。該報告原定於上周五(2月6日)發佈,但因部分政府關門而推遲。Google擬發行200億美元債券加碼AI支出大型科技股多數上漲,甲骨文漲超9%,AMD、微軟、博通漲超3%,輝達、Meta漲超2%,特斯拉、台積電漲超1%。美光科技跌近3%,蘋果跌超1%,網飛、亞馬遜、安森美半導體小幅下跌。Google微漲0.4%。據媒體報導,Google母公司Alphabet計畫通過其美元債券發行籌集200億美元,規模高於最初預計的150億美元。知情人士稱,Alphabet周一進行的美元債券發行已吸引超過1000億美元的訂單。債券最多分為七個期限部分。期限最長的一部分——到期日為2066年的債券,其定價利差較美國國債高出0.95個百分點。此外,Alphabet也在向投資者推介其在瑞士和英國的首次發債計畫。其中,英國市場的發行還可能包括一筆罕見的100年期債券——這將是自上世紀90年代末網際網路泡沫時期以來,科技公司首次嘗試發行如此長期限的債券。Google上周公佈了2025年第四季度財報,營收和利潤均超出分析師預期。然而,該公司同時表示,今年資本支出最高可能達到1850億美元,遠超華爾街預期。除了Google,Meta、微軟和亞馬遜均公佈了龐大的資本支出計畫,四家科技公司今年合計將支出高達6500億美元,這些資金將主要用於擴建AI基礎設施。就在上周,甲骨文又通過一筆債券發行籌資250億美元,訂單峰值高達1290億美元,創下紀錄。此外, OpenAI正在衝刺一輪規模可能高達1000億美元的融資。知情人士稱,OpenAI預計未來兩周融資談判的機率明顯升溫。根據媒體此前報導,OpenAI本輪融資可能分兩個階段完成。第一階段可能包括來自微軟、輝達以及亞馬遜的資金,其中亞馬遜正討論向OpenAI投資最高500億美元。隨後還可能有軟銀等投資方的追加出資,軟銀曾討論再投入300億美元。財報方面,安森美半導體四季度營收15.3億美元,符合分析師預期,預計2026年一季度營收14.4億—15.4億美元,中值低於分析師預期15.1億美元。安森美半導體盤後一度跌8%。AI工具引發顛覆擔憂 美國保險經紀股遭重挫受私營線上保險購物平台Insurify發佈人工智慧工具引發行業顛覆擔憂的影響,美國保險經紀類股周一大幅下跌。標普500保險指數收盤下跌3.89%,創下自去年10月以來的最大單日跌幅。保險經紀公司Willis Towers Watson(WTW)表現最差,收盤下跌12.10%,遭遇自2008年11月以來最慘烈的交易日。Arthur J Gallagher(AJG)緊隨其後,下跌9.84%;怡安保險(AON)跌9.27%;布朗保險經紀(BRO)跌近7%;智能未來(AIFU)跌近5%;美國再保險集團(RGA)跌超2%。保險分析師Matthew Palazola表示,保險經紀股正遭到痛擊,市場可能對Insurify的新工具以及Anthropic的新人工智慧工具感到擔憂。這些應用可能對保險經紀公司的一些諮詢業務構成威脅,儘管他將其視為效能倍增器,而非生存威脅。熱門中概股漲跌不一,納斯達克中國金龍指數漲0.12%,房多多漲超12%,小牛電動漲超6%,世紀互聯漲超5%,知乎、富途控股漲超3%,新氧、途牛漲超1%,名創優品、拼多多、中通快遞小幅上漲;新東方跌超4%,理想汽車跌超3%,蔚來、霸王茶姬、嗶哩嗶哩跌超2%,叮咚買菜、小鵬汽車、愛奇藝跌超1%,霧芯科技、京東、唯品會小幅下跌。 (證券時報)