#核心
影石創新2025年營收97.4億,高研發佈局晶片與AI,雲台相機等三大新品一年內上市
4月28日,影石創新(688775.SH)發佈2025全年及2026年一季度業績,多項核心指標達歷史新高。2025年營收97.41億元,同比增長74.76%;2026年一季度營收24.81億元,同比增長83.11%。三年營收規模擴張近3倍,複合增長率超63%。據悉,雲台相機、無線領夾麥克風、無人機三大新品預計一年內上市,影石加速從硬體生產向影像生態建構者轉型。營收創新高的同時,受戰略投入加大、市場競爭及儲存元器件漲價影響,公司相關利潤指標下滑。創始人劉靖康在同期發佈的股東信中表示,短期利潤的主動調整,旨在換取長期業績和健康發展。2025年,影石研發投入15.3億元,同比增長接近翻倍;2026年Q1達4.65億元,再漲101%。除持續投入原有主營業務外,公司還戰略投入研發兩款無人機(含已上市的全球首款全景無人機“影翎A1”)、雲台相機、無線領夾麥克風及其他三個新品類,並同步定製開發三款晶片。“公司當前大幅增加研發投入,源於我們看到了廣泛且遠未被滿足的客戶需求。如今,影石原創的細分品類貢獻了超60%的營收,而這正源於我們七八年前的勇敢嘗試。”劉靖康在股東信中表示。IDC最新資料顯示,2025年影石在全景相機與拇指相機兩大核心原創品類保持全球領先地位,市場份額分別達到66%與57%。在股東信中,劉靖康首次闡明打造“攝影機器人”的長期技術願景,提出相機技術、影像演算法、無人機與雲台等“軀幹部分”已逐漸完善,將加速補齊“AI大腦”。目前,影石AI剪輯使用者匯出率已近50%,全景前沿技術開發順利,公司正與多家具身智能企業合作,幫助具身智能模型開發。劉靖康還提出,與巨頭的競爭顯著推動市場擴容和組織內部能力提升。IDC資料顯示,全球廣義運動相機市場在2025年增長72%。近日春假運動相機市場爆發,奧維雲資料顯示:中國消費級運動相機線上市場同比增長達232%。影石全景運動相機領跑,獨佔7成。影石在研發、市場、供應鏈等環節引入AI,公司43%應用程式碼由AI生成;線上客戶服務量超 50% 由 AI 承接,為公司節省超千萬元。影石線下專賣店已擴展至近300家,單店銷售額提升近五成,單台產品行銷成本同比下降約10%。 (芯榜+) 影石全球最大旗艦店今年3月落地深圳
新質生產力:8大前沿科技核心賽道(附報告)
量子科技,生物製造,綠色氫能,可控核聚變,腦機介面,具身智能,6G,詞元經濟,這八大前沿跑道,現如今正從實驗室向著產業一線加速湧來。它們各自瞄準算力,瞄準能源,瞄準連接,瞄準生命與物質的重構,相互交織成為人類下一階段文明的“基礎作業系統”。本文將各賽道的核心邏輯,關鍵資料以及最新進展進行濃縮,一段看懂一個熱門賽道,引領你快速掌握2026年的未來產業版圖。(文中附相關深度報告原文)一、腦機介面(BCI)讓大腦直接跟外部裝置進行通訊。全球BCI市場,從2019年的12.0億美元增長到2024年的24.8億美元,年增長率為25.25%;預計2029年能達到76.3億美元。中國首款侵入式醫療器械已經得到批准上市,非侵入式產品進入了消費電子領域。神經解碼和AI的融合正在加速跨越臨床轉化的“死亡谷”。報告延伸閱讀:腦機介面行業深度報告(點選下方圖片可查閱下載報告全文)二、具身智能具身於物理實體的AI,能與周遭環境深度互動,中國具身智能市場規模在2025年達到9731億元,較上一年同比增長12.7%,預計到2027年將突破1.25兆元。從進行工廠物料搬運作業,到開展酒店招待服務工作,人形機器人已著手切實實地驗證其商業價值。汽車供應鏈裡的感知、控制以及連接技術,正處於大規模進行跨界轉移的狀態,工業化實現落地的元年業已拉開帷幕。報告延伸閱讀>中國具身智能行業應用白皮書(2025版)三、量子科技憑藉量子疊加、糾纏等效應,量子科技正衝破經典算力的侷限屏障,2023–2025年,中國量子技術行業呈現出複合增長率超過30%的狀況,2025年時其市場規模已然達到275.7億元,在政策、技術與需求三張動力驅使下,預估2030年行業規模將會突破千億元,從量子計算至量子通訊,中國正從“跟跑”跨步邁向“並跑”甚至局部“領跑”。報告延伸閱讀>2026量子科技產業發展前景產業鏈佈局中美競爭現狀及相關標的分析報告四、詞元經濟AI大模型處理資訊時,最小單元是詞元(Token),它在AI時代的地位仿若“數字電力”。2025年,中國詞元呼叫總量達到24619.3兆次。預計到2026年,這一數字會增至11.18兆次。到了2030年,預計會猛漲到704.67兆次。在2025–2030年期間,預計複合增長率竟高達210%。詞元已然成為智能經濟裡價值錨點以及商業結算核心單位,以後不但個人套餐,會出現“詞元包”,並且企業還能依據自身需求去購買算力。報告延伸閱讀>(1)摩根士丹利: 《MS- 亞太地區中國AI發展之路:通過AI雲將激增的Token使用量貨幣化》(2)清新研究:《Token經濟學全景報告》(3)國信證券:《Token出海專題報告》(4)摩根士丹利:《中國AI路徑——通過AI雲實現激增token使用量的變現》五、綠色氫能運用風電、太陽能電解水來制取氫氣,其生產處理程序呈現零排放的狀態。在2023年至2025年期間,國內綠氫新增的每年產能依次為3.72萬噸、5.41萬噸、25.22萬噸,到2025年年底的時候累計建成了大約36.98萬噸。全國規劃了風光氫基項目879個,規劃的產能約為1036萬噸。其中存在的瓶頸是下游消納市場依舊不成熟,產能轉化有待於突破。2026年中國氫能產業發展白皮書-波士頓諮詢(點選下方圖片可查閱下載報告全文)六、可控核聚變可控核聚變被視作終極清潔能源,全球核聚變產業預計在2040年時,市場規模能夠達到8434.6億美元,當中中國市場將超過500億美元,年複合增長率為6.4%。中國全高溫超導托卡馬克“洪荒70”已經實現1337秒穩態運行,國產化率是96%。聚變不是再有50年才有的幻想了,超導、強磁等中間技術已經提前實現產業化。報告延伸閱讀:2026可控核聚變研究報告(點選下方圖片可查閱下載報告全文)七、6G全球6G市場在2025年的時候是4.5億美元,到了2026年就會急劇飆升至7.9億美元,預計在2035年能達到1191.7億美元,中國信通院做出預測,在2035年國內6G會形成兆元等級的產業以及應用市場,帶動規模超過5G的10倍以上,標準制定已經切實啟動,網路將會自身帶有“眼睛”和“大腦”。報告延伸閱讀:2025年6G傳輸技術白皮書(點選下方圖片可查閱下載報告全文)八、生物製造全球範圍之內合成生物學市場規模自2018年的53億美元一路攀升至2023年的近170億美元,年均呈現27%的增長態勢。預計在2028年的時候將會逼近500億美元。人工智慧加快了設計‑建構‑測試‑學習循環,生物製造正在從傳統發酵而轉向資料驅動的“物質程式設計”。 (TOP行業報告)報告延伸閱讀:中國生物醫藥創新 2.0 時代-科睿唯安(點選下方圖片可查閱下載報告全文)
20億美元收購案被直接叫停!美媒破防:中國不講自由?真相太打臉
4 月 27 日中國國家發改委一紙通報,直接叫停了一筆 20 億美元的跨國收購。消息一出美國媒體集體炸鍋。彭博社哀嘆一個時代結束了,華爾街日報抱怨手伸太長,還有人直接扣上破壞自由市場的帽子。可只要稍微往前翻一翻,就會發現這場指責有多諷刺。這次被收購的 Manus,是去年橫空出世的中國國產通用 AI 智能體。它的核心技術是中國團隊研發的,核心人才全是中國人,成長過程也完全依託中國的 AI 基礎設施和產業環境。它只是悄悄把註冊地遷到了新加坡,裁掉了中國大部分團隊,遮蔽了中國 IP,就想換個馬甲賣給美國的 Meta。很多人以為這樣就能繞開監管。但監管部門早就盯上了這筆交易。從 1 月 8 日啟動調查到 4 月 27 日下達禁令,整整用了 109 天。全程嚴格按照法律程序走,給足了雙方申訴和整改的機會。可對方始終避重就輕,一門心思指望境外殼公司矇混過關。最終的叫停決定,完全符合中國的外商投資安全審查辦法。而美媒口中的自由市場,在美國自己那裡早就成了笑話。美國的國家安全審查機制 CFIUS,早在 1975 年就成立了,比中國早了整整 46 年。全球商界都叫它併購粉碎機。最典型的例子就是幾年前的 Magnachip 收購案。中資智路資本出價 14 億美元,收購這家韓國晶片公司。這家公司的生產研發全在韓國,銷售也基本不在美國。就因為它在紐交所上市,CFIUS 直接以國家安全為由否決了交易。沒有公開證據,沒有正式聽證,智路資本最後還被迫支付了 7020 萬美元的終止費。類似的操作美國做過無數次。圍剿 TikTok 四年拿不出任何證據,逼著字節跳動要麼賣要麼關。輝達的先進晶片說斷供就斷供,連聽證會都不開。還直接出台規定,禁止美國風投向中國 AI 領域投一分錢。這是中國 2021 年實施審查辦法以來,首次公開叫停 AI 領域的外資收購。而美國 CFIUS 公開否決的中資科技收購,早就不止三筆了。美媒真正憤怒的根本不是自由市場被破壞。他們生氣的是,過去只有美國能用國家安全當藉口卡別人,現在這個規則居然被別人用了。很多人有個誤區,覺得公司註冊在那,它就是那的。但對科技公司來說,核心技術在那,核心團隊在那,它的根就在那。換個馬甲就能把國家培育出來的核心技術打包賣掉,這種空子本來就不該存在。自由市場從來不是沒有邊界的自由。任何主權國家,都有權保護自己的核心利益和國家安全。美國自己玩了幾十年的規則,現在輪到別人用了就跳腳罵街。這不是中國不講自由,這是用美國的鏡子,照出了它自己的雙標真面目。 (科技直擊)
DeepSeek幕後核心人物全梳理|梁文鋒之外,撐起國產AI的天才們
DeepSeek爆火的時候,所有聚光燈都打在梁文鋒身上。但他自己說過一句話,原話是這樣的:▌ "在人工智慧領域,前50名頂尖人才可能不在中國,但排名51到500的一定在。"他說的那批51到500名的人,今天大部分人都叫不出名字。但DeepSeek真正是他們造的。這篇文章,試著把聚光燈往別的地方照一照。━━━━━━━━━━━━━━━━一、朱琪豪:用16篇頂會論文換來一個程式碼模型2024年,福建莆田人朱琪豪從北京大學電腦學院博士畢業。他的博士論文《語言定義感知的深度程式碼學習技術及應用》,入選2024年CCF軟體工程專業委員會博士學位論文激勵計畫。在校期間,他發表了16篇CCF-A類論文,還兩次拿下ACM SIGSOFT傑出論文獎。其中一篇論文進入ESEC/FSE會議同年引用前三名。ACM SIGSOFT傑出論文獎是軟體工程領域含金量極高的獎項,很多資深研究者一輩子都未曾觸及。這是什麼水平?可以這樣理解:國內大多數博士一輩子能發2-3篇CCF-A,他發了16篇。他的導師是北大電腦學院的熊英飛副教授和張路教授,兩位都是軟體工程領域的重量級學者。朱琪豪在這樣的團隊裡,不是最亮眼的學生,卻是產出最穩定的一個。他的研究方向是"語言定義感知"——用人話來理解程式碼,讓AI能像人一樣"讀"懂程序的意圖。畢業之後,他沒有去大廠。直接進了DeepSeek。他主導開發了DeepSeek-Coder-V1——這是第一個讓國產AI在程式碼生成上正式能打的模型。在此之前,國產大模型在程式碼場景基本處於弱勢,很多人覺得"國產模型寫程式碼就是個笑話"。朱琪豪把這個笑話,變成了認真的事情。他還是DeepSeekMath的核心作者之一,參與了DeepSeek-V2大模型的研發。他的個人首頁上寫的自我介紹很簡短:▌ "Currently, I am a researcher at DeepSeek, where I focus on developing advanced large models for code generation and logical reasoning."沒有華麗的修辭,沒有刻意展示。就事論事。他現在多大?應該還不到30歲。二、代達勱(mài):"我不是奇才,我只是不停地做下去"圈內有人叫他"戴大麥"。代達勱,2024屆北京大學電腦學院博士,師從穗志方教授。他的研究方向是預訓練語言模型的知識記憶機理——用人話說,就是研究AI怎麼"記住"東西的。在頂會發表論文20余篇,Google Scholar引用次數超過28000次。作為第三核心作者獲得EMNLP 2023最佳長論文獎——這是中國大陸機構首次獲得該獎項,論文題目叫《Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning》,探索的是"情境學習"這個AI領域的核心問題。博士論文入選當年全國中文資訊學會激勵計畫,全國僅10篇。還拿過國家獎學金、校長獎學金、微軟學者提名獎、北京市優秀畢業生、北京大學三好學生標兵……但他真正值得說的,不是這些獎。他參與了DeepSeek從LLM v1一路走到V3的全程。更關鍵的是,他不是單純的"演算法人"。作為DeepSeek基礎設施負責人,他負責整個推理系統的工程最佳化與規模化部署。這意味著,他不僅要讓模型"聰明",還要讓模型在百萬級使用者同時湧入時不崩盤。他作為第一作者提出的DeepSeekMoE架構,發表於ACL 2024。這個架構通過"細粒度專家分割"和"隔離共享專家"解決了傳統MoE架構的知識冗餘問題,僅用28.5%的計算量就達到了DeepSeek 67B的性能。這是DeepSeek V2和V3的核心基礎。說得直白一點:沒有DeepSeekMoE,就沒有後來的V2和V3的性價比傳奇。36氪的報導這樣形容他:"理論上好使,工程上也能跑。"這個評價在學術圈其實很高,因為太多人能寫論文但不能落地,能工程實現的又往往缺理論深度。代達勱兩樣都行。他的工作在普通使用者眼裡就是一個問題:DeepSeek能不能用?轉不轉圈?在DeepSeek某次長達十余小時的大規模全站當機事件中,他是一線搶修核心。他的崗位就是這樣的:做好了沒人鼓掌,因為被視為理所當然;出問題會被全閘道器注。據公開報導,V4將全面基於國產晶片完成適配和最佳化——這意味著底層程式碼要大量重寫,推理系統要重新調優,性能瓶頸要重新排查。從輝達CUDA生態遷移到國產晶片框架,算子生態適配的工作量是巨大的。V4成敗,不只看模型跑分,更看發佈時系統能不能穩住。而"能不能穩住"這件事,得問代達勱。他負責的不是模型有多聰明,而是模型能不能在百萬級使用者同時湧入時不崩盤。V4傳聞四起,發佈時間從2月推到3月,又推到4月,外界都在盯著性能跑分,但真正的壓力測試,其實在代達勱這邊。伺服器資源是DeepSeek的軟肋,這已經不是秘密。問題是,留給代達勱的時間還有多少?三、邵智宏:在實習期間寫出了被全行業參考的演算法邵智宏,北京航空航天大學2015級電腦學院本科,後來去清華大學互動式人工智慧課題組讀博,師從黃民烈教授。他來DeepSeek,是實習。就是在這段實習期間,他提出並工程落地了改進版GRPO——Group Relative Policy Optimization,一個高效的強化學習對齊演算法。用大白話解釋這個演算法太複雜,但可以這樣理解它的意義:傳統的強化學習訓練需要一個"裁判"模型來給答案打分,而改進版GRPO直接弱化了裁判依賴,讓一組答案之間互相對比擇優,大幅降低訓練資源需求。這個方案後來被阿里Qwen 2.5技術報告明確引用。用人話說,就是別家AI公司,把一個在讀博士生實習期間的成果,用到了自家旗艦模型上。他後來以第一完成人身份領導了DeepSeekMath項目,通過高品質數學預訓練資料和GRPO強化學習,讓DeepSeek的數學推理能力達到世界級水平。還參與了DeepSeek-Prover(數學定理證明模型)、DeepSeek-Coder-v2、DeepSeek-R1。一個實習生,把腳印踩在了三個主力模型上。2024年度,他入選《麻省理工科技評論》"35歲以下科技創新35人"(TR35)中國區名單,當時28歲。他的個人首頁上寫的自我介紹:▌ "I'm interested in building self-improving systems that can reason."注意這個詞:self-improving。不是"我來訓練你",而是"你自己變得更好"。這是他對AI的核心信念,也是DeepSeek-R1背後的思想。四、羅福莉:"請網際網路還我一片安安靜靜做事的氛圍"在DeepSeek所有"離開"的成員裡,羅福莉是最廣為人知的一個。因為她是被雷軍親自挖走的。但她的故事,不只是一個跳槽的故事。羅福莉,95後,出生於四川宜賓。父親是電工,母親是教師,妹妹是醫生。普普通通的家庭,沒有所謂"程式設計貴族"背景。她本科讀的是北京師範大學電子專業,讀到一半決定轉電腦。父母一開始覺得女生不適合學電腦,說過:"你一個女生去修電腦,無論從學歷還是性別上來說都不具備優勢。"羅福莉的回應是:"我想探索更多可能性。"轉專業代價巨大。成績一度倒數,靠通宵補課才追上來。她的高中老師評價她"非常刻苦"——在四川的教育環境裡,這已是極高肯定。大三時,她進入北京大學語言計算實驗室實習,選擇NLP作為科研方向。3個月內自學Python,投出一篇頂會論文。之後保研進入北大。碩士期間在國際頂會發表超過20篇論文,其中ACL發表8篇,2篇為一作。畢業後拿到阿里星、騰訊技術大咖、百度AIDU計畫等多個大廠offer,最終選擇阿里達摩院。在達摩院,她主導開發多語言預訓練模型VECO,日均呼叫量達50億次,成為AliceMind八大模型之一。2022年離開達摩院,加入幻方量化,後轉入DeepSeek,參與V2多模態技術研發。她說過一句話,談到為什麼喜歡寫程式碼:▌ "很確定的事情,bug出在那會告訴你,鏈路非常短,幾秒就能收到反饋。"一個人喜歡什麼,從她描述它的方式就能看出來。2024年底,雷軍以高薪招攬她的消息傳遍科技圈。她一直沒有公開回應,直到2025年2月,她在朋友圈寫下:▌ "請網際網路還我一片安安靜靜做事的氛圍吧!捧得多高摔得多重!"反對"天才少女"標籤,呼籲"停止神化技術工作者"。這是一個真正做事的人的態度。2025年11月,她正式宣佈加入小米,任MiMo團隊負責人。12月發佈MiMo-V2-Flash,推理速度150 token/秒,在Agent複雜任務評測中位列全球開源模型Top 2。她寫的宣佈文裡有一句:"智能終將從語言邁向物理世界。"從四川宜賓的普通家庭,到"全力奮赴心目中的AGI"——這個女孩的路,走得很快,但每一步都是自己的。五、高華佐:那個從物理系走到AI最前沿的人高華佐,北京大學物理系畢業,來自廣東。他的名字在公開報導中出現頻率極低,低到很多人以為他不是核心成員。但他做的事,每一件都是硬核級的。2024年5月,DeepSeek-V2發佈。這個版本最被外界稱道的技術突破,是MLA——多頭潛在注意力機制,替代了傳統多頭注意力。簡單來說,它把推理視訊記憶體壓縮到此前常用架構的5%-13%。這意味著:同樣的算力,能服務的使用者量可以翻好幾倍。MLA的核心實現與最佳化,高華佐與曾旺丁是關鍵貢獻者。曾旺丁畢業於北郵,來自湖南新化縣,研究生導師是北郵人工智慧與網路搜尋教研中心主任張洪剛。兩人一個北大物理、一個北郵AI,沒有"標準大模型團隊"背景,卻合作完成了DeepSeek最關鍵的架構創新之一。高華佐高中就顯露天賦:2012年在華南師範大學附屬中學就讀時,獲第29屆全國中學生物理競賽一等獎,2013年保送北京大學物理學院。從物理到AI,跨度很大。但梁文鋒本身就是浙大信電工程出身,後來做量化投資。DeepSeek的招人邏輯很清楚:不看你學什麼,看你能不能解決問題。高華佐的名字,大多數人不知道。但你每次用DeepSeek的時候,背後都有他的程式碼在跑。六、趙成鋼:從衡水中學到DeepSeek的超算冠軍補一個細節:DeepSeek的硬體工程團隊裡,有人來自輝達、阿里雲,也有不少從幻方AI轉崗而來。但有一個人的經歷特別值得說。趙成鋼,河北衡水中學資訊學競賽班出身。2016年獲全國青少年資訊學競賽(CCF NOI)銀牌。進入清華大學後,大二就成為清華學生超算團隊正式成員。三次斬獲世界大學生超算競賽金牌。這個成績在超算圈意味著:他是全世界最會"把顯示卡用到極限"的年輕人之一。畢業後,他先後就職於Google、輝達。網友戲稱"老黃應該把招聘負責人開了",雖是玩笑,也說明一個問題:這樣的人才,在國外大廠做底層工程,回國後在DeepSeek能做更有影響力的事。在DeepSeek,他負責訓練與推理基礎架構。用輝達A100顯示卡,做到了相比官方DGX-A100更低的成本與能耗優勢。DeepSeek-V3訓練僅用約280萬GPU小時,遠低於國際同級模型的估算算力,約為Llama 3 405B估算值的1/10。以約1/10的算力,跑出了能與GPT-4o同台競技的模型。這背後,趙成鋼的基礎架構工程是關鍵。從衡水中學競賽班,到清華超算團隊,再到Google、輝達,最後到DeepSeek——他的每一步,都在"把硬體往極限操"。七、郭達雅:"入學第三天,我就完成了博士畢業要求"郭達雅,1994年生於廣東珠海,2023年中山大學博士畢業。導師是印鑑教授,並與微軟亞洲研究院前副院長周明博士聯合培養。周明是中國NLP領域標誌性人物,能被他看中的學生,本身已說明實力。但郭達雅最"驚人"的不是導師,而是成長速度。初中時期成績並不優秀,後來意識到自學的重要性,開始猛追。高考後的暑假,他自學完成大學一年級基礎課程。進入中山大學後,大四入選與微軟亞洲研究院的聯合培養項目。在微軟實習一年裡發表兩篇頂會論文。他本人笑稱:▌ "在剛入學的第三天,我就完成了中大博士生的畢業要求。"微軟實習前半年迷茫無方向,每周讀多篇論文,半年累計百余篇。後半年方向明確,進展極快:每篇論文約1個月實驗、2-3周撰寫。這是典型"慢熱型"人才:前半段厚積,後半段薄發。2023年7月,他加入DeepSeek,專注程式碼智能和大語言模型推理。V2、V3、R1等一系列模型的核心作者名單裡,都有他的名字。他的導師印鑑對他的期許是:"希望他能成為中大的'雷軍'。"據業內消息,郭達雅近期已離開DeepSeek,成為字節跳動等多家頭部公司爭搶的對象。能同時精通程式碼智能與推理最佳化的人,全球範圍內都屈指可數。他給中大學子的寄語裡說:▌ "一個人的學習能力才是最重要的'技術'。"從初中成績平平,到被導師寄予"中大雷軍"的期待,郭達雅的故事告訴我們:學習能力,比任何學歷都重要。八、那些"不合規"的人:undefinedDeepSeek裡有一個細節,很少被提到。梁文鋒說,團隊裡有人是物理專業畢業,靠自學電腦入職;還有維運工程師,入職前對大模型零經驗。對比其他AI大廠的招聘要求:N年大模型經驗、名校學歷、大廠履歷……還有吳信,DeepSeek後訓練團隊負責人,2019年北航博士畢業,在微軟亞洲研究院參與過小冰與必應百科項目。Google Scholar引用超12000次,影響力位居全球AI學者前列。但他加入DeepSeek前,工作年限並不長。還有王炳宣,北大元培學院碩士畢業,來自山東煙台,畢業後直接加入DeepSeek,參與了從V1開始的一系列重要工作。還有孫景翔,清華博士生,在DeepSeek實習期間與導師劉燁斌合作,完成3D生成相關開放原始碼專案。它不是語言模型,卻證明DeepSeek的技術佈局,比外界想像得更寬。這些人有一個共同點:年輕、經驗不算最長、沒有華麗海歸光環。但他們共同造出了讓全球AI行業刷屏的產品。━━━━━━━━━━━━━━━━梁文鋒的招人標準只有兩條Jack Clark,OpenAI前政策主管、Anthropic聯合創始人,評價DeepSeek僱傭了"高深莫測的奇才"。梁文鋒不同意。他說,我們要的不是"奇才",就兩條:第一,熱愛。第二,好奇心。不看名校,不看大廠履歷,不看有沒有做過大模型。他還說過一句話,我覺得最值得記下來:▌ "每個人有自己獨特的成長經歷,都是自帶想法的,不需要push他。讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。"這句話,解釋了朱琪豪、代達勱、邵智宏、羅福莉、高華佐、趙成鋼、郭達雅這些人為什麼會選擇DeepSeek。不是因為錢最多,不是因為光環最大。是因為有一個地方,讓他們可以去做真正想做的事。他們在DeepSeek的時候,沒有聚光燈。V4發佈之後,也不會有。但DeepSeek的每一個版本,都是他們用程式碼一行一行堆出來的。 (章魚爸爸AI商業和搜一搜實戰)
半壁華人!GPT Image 2團隊曝光:無錫才俊帶隊,13人4個月封神
GPT Image2全網刷屏,但效果究竟為什麼這麼好?研究負責人陳博遠揭秘:底層架構已徹底重構。但他又拒絕回答是否採用擴散模型或自回歸技術,只是神秘的將其描述為“通用模型”或“圖像領域的GPT”。陳博遠的一條推文還透露,從去年12月底的GPT Image 1.5算起,只用了四個月就有如此大的改進。這樣突破性的成果,核心團隊只有13人。整個團隊的負責人Gabriel Goh曬出了的團隊成員AI全家福。評論區有網友感嘆:怎麼全是亞洲人?陳博遠:從不懂Python到Research LeadGPT Image 2究竟是什麼架構?OpenAI恐怕很長一段時間都不會公佈了,但從核心團隊成員的學術經歷可以看出一些痕跡。陳博遠是團隊的Research Lead,他和另一位成員Kiwhan Song在MIT讀博時有同一位導師Vincent Sitzmann。他博士期間的代表作Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion入選了NeurIPS 2024。這項研究提出Diffusion Forcing這一全新序列生成訓練範式,將逐token獨立噪聲級擴散與因果下一個token預測結合,融合自回歸模型的可變長度生成與全序列擴散模型的長程引導優勢。他在Google實習期間還以共同一作身份發表了SpatialVLM。通過過自動建構網際網路規模的3D空間推理 VQA 資料集(1000 萬圖像、20 億 QA 對),為視覺語言模型賦予定量 / 定性空間推理能力,可從單張 2D 圖像輸出米制距離、尺寸、方位等精確數值。這項研究把思維鏈空間推理應用到了具身智能領域。在Google實習期間,他開發的指令微調技術後續還被Gemini 2.0採用。他在高中參加科研夏令營時,還不懂Python的基本語法,那時結識的GoogleDeepMind資深研究員夏斐把他引入了AI世界。夏斐兩次邀請他到DeepMind完成高品質實習,這些經歷使陳博遠積累了大規模模型訓練的工程經驗,也為他理解多模態系統的資料需求提供了寶貴視角。博士畢業後,陳博遠於2025年6月加入OpenAI,迅速成為GPT圖片生成五人核心成員之一,負責GPT圖像生成模型的所有訓練,同時也是Sora視訊生成團隊的一員。在演示中,他給家鄉無錫做了一張海報。然後為來自首爾的隊友做韓文海報,為來自Bangladesh的隊友做孟加拉語海報。每一張中的文字渲染都精準無誤。中科大Jianfeng Wang:讓生圖AI理解世界知識中科大博士畢業的Jianfeng Wang,在GPT Image 2團隊負責的是另一個讓人驚嘆的能力:指令遵循和理解世界。舊模型畫的永遠時鐘永遠指向10:10,源於網路上的鐘錶廣告圖,幾乎清一色都是10:10。這是因為鐘錶廠商找心理學家做過實驗,認為這有助於刺激消費者買表的意願。他讓新模型畫2:25、3:30、9:10、7:45,全部精準。這只是開胃菜。更多複雜的空間佈局,蘋果在中心、杯子在右邊、書在上面、相機在左邊、籃球在下面。模型全部精準執行。在加入OpenAI 之前,他在微軟工作近9年。在微軟期間就與OpenAI團隊在DALLE-3上有合作。他在電腦視覺領域發表了多篇學術論文,研究內容可能涵蓋 圖像分類、目標檢測、語義分割、以及視覺表徵學習 等方向世界知識理解能力的大幅提升,對象的語義內容和功能結構 有正確的理解JianFeng Wang在演示視訊結尾說到:GPT Image 2正在消除你的意圖和模型產出之間的差距。真正做到你想要什麼,模型就給你什麼。Yuguang Yang:生成高精度複雜資訊圖表Yuguang Yang在GPT Image 2的發佈活動中演示了生成資訊圖和PPT。整整75頁的GPT-3論文拖進ChatGPT,自動生成7張幻燈片。他的經歷可以說是團隊成員中最豐富的,每換一個工作都是跨界,但都聚焦機器學習。他本科在浙大竺可楨學院學的工程,博士在約翰斯霍普金斯大學期間學的是計算化學物理與機器學習。他第一份全職工作是量化分析師,在清華做訪問研究員期間亞牛的的是用於奈米機器人的強化學習和控制演算法。後來他在亞馬遜做過Alexa語音研究。又在微軟做過Bing搜尋的查詢理解和檢索、文件理解。2025年初加入OpenAI後,除了圖像生成還參與過ChatGPT智能體項目。他在個人帳號上介紹GPT Image 2的資訊圖生成能力,可以為科研人員節省大量時間。還反覆提醒大家,要做資訊圖不要忘記選擇思考模式。從DALL-E到GPT Image 2.0從團隊成員Kenji Hata的自我介紹中得知,GPT Image 1.0也就是GPT-4o的圖像生成部分。有一個人從DALL-E開始參與了OpenAI多模態系列研究的全程。他就是GPT Image 2.0團隊負責人Gabriel Goh。從2019年加入OpenAI,他的早期研究更篇理論,專注於可解釋性和凸最佳化等等。從DALL-E開始慢慢轉向了圖像生成。看到另一位團隊成員Weixin Liang的研究履歷,GPT Image 2的技術底色又揭開了一角。他在Meta實習期間的代表作Mixture-of-Transformers,引入模態解耦的MoE和解耦注意力,顯著降低多模態模型預訓練的計算成本。他博士畢業自史丹佛,本科也畢業自浙大竺可楨學院,不過比Yuguang Yang要晚好幾年。Weixin Liang與陳博遠一樣都是25年博士剛畢業就加入OpenAI,迅速成為團隊的核心成員。其他GPT Image 2.0團隊成員還包括:Ayaan Haque,之前在Luma AI 工作,參與過Luma的視訊生成基礎模型Dream Machine的訓練。Bing Liang,在Google幹了5年多,參與Imagen3、Veo、Gemini Multimodal,2025年跳到OpenAI做圖像生成研究。Mengchao Zhong,本科上海交通大學校友,碩士畢業於德克薩斯農工大學,在Pinterest和Airtable做過軟體工程師,在OpenAI負責多模態產品的工程。Dibya Bhattacharjee,耶魯大學,2015年IPhO銅牌,CIE A-Level數學和生物全球最高分。Kiwhan Song是25年10月最晚加入的,除了做研究之外,他還是團隊裡的提示詞大師,大家看到的官方演示圖很多都出自他手。……從最早的DALL-E到今天的GPT Image 2.0,這只團團隊先後解決了。畫得出來、畫得清楚、畫得好看、畫得準。儘管近年來OpenAI的人才流動很大,但OpenAI還是那個能不斷吸引各種有個性的人才,不限制專業、歡迎跨界,信奉自下而上湧現式研究的公司。從一個小團隊開始,有了突破後公司傾斜更多資源,直到改變世界。One More Thing曾經,GPT-4o圖像生成模仿吉卜力風格生成的頭像席捲了全世界。如今GPT Image 2.0的團隊成員,都把自己頭像換成了這種奇脖子畫風。那麼這種畫風的提示詞是什麼?團隊成員也公佈了出來Use my photo only for identity. Redraw me as a very simple surreal Japanese sticker-style caricature: long thin neck, small deadpan face, minimal black outline, flat light coloring, almost no shading, very few facial details, simplified hair shape, lots of white space, plain white background, slightly awkward and funny. Ultratall 1:3 image.(量子位)
雷軍攤牌了!十年內不做10萬以下汽車,網友吵翻
今天咱們聊個令汽車圈炸鍋的事兒。4月17日消息,雷軍在今天的京滬續航直播裡提到,未來幾年內小米都不會做10萬元以下的汽車,上了熱搜。圖源:微博電車通(ID:dianchetong233)說實話,自從小米開始造車,多少人都盼著小米汽車能像做手機一樣,把價格打下來,實現“人人買得起智能車”的願望。結果現在可好,雷軍直接給這個願望給滅了。這波操作不知道你破防了沒,反正小通是破防了。起因是直播中,一位網友問了一個問題:“小米啥時候出10萬以下的車?”一開始雷軍沒正面回應,後來彈幕實在太多,他才跟大家表態:“我明確跟大家說,小米未來5年、10年之內,都不會做10萬元以下的車型。”圖源:視訊號而且他還補了一句,10萬級價位已經有很多優秀的國產車型了,大家如果預算在這個區間,可以考慮別家的,真的都很不錯。言外之意就是說小米汽車不碰低價,讓你們別再盼著了。很多人看完直播紛紛問:雷軍這是飄了?放著這麼大的低價市場不做,非要死磕中高端?支援雷軍的網友說,“這才是正確的選擇,10萬真做不出好的智能車,與其敷衍,不如專注高端”、“一分錢一分貨,雷總說得沒毛病。”但反對的聲音也不少,大多是預算有限、盼著小米出低價車的網友。“我等小米10萬以下的車等了兩年,結果你告訴我十年不做?純屬耍猴!”還有人吐槽:“雷軍忘了初心吧?當年做手機說讓每個人都能享受科技的樂趣’,現在造車就開始嫌低價麻煩了?”其實網友們吵起來也正常,習慣了以性價比著稱的小米手機,自然期待小米汽車也能走親民路線。但其實雷軍五年前決定造車的時候,就立下過小米汽車的宏願。圖源:微博2021年3月,雷軍站在發佈會舞台上,喊出了“人生最後一次重大創業”的誓言,當時他給小米造車定下了三個核心目標:3年量產、10年投入100億美元、15-20年內成為全球前五的汽車廠商。雷軍當時還說,他造車的初心,就是“造出媲美保時捷、特斯拉的車,推動中國汽車產業一起進步,往高端化進步”。所以小米汽車不推出10萬以下的車型,應該是品牌戰略的選擇。話又說回來,雷軍說小米不做10萬以下的汽車,那會不會推出親民款的紅米汽車?電車通(ID:dianchetong233)看了一下,目前小米官方沒有任何關於“紅米汽車”的官宣,雷軍在直播裡也沒提過。而且按小米目前的戰略,短期內大機率不會有紅米汽車。當然話也不能說那麼滿,如果十年後,小米汽車已經實現了“全球前五”的目標,高端品牌形像已經穩固,而且智能化成本大幅下降,或許會推出紅米汽車,進軍低價市場,實現“全品類覆蓋”。圖源:微博但至少目前紅米汽車還只是大家的猜測。值得一提的是,雷軍在直播裡還聊到了有友商把他叫做“行銷大師”,對此雷軍直言這根本就是“陰謀詭計”。雷軍說去年很長一段時間,他都不想直播、不想參加任何活動,就是因為長時間的負面輿情,已經影響到很多使用者對小米汽車的印象。後來他做了很長時間的心理建設,才決定站出來,把事實一點一點告訴大家,那怕這樣做還是會有人黑他、說他這是行銷,他也無所謂。看得出來,雷軍對這個標籤真的很牴觸了。 (電車通)
黃仁勳最新訪談:要想成事,這4點遠比智力更重要!
AI 浪潮之下,工作方式、組織形態與個人價值正迎來根本性重構。在最近的一次深度訪談裡,一手推動全球 AI 革命的黃仁勳,說了一句顛覆所有人認知的話:智能正在成為一種廉價的商品。在 AI 時代,人類真正的核心競爭力,從來都不是智商,而是人性。這位全球任期最長的科技公司CEO,手下管著60位各領域頂尖的專家,每一個人在自己的專業賽道上,智商和能力都遠超他本人。但黃仁勳這位掌舵人,帶著輝達從一家瀕臨破產的顯示卡公司,長成了如今市值4萬多億美元的 AI 時代第一大廠。這篇文章,我們就從黃仁勳的親身經歷和底層思考裡,拆透 AI 時代最本質的生存法則:當智能變成一種廉價商品,到底什麼才是一個人、一家企業,真正不可替代的護城河。一、你拚命內卷的“智商”,正在被AI變成廉價商品以前我們覺得,能寫一手好程式碼的程式設計師、能精準分析財報的金融分析師、能快速出全案的品牌策劃,都是靠高智商吃飯的 “不可替代者”。但現在,AI能在幾分鐘內完成這些工作,成本不到人工的百分之一,精準率甚至更高。黃仁勳說,我們一直把“智能”這個詞過度浪漫化了,從本質上看,它就是感知—理解—推理—計畫的閉環,是一套功能性的動作。AI正在做的,就是把這套功能性的智力動作,徹底工業化、標準化、廉價化。你拚命內卷的知識儲備、計算能力、邏輯推理,只要是能被拆解成流程、被標準化的,AI都能比你做得更快、更好、更便宜。很多人焦慮AI會替代自己,其實換個角度想,是把自己繫結在了AI最擅長的標準化智力勞動上。你和AI比算力、比記憶力、比標準化的邏輯推理,就像當年手工紡織工人和蒸汽機卷產量一樣,從一開始就輸了。就像工業革命把手工勞動者從標準化的體力勞動裡解放出來,AI革命,正在把我們從標準化的智力勞動裡解放出來。既然標準化的智商已經成了廉價商品,那在AI時代,我們真正要拼的,到底是什麼?二、黃仁勳用34年驗證出,AI永遠替代不了的4種核心能力1. 遺忘痛苦的能力,以及相信未來的韌性所有瞭解輝達歷史的人,都知道CUDA平台,但很少有人知道,當年為了做CUDA,輝達差點破產。在CUDA誕生之前,輝達只是一家做遊戲顯示卡的公司,靠著GeForce系列產品站穩了腳跟。但黃仁勳從一開始就知道,只做單一功能的產品,路只會越走越窄。他想做的是通用的加速計算平台,CUDA就是這個夢想的核心。但這個決策,在當時幾乎是“自殺式”的。把CUDA放進每一塊GeForce顯示卡裡,會極大增加晶片成本,直接吞掉公司全部的毛利。當時輝達的市值大約在70億美元,而CUDA推出後,市值一路跌到了15億美元,全公司上下和資本市場,全是質疑的聲音。換做任何一個人,面對這樣的局面大機率都會止損放棄。但黃仁勳扛住了所有壓力,硬生生把這個決策堅持了十幾年,最終讓CUDA成了AI時代全球計算的核心底座,也讓輝達完成了從顯示卡公司到AI基礎設施巨頭的躍遷。很多人問他,到底是怎麼扛過那段至暗時刻的?他在訪談裡說了一句很有意思的話:AI學習最重要的屬性,就是系統性遺忘。人也是一樣,真正的韌性,從來不是扛住痛苦的能力,而是快速遺忘痛苦的能力。面對挫折和焦慮,他永遠只做三件事:第一,把問題徹底拆解,分開那些是可控的、那些是不可控的;第二,快速遺忘那些不可控的失敗、尷尬、羞辱,不把它們背在身上;第三,把所有精力,放到一件現在就能做的、可控的小事上,立刻行動。你看,AI能做最精準的機率計算,能做完美的邏輯推演,但它永遠不會有 “明知大機率失敗,依然願意賭上整個公司堅持” 的勇氣,不會有摔得粉身碎骨,依然能爬起來繼續走的堅定與韌性。AI時代,不確定性只會越來越多,比起完美的規劃,能扛事、能遺忘、能重新出發的韌性,才是你最基本的生存底氣。2. 共情與信任的能力這次訪談裡,黃仁勳講了一句輕描淡寫,但是讓商業圈大受震撼的話:輝達和台積電合作了30年,涉及數百億美元的生意,但雙方之間沒有一份正式的合同。不止是台積電,黃仁勳能提前3年說服全球頭部記憶體廠商,在HBM記憶體(筆記俠註:一種先進的半導體儲存技術,主要用於滿足高性能計算、人工智慧、圖形處理等領域對記憶體頻寬和傳輸速度的極高需求)還只用於小眾超級電腦、幾乎沒有商用場景的時候,就砸下數十億美元擴產。很多人覺得,這是因為輝達的行業地位,是因為利益繫結。但黃仁勳自己說,這靠的不是合同約束,不是利益算計,而是基於共同願景的信任。黃仁勳做所有事,都是把自己的戰略、對未來的判斷,毫無保留地分享給合作夥伴,從第一性原理出發,給他們講清楚 “為什麼要做這件事”,給他們充分質疑的機會,給他們足夠的尊重。黃仁勳會告訴他們,未來3年行業會發生什麼,這個投資會給他們帶來什麼長期價值。對內管理也是一樣。他管著60個直屬下屬,全是各領域的頂尖專家,但他從來不開一對一會議,所有問題都放在公開會議上,所有人一起推演、一起解決。有人問他,這麼多人,一對一溝通根本忙不過來,不怕資訊不對稱嗎?他說:恰恰是一對一會議,才會造成資訊不對稱。所有問題放在檯面上,所有人都能聽到上下游的訴求,都能理解彼此的難處,都能一起參與決策,這才是最高效的協作。而這一切的前提,就是信任。AI能把利益帳算到極致,能做最精準的博弈分析,能寫出滴水不漏的完美合同,雖然AI能把一件件事情做好,但人與人之間必須建立在信任的基礎上才能把一件件看似難以聯絡在一起的事情打通,它永遠理解不了“信任”兩個字的重量。商業的本質,是人和人的協作。一份合同,只能約束對方不做壞事,只能守住合作的底線;但一份信任,能驅動一群人,一起做成一件沒人做過的大事,能拉高合作的上限。AI時代,資訊越來越透明,計算越來越容易,但真正稀缺的,永遠是別人願意毫無保留地和你背靠背的信任。注意,AI有做事的能力,但是AI不是生命,無法理解生命之間不只是理性才能協同。3. 願景與意義感黃仁勳在訪談裡說,他的60個直屬下屬,個個都是各自領域的超人,每一個人在專業上,都比他聰明得多。很多人都好奇,一個專業能力不如所有下屬的人,憑什麼能帶著這家公司,做成兆級的事業?答案很簡單:他能給所有人一個共同的願景,能定義 “我們為什麼要做這件事”,能給所有的技術、所有的算力,找到一個真正有意義的方向。他在訪談裡說,未來全球能程式設計的人,會從現在的3000萬,暴增到10億。因為程式設計的本質,早就不是寫一行行程式碼了,而是給電腦提需求、定規格、描述你想要實現的目標。這件事,AI能幫你完成99%。但AI永遠不能定義的,是“我們為什麼要寫這個程式碼”、“我們要解決什麼人的什麼痛點”、“我們要給世界帶來什麼改變”。輝達能從一家遊戲顯示卡公司,進化成AI時代的全球頂尖公司,靠的不是黃仁勳比別人更懂晶片設計,而是他從一開始,就看準了“加速計算”這個方向,想給全世界的創新者,提供最強大的算力基礎設施。那怕在最艱難的時候,這個願景也從來沒變過。AI永遠不會有“我想改變世界”的願望,永遠不會有“我想幫使用者解決一個痛點”的初心,永遠不會有“我想給社會創造價值”的意義感。而所有偉大的企業、偉大的產品,本質上都是被願景和意義感驅動的。AI是一個無限強大的工具,但工具永遠需要人來定義方向。沒有方向的算力,再強也毫無意義;沒有意義的智能,再先進也走不遠。AI時代,最不缺的就是能幹活的工具,最稀缺的永遠是能定義方向、賦予意義的人。4. 謙遜與成長力那怕現在成了全球頂級的CEO,黃仁勳在訪談裡,依然坦然說起自己的第一份工作是在餐廳刷廁所。他從來沒有“成功者的傲慢”,永遠保持著初學者的心態,永遠在向所有人學習。最能體現這一點的,是他對“繼任計畫”的理解。很多人都知道,黃仁勳以“不相信繼任計畫”聞名。有人說,這是因為他貪戀權力,覺得自己能一直幹下去。但他在訪談裡,給出了完全不一樣的答案:“我不相信繼任計畫,不是因為我是永生的。而是因為如果你真的關心公司在你之後的未來,你今天最該做的事,不是找一個接班人,而是持續地、毫無保留地傳遞知識、資訊、洞察力、技能和經驗,賦能你身邊的每一個人。”他的每一次會議,都是一次公開的推理會議。他不會直接下達指令,而是會把自己的思考邏輯、判斷依據、甚至是顧慮和不確定性,全部攤開給團隊看,帶著所有人一起推演,一起最佳化,一起成長。他學到的任何東西,從來不會在自己的腦子裡停留超過一秒鐘,立刻就會分享給團隊。他討厭“持續改進”的思維,因為這種思維本質上是默認了“現在的做法是對的”,只能小修小補。而他永遠會回到零,回到第一性原理,問自己:這件事為什麼要這麼做?如果從頭開始,以今天的技術和條件,我們能做成什麼樣?這種思維的前提,就是永遠保持謙遜,永遠不被自己過去的經驗和優越感困住。所以,真正的長期主義,本質上就是持續成長的能力,就是永遠能打破自己、重構自己的能力。AI時代,知識更新的速度只會越來越快,比起你已經掌握的知識,永遠保持謙遜、永遠能成長的能力,才是決定你能走多遠的核心。三、AI時代,修煉 “人性競爭力” 的4句話1. 把工作分成兩類:一類是標準化智力任務:比如做資料統計、寫常規程式碼、整理資料、套範本做方案、重複的報表分析;另一類是人性價值任務:比如和使用者聊真實的需求痛點、和團隊做深度溝通、制定業務的長期方向、解決非標準化的複雜問題、給客戶提供有溫度的服務。未來,要把你80%的精力,放到後者上面。AI能幫你高效完成前者,但後者才是你不可替代的核心價值。2. 比起完美的規劃,能讓你在不確定性裡站穩腳跟的,永遠是立刻行動的韌性。3. 不管是對合作夥伴、團隊同事,還是你的客戶,放棄零和博弈和 “算計到底” 的小聰明。和客戶合作,多做一件超出預期的事,那怕只是多給一個實用的小建議;和同事協作,多一分坦誠的溝通,少一點背後的算計;和夥伴相處,多站在對方的角度考慮問題,守住自己的底線,也給對方足夠的尊重。4. 永遠保持 “初學者心態”,放棄你的智商優越感。結語今天我們深嵌於一個新的時代,科技、經濟、哲學、政治都在經歷持續變革和深刻重塑的複雜社會與商業環境之中,而真正困住絕大多數人的核心挑戰,恰恰是:我們的認知框架、組織形態和行動邏輯,還停留在“前全球化時代”、“前AI時代”。 (筆記俠)
中國國產世界模型登頂全球第一!斷層領先Google輝達,3D精準度逼近滿分
還得是咱中國國產世界模型牛!極佳視界最新力作GigaWorld-1,直接擊穿Google輝達,WorldArena登頂全球第一。而且還是唯一一個綜合得分突破60分大關的具身世界模型。什麼概念呢?就以三大核心維度為例,幾乎是斷層式領先:Physics Adherence(物理遵循):相比第二名提升了整整16%。3D Accuracy(3D精準度):近乎逼近滿分。Visual Quality(視覺質量):同樣遙遙領先。也就是說,GigaWorld-1是真正的全能型具身世界模型,不僅視覺真實,而且幾何精準、物理精準。這意味著,極佳視界這家由清華系領銜,匯聚了阿里、百度、地平線等一眾頂尖大廠核心骨幹的中國團隊,已經率先完成了一次教科書式的技術超車。從最嚴苛的“試金石”脫穎而出眾所周知,WorldArena是世界模型領域公認的“試金石”。它由清華大學聯合普林斯頓大學、新加坡國立大學、北京大學、香港大學、中國科學院、上海交通大學以及中國科學技術大學等8所中國外頂尖高校及科研機構共同打造。其摒棄了單一維度的片面測試,轉而建構包含16項細分核心指標和3大真實應用任務的立體評估體系,旨在對具身世界模型的感知精度、物理規律理解、三維空間認知以及動作預測與落地能力進行最嚴苛的壓力測試。也正因如此,WorldArena吸引了全球幾乎所有頭部世界模型團隊同台競技,首批參評名單包括Google、輝達等。最終的結果也出乎所有人意料,不是科技巨頭,而是這家低調耕耘的技術掃地僧——極佳視界。其旗下最新的GigaWorld-1憑藉硬核實力,成功摘得桂冠!顯式動作建模與可微分物理引擎的完美融合那麼為何GigaWorld-1能取得如此傲人的成績呢?首先從技術路線看,GigaWorld-1是一款專為具身場景打造的AC-WM(Action-Conditioned World Model,動作控制世界模型) 。相較於傳統的世界模型,GigaWorld-1深度繼承並行展了極佳視界在去年7月發佈的EmbodieDreamer核心架構。該方案不僅引入了顯式的動作建模機制,從根本上保證了視訊生成過程中的幾何一致性;更創新性地融入了可微分物理引擎,從而獲取精準的機械臂物理參數,以實現對複雜物理互動過程的真實模擬與嚴格遵循。在此前沿架構的基礎上,極佳視界進一步引入了團隊長期積累的上萬小時高品質真實機器人操作視訊資料進行訓練,極大地增強了模型在開放場景下的泛化能力與高精度的動作遵循表現。目前,GigaWorld-1的核心程式碼與部分資料集已開源。僅開源後的短短半個月內,GigaWorld-1在HuggingFace平台的下載量便火速突破16000次,足見學術界與工業界對其技術實力的高度認可,以及在開發者社區中的巨大影響力。同時GigaWorld-1還將作為官方Baseline,強力支援即將於3個月後在美國舉辦的GigaBrain Challenge@CVPR 2026國際挑戰賽,為全球開發者積極賦能,共同推動具身智能生態的繁榮發展。(比賽官網:https://gigaai-research.github.io/GigaBrain-Challenge-2026/)於是這就引出了一個關鍵問題——極佳視界是誰?中國首家專攻世界模型的公司在業內,極佳視界是少有的產投雙棲玩家,一邊悶頭做技術,一邊又能拿下巨額融資。在本月初,極佳視界剛剛宣佈完成近10億元Pre-B輪融資,投資方陣容堪稱豪華——中芯聚源、上海半導體產投基金、臨芯資本、星源資本、萬林國際等頂尖晶片和汽車產業資本領投,中金資本、蘇創投、華強資本等重磅國資平台和知名財務機構跟投。而這,也並非極佳視界首次獲得資本追捧。早在2025年11月,華為旗下的哈勃投資就已聯合華控基金,完成了對極佳視界的億元級A1輪戰略投資。其實華為對世界模型關注已久,此前就將世界模型列為未來智能世界2035年十大技術趨勢之首。但它沒有像Google、輝達、特斯拉這些全球科技巨頭那樣直接佈局世界模型,而是通過哈勃投資,先在中國市場找到了最具潛力的標的——極佳視界。極佳視界是中國第一家佈局世界模型的公司,在世界模型的模型架構和資料引擎兩方面都擁有行業領先的深入積累。公司定位相當清晰,就是聚焦物理AI,致力於世界模型驅動的物理世界通用智能。其技術護城河建立在“世界模型×具身大腦”的雙輪驅動戰略上,並在世界級權威測評榜單中,成功拿下具身大腦和世界模型的雙料冠軍。產品矩陣包括世界模型平台GigaWorld、具身基礎模型GigaBrain、通用具身本體Maker等物理AI全端軟硬體產品。GigaWorld:物理世界的“數字沙盒”GigaWorld是極佳視界自研的世界模型平台,能模擬物理世界運行規律,生成高保真合成資料。與傳統模擬器相比,GigaWorld能通過幾何一致、物理精準的世界模型建模,生成高保真、可控、多樣化的具身互動資料,實現資料放大。這使得所訓練的VLA模型在新紋理、新視角、新物體位置三大泛化維度上均實現近300%的性能提升。更關鍵的是,GigaWorld能帶來10-100倍的效率提升。在具身方向,GigaWorld-0是全球首次讓具身世界模型在高水平具身基模上發揮核心價值,其GitHub開放原始碼斬獲1.5k+ Star,奠定了技術驗證的基礎。本次登頂WorldArena的GigaWorld-1,也是當前全球最領先的AC-WM。在駕駛方向,DriveDreamer系列是全球範圍內最早將世界模型用在物理世界的系列開創工作。此外,GigaWorld-Policy也是全球首次實現世界-動作模型WA即時性、成功率、訓練效率全面突破,實現了對主流WAM推理效率和性能的全面碾壓,讓世界-動作模型真正開始進入大規模Scaling階段。實測資料顯示,GigaWorld-Policy實現了10倍推理速度與10倍訓練效率的跨越式提升,同時任務成功率大幅上漲30%,標誌著具身智能正式邁入由世界模型驅動的新紀元。GigaBrain:機器人的“通用大腦”GigaBrain是極佳視界開發的端到端視覺-語言-動作基礎模型,在全球目前規模最大的真機評測比賽中,極佳視界的開源模型GigaBrain-0.1超越Pi0.5等眾多模型,獲得全球第一。後續發佈的GigaBrain-0.5M*則是全球首個基於世界模型的強化學習實現高效學習和自我進化的具身基模。它提出基於世界模型的強化學習範式,並採用迭代式四階段閉環訓練流程。在高難度長時程任務中,面對摺紙盒、咖啡製備、衣物折疊等包含多階段操作、精細感知與持續決策的複雜場景,GigaBrain‑0.5M*均實現接近100%的任務成功率,並可穩定復現,充分彰顯出卓越的策略魯棒性。物理AI“夢之隊”集結除了技術和融資,極佳視界更亮眼的莫過於其核心團隊:創始人兼CEO黃冠,清華大學自動化系創新領軍工程博士。曾擔任地平線機器人視覺感知技術負責人、鑑智機器人合夥人&演算法副總裁,並擁有微軟亞洲研究院、三星中國研究院等頂尖研究機構工作經歷。他完整經歷了過去十年物理AI的技術和產業發展歷程,多次帶領團隊獲得全球權威AI比賽世界冠軍,並行布多個全球知名AI成果。聯合創始人兼首席科學家朱政,智源青年學者,發表頂級論文70余篇,引用近2萬次。多篇著作影響力巨大,連續4年入選全球前2%頂尖科學家榜單,多次獲得吳文俊自然科學一等獎、最佳學生論文獎、CCF 傑出論文獎等榮譽,也是多個頂會領域主席、多項競賽冠軍。聯合創始人孫韶言,曾擔任阿里雲總監,地平線資料閉環產品線總經理,在物理世界超大規模資料閉環產品和架構方面擁有行業領先的經驗。他主導了業內首個智能駕駛資料閉環系統的落地,有效提升了資料的處理效率,為智能駕駛技術的發展提供了重要的基礎設施支援。合夥人兼工程副總裁毛繼明,擁有超過16年的模擬/工程/資料/分佈式架構方向的經驗。曾擔任百度Apollo模擬和工程負責人,以及曾擔任百度、贏徹等T10等級架構師,主導多個自動駕駛與世界模型核心項目的技術開發與落地。在高品質資料生成、端到端自動駕駛架構設計以及分佈式系統最佳化領域有著深厚的積累。另外,極佳視界模型核心團隊還包括博士期間超10篇頂會一作的世界模型頂尖科學家、超過10年物理AI全端量產經驗的產業專家、華為天才少年獲得者、萬卡叢集線性加速的頂尖演算法和infra專家等,是行業少有的同時擁有頂尖的新一代物理AI全面技術前沿創新能力和傳統物理AI全端系統量產經驗的全端團隊。可以說,這支團隊完整經歷了CV、自動駕駛、具身基模、世界模型等物理AI過去十年的發展歷程,並在每個階段都做出了行業領先的世界級成果。當他們聚集在一起,就共同造就了這支始終引領具身世界模型技術演進的“夢之隊”。從資料引擎(Data Engine),到閉環模擬器(AC-WM),再到世界動作模型(WAM),極佳視界一直走在前列。無論是當前世界模型和具身智能基礎設施的迭代,還是未來的AGI,極佳視界都將持續打造最堅實的技術基石。 (量子位)