#Lab
10家新公司、9家獨角獸,這個新賽道憑什麼讓矽谷風投瘋狂下注?
估值百億,產品幾無,這便是當下最瘋狂的AI資本敘事。最近,前OpenAI CTO米拉·穆拉蒂創立的Thinking Machines Lab,正以高達500億美元的估值,籌劃新一輪40億至50億美元的融資。而它拿得出手的,僅是一個名為Tinker、介面尚待考證的API介面。相比傳統商業邏輯,這無異於一場豪賭:資本押注的,早已不是產品,而是人,是那串貼在創始人身上的“OpenAI開國元老”的黃金標籤。穆拉蒂的實驗室,正是席捲矽谷的neolab(新生代實驗室)風潮中最耀眼的一朵浪花。據國外知名VC menlo合夥人Deedy推文,AI領域新興的10家neolab中,9家在種子輪階段就斬獲10億美元估值。一批從OpenAI、DeepMind等巨頭出走的頂尖研究員,正以反叛者的姿態,用全新的範式重建AI研究的邏輯。他們不談營收,不論商業化,只談那些看似天方夜譚的方向:情感智能、AI社會、自動化科學家等。資本的反應則更為直接與狂熱:Humans&成立數月估值40億,SSI瞄準超智能安全估值320億,Periodic Labs一出手種子輪便是3億……這些在傳統視角下“啥也沒有”的實驗室,正以令人咋舌的估值,鯨吞著數十億美金。當最聰明的大腦決定另起爐灶,資本的選擇是不看PPT,只認履歷,用真金白銀為他們的直覺與純粹投票,賭他們能用履歷兌換一個不一樣的未來。/ 01 / 5家,拿下 25億美元當OpenAI和Anthropic的估值飆升至1830億美元量級,變得“貴得離譜”時,資本的洪流正悄然湧向一批更為神秘、精悍的新型實驗室neolab。根據The Information報導,僅五家neolab初創公司,就在過去一個月內完成或洽談了高達 25億美元 的融資。如果只看研究方向,neolab的主題幾乎毫無共識:有人在做多智能體數字社會,有人在研究情感智能,有人在做自動化科學家,有人探索身體化智能,有人在推進實驗物理材料,有人在逼近通用智能的邊界。它們共同點只有一個——創始人都是那批走出巨頭實驗室的最能打的人。這些neolab的創始人,幾乎全部從OpenAI、DeepMind、Anthropic等巨頭出走,個人財富早已達到千萬乃至億美元等級。然而,他們放棄了巨頭的穩定與高薪,選擇all in一種新的AI範式。正是這種財務自由帶來的純粹性,構成了neolab最核心的魅力。他們可以無視短期商業化壓力,專注於那些巨頭不屑或無力觸及的高風險、長周期探索。於是,我們看到了研究方向呈現出前所未有的多元化:前xAI研究員Eric Zelikman籌集10億美元打造情感型AI初創Humans&,他不追求更快的推理速度,而是讓AI理解情緒、進行價值權衡,並建立長期關係。OpenAI安全研究員Eddie Zhang創業打造“多智能體數字社會”Isara,試圖讓上千個AI智能體像真實公司一樣自主分工、協作與治理。前OpenAI首席科學家Ilya Sutskever創立SSI,將“開發可控的超智能”作為唯一使命,安全優先於一切,據傳估值已觸及320億美元。相比之下,巨頭們似乎被禁錮在大模型最佳化的單一路徑上,追求參數與算力的線性增長。而neolab則追求迭代智能,其使命不是把模型做得更大,而是去發現新的智能結構。這種純粹性也讓他們能夠保持極度小而精的團隊,將“技術複利”做到極致。當然,這也催生了“夢想驅動估值”的奇觀。這些實驗室普遍收入極低甚至為零,沒有成熟產品,卻憑藉創始人的光環效應和顛覆性願景,在早期就獲得令人瞠目的估值。最典型的案例莫過於前OpenAI CTO Mira Murati創立的Thinking Machines Lab。在僅推出一個初步的開發者工具Tinker、產品能力有待考證的情況下,其估值據傳已高達500億美元。相比巨頭,neolab的10億美元估值幾乎是白菜價,例如Murati作為OpenAI開國元老的標籤,其加成就已值百億。/ 02 / 情感智能、遊戲視訊模型……九成種子輪拿10億美元估值接下來依次介紹這些neolab。①OpenAI“開國元老”單干,做超智能保險Safe Superintelligence(SSI)由前OpenAI首席科學家Ilya Sutskever聯合Daniel Gross與Daniel Levy創立,將"開發可控的超智能"作為唯一使命,安全優先於短期商業化。團隊聚焦精銳科研與安全工程,而非消費級產品化。▲ Ilya Sutskever、Paul Christiano、aniel Kokotajlo(從左到右)披露融資規模接近/超過十億美元,並與雲基礎設施方戰略合作保障算力。技術上需解決三大核心:推進能力時確保安全邊界領先、將理論對齊工程化、在無產品壓力下維持透明治理。短期內SSI是"科研+安全驗證"的高強度實驗室。儘管目前無商用產品,但其獲得Google(TPU支援)與Nvidia投資,估值據報達320億美元等級,表明資本對“長周期、安全性極高”的AGI實驗室有信心。②前OpenAI CTO出走創業,聚焦“企業定製模型”相比Cursor的290億美金估值,Thinking Machines啥也沒有就快估值500億美元。原因在於其創始人Mira Murati給它的加成太大。這位前OpenAI CTO、臨時CEO技術背景聚焦工程研發+產品落地+AI前沿技術操盤,她於今年出走創立新公司。▲Mira Murati新公司主攻“可解釋的群體智能”與符號-機率混合架構,將大量輕量級模型組織成層級化“工作流工廠”,通過可驗證協議在金融風控、藥物發現等高風險場景,實現可審計的多智能體協同。實驗方向包括任務分解語言、跨智能體信任評分與動態合約(以弱監督獎勵流標註),安全邊界被設為首要原則。10月,Thinking Machines推出了Tinker。近期,Thinking Machines Lab在籌集40億至50億美元。此前它已籌集了20億美元資金,最近一次的估值為100億美元。③前xAI研究員籌集10億美元打造情感型AIEric Zelikman來自xAI,是行業內罕見專注“情緒、價值觀與長期關係建模”的研究者。他的方向不追求更快的推理速度或更長的上下文,而是讓AI更像人。其能處理數周乃至數月的任務,理解情緒、做價值權衡,並建立長期關係。▲Eric Zelikman由Zelikman創立的Humans&致力於打造“情感智能”AI,把傳統強化學習從分鐘級、小時級任務,延伸到用時數周甚至數月的現實任務,如長期決策、戰略規劃、陪伴式互動等。其目標是讓AI不再追求“一次答對”,而是追求“長期最優”,具備自我情緒建模與長期目標協調能力。儘管研究尚未商業化,也沒有成熟產品,Humans&仍在成立數月內與投資人洽談以40億美元估值融資10億美元。知情人士稱,Nvidia與AMD均有意投資,希望這類新實驗室成為下一代算力大戶。④前DeepMind 12年元老創業Reflection AI,逐夢超級智能Reflection AI的CEO Misha Laskin,DeepMind前研究科學家,主導了Gemini從初代到1.5的RLHF訓練體系和獎勵模型架構設計,負責模型與人類反饋的閉環最佳化。芝加哥大學理論物理博士+伯克利博士後,2017年創業做AI需求預測,25歲入選福布斯“30 Under 30”。CTO Ioannis Antonoglou是DeepMind 12年元老,AlphaGo、AlphaZero、MuZero核心架構設計者,直接參與策略搜尋與價值網路建構,推動強化學習在複雜棋類和決策任務中實現突破。兩位創始人聯手,帶領60人團隊大部分來自DeepMind、OpenAI,專注於高性能模型訓練、強化學習演算法最佳化與大模型架構設計。他們的目標是,將強化學習、獎勵建模和大規模生成模型緊密結合,首先打造自主編碼智能體,使其能夠在複雜程式設計任務中自我最佳化、規劃與執行,再逐步擴展到通用推理與跨領域問題解決。投資人直接投入1.3億美元,A輪估值5.55億美元,紅杉、輝達、LinkedIn聯合創始人Reid Hoffman等均在股東名單上。⑤You.com CEO雙線作戰,10億美元建AI實驗室前Salesforce首席科學家、You.com創始人、史丹佛NLP博士Richard Socher,正在籌建一家以他本人命名的新型研究所,目標直指“自動化AI研究”。同名研究所Richard Socher在籌備階段就計畫募資近10億美元。▲Richard SocherSocher的設想是把科研流程徹底機器化:建構一套能夠自動完成模型設計、實驗執行與迭代最佳化的閉環系統,讓AI能自主生成新想法、自我反思、自動驗證,從而顯著壓縮從概念提出到可復現結果之間的周期。這種理念瞄準的是“研究生產力的系統級解放”。短期內,Socher團隊的能力對藥物研發、材料科學、半導體等高實驗密度行業尤其具有吸引力。這一方向不是堆算力,而是重構科學家的工作方式。團隊強調三條核心路徑:1)自動化實驗設計與超參搜尋,減少人工反覆偵錯;2)強化實驗可復現性,並建構完善的閉環驗證體系;3)將“自動化研究”的產出標準化為可工程化模組,使其能真正應用在企業級場景中。⑥OpenAI和DeepMind大佬離職聯手,押注“AI做科學”Periodic Labs由前OpenAI後訓練研究副總裁Liam Fedus與前DeepMind資深研究員Ekin Dogus Cubuk創立,目標是打造“AI科學家”:不僅生成論文和預測,而是真正開啟“從模擬→設計→實驗→驗證”的全鏈路自動化科研流程。▲Ekin Dogus Cubuk(左)和William(Liam)Fedus(右)Periodic Labs首要研究方向聚焦於低能耗超導材料、新材料與催化劑等高壁壘、實驗密集型領域。其願景是讓AI不只是理論工具,而是能在實驗室裡自主提出假設、設計合成路線、執行物理實驗,並完成結果反饋,實現“真AI科學家”的閉環。據公開融資文件,Periodic Labs已完成首輪種子融資,金額約為3億美元,由風投機構Andreessen Horowitz (a16z)與Felicis Ventures領投。⑦史丹佛三教授做“身體化擴散智能”,專注長期決策Inception Labs是一家由三位史丹佛背景的頂尖學者聯合創立的新型AI公司:擴散模型和FlashAttention關鍵推動者Stefano Ermon、UCLA助理教授Aditya Grover、康奈爾大學助理教授Volodymyr Kuleshov。三人長期深耕生成模型、強化學習與科學計算,並擁有將前沿技術成功推向產業的履歷,為公司帶來罕見的“學術深度+商業落地”雙重優勢。公司聚焦“身體化智能”與“長期學習系統”,試圖突破傳統模型僅停留在文字或靜態資料中的侷限,讓AI置身真實世界,通過持續的物理互動積累經驗,形成可長期更新的策略與習慣。他們試圖打造“任務生命周期管理器”,讓智能體在數周甚至數月中依環境變化不斷迭代策略。在商業端,Inception Labs採用軟硬體一體路線,通過機器人與感測系統切入製造業和物流業這些需要長期適應、高頻執行的場景。團隊已推出Mercury系列擴散語言模型,其中Mercury Coder在程式設計任務上實現了數倍效率提升,為身體化智能提供高效推理引擎。⑧遊戲視訊專家專注於“時空推理”模型General Intuition由Pim de Witte聯合James Swingos、Ken Colton等核心成員創立。創始團隊彙集科研、技術基建及視訊處理領域專家,Pim此前執掌視訊平台Medal九年,帶領團隊積累海量遊戲視訊資料,其他成員深耕世界建模與策略學習前沿,兼具技術研發與產業落地經驗。General Intuition起源於視訊平台Medal,利用其每年數十億條遊戲視訊作為訓練集,專注於“時空推理”與環境感知基礎模型,讓智能體理解物理世界中的運動因果。2025年10月,公司獲得1.34億美元種子/早期融資,是2025年AI領域規模最大的早期融資之一。資金將用於擴展團隊、基礎設施及加速機器人/無人機原型驗證。其核心主張是,遊戲視訊提供了豐富的稀有成功/失敗鏡頭,適合訓練理解物體運動、碰撞與長期因果關係的模型。商業路徑從遊戲AI代理延伸至現實世界的感知控制,如搜救無人機、倉儲機器人。⑨金融圈名人下場做“數學超級智能”,可用於金融分析Harmonic的故事從一個金融圈明星開始:其聯合創始人Vlad Tenev,就是知名券商Robinhood的聯合創始人與前CEO。這一次,他從金融與演算法交易領域進入AI,引發了資本與媒體的廣泛關注。Harmonic是一家以“人類數學直覺”為起點的AI公司。它並不追求建立更大的模型、堆滿算力,而是重新設計數學推理系統:讓AI像人一樣抽象、驗證、反思,把複雜數學任務拆解成結構化步驟。公司已於2025年完成C輪融資,估值達約14.5億美元。Harmonic的技術路線是建構“數學層”的系統化推理引擎,與傳統大模型平行,而不是取代。他們面向的是科研、量化、工程與高複雜度任務,強調輸出必須可驗證、可審計、邏輯嚴謹。與當前主流AIagent趨勢相比,Harmonic的定位是提供底層高可靠性的“數學思維元件”。⑩OpenAI安全研究員創業“多智能體數字社會”前OpenAI安全研究員Eddie Zhang曾專注於多智能體系統的安全與協作機制研究。他認為未來智能不是一個超級大腦,而是一整個“AI社會”。於是他從最前沿的安全/協作研究中走出來,轉身搭建一個全新的“智能體社會平台”。其創業的公司Isara嘗試讓上千甚至上萬智能體自主分工、協作、達成治理共識,像一個有部門、有責任、有激勵機制的公司。它的AI智能體可以在不確定環境中自動分工、協作、分配“責任/信用”、共同完成諸如財報預測、企業盡調、法律檔案分析等複雜任務。從行業趨勢來看,Isara的產品與當前流行的“單體AI agent自動化”形成對比。它不只是為了替人做事,而是為了模擬“組織結構+社會機制+群體智能”。Neo Lab成為了這個時代的訊號。AI未來的發電機,正從資源密集但可能陷入路徑依賴的巨頭實驗室,重新回到那些手握新範式藍圖、極致專注的頂尖研究者手中。而資本所能做的,就是搶在最早期,給他們足夠的彈藥,去打開那些連巨頭都未曾設想的大門。 (矽基觀察Pro)
這一次,TikTok要在日本“干票大的”
為TikTok Shop量身定製的日本最大直播電商支援基地CREOK LAB已於近日正式開業。此前,TikTok Shop在世界多國取得了巨大成功,但直到今年6月30日,它才終於正式進軍日本市場。6月17日,一名顧客在日本東京一家便利店購買儲備米   新華社/法新在日本,平台經濟和電商市場發展都並不成熟,在此背景下,TikTok Shop上線能否成為催化劑,帶動日本直播電商起飛,不僅業界廣泛期待,也成為海內外媒體的關注焦點。直播電商仍屬“小眾”市場日本平台經濟的發展遠不及中國等電商大國,主要受到人手不足、快遞配送成本高、速度慢等制約。高度老齡化的人口結構,也使日本在移動消費方面發展緩慢。與中國電商無時無處不在相比,日本電商業務對各消費領域的滲透明顯不足,電商的利用形式也遠不如中國國內豐富多樣。根據日本經濟產業省的電商市場調查報告,2024年日本商品銷售領域的電商銷售總額比上年增長3.7%至15.2194兆日元(1日元約合0.05元人民幣),電商化率僅提升0.4個百分點,至9.78%。“據我們估算,2024年日本電商業務總額在扣除燃料零售業和汽車零售業銷售額後的核心零售額中的佔比僅為11.5%。”瑞銀證券高級分析師、消費品類股日本負責人風早隆弘說。日本總務省的調查資料顯示,2024年日本兩人以上家庭的網購使用率僅為55.3%。不少日本老人仍停留在電視購物階段。直播電商業務在日本是一個更加“小眾”的存在。新冠疫情期間,中國直播電商的火爆曾經讓不少日本商家摩拳擦掌,有些商家聘請中國留學生試水直播帶貨,向中國消費者推銷自己的特色產品。日本電信電話公司(NTT)2023年公佈的線上調查報告顯示,31.9%的受訪者“瞭解直播電商”;3.9%的受訪者觀看過直播;觀看過直播的54.8%的受訪者購買過商品,其中20多歲和30多歲的年輕群體購買率更高。有過購買體驗的消費者表示,直播電商銷售方式直接易懂、令人安心、能產生信賴感。調查顯示,在直播電商火爆全球的背景下,日本國內直播電商業務的市場規模從2020年的約140億日元增加至2023年的約3000億日元,3年間增長了約20倍。約20%的受訪者表示,雖從未觀看過直播,但對此很感興趣,有使用意向。因此,儘管直播電商市場整體上規模還不大,卻也蘊含著巨大發展潛力,市場有望進一步擴大。為何發展滯後與其他國家相比,日本消費者的“品牌忠誠度”通常會更高,網購時更重視“可靠性”“安全性”,重視評論,信任熟人評價,因此對“價格過低的商品”“不熟悉的支付流程”等往往態度慎重。有專家表示,日本人的這些特點使TikTok直播電商業務在初始階段可能面臨一定的心理上的障礙。日本電商諮詢公司FORCE-R執行董事本多一成認為,突破這一障礙的關鍵在於,是否有值得信賴的人氣主播以及直播視訊中是否有令人信服的產品講解。本多分析了直播電商業務迄今為止在日本未能盛行的兩大主要原因。一方面,日本缺乏在中國被稱為關鍵意見領袖(KOL)的專業主播。中國擁有大量的專業KOL,他們不僅精通商品知識,也具備強大的銷售能力,是直播電商成功的關鍵。日本國內利用視訊或圖片推廣商品的網紅雖然數量眾多,卻幾乎不存在專注商品銷售的主播,擅長即時銷售的直播人才仍屬稀缺資源。目前多數開展直播電商的日本企業傾向僱用藝人或網紅擔任主播。本多認為,主播的銷售能力與其商品知識儲備關係密切,若主播的銷售能力與商品知識儲備不足,直播就難以轉化為實際銷量,效果就難以顯現出來。當主播銷售力不足時,企業可考慮起用自有銷售人員擔任主播進行商品推廣。另一方面,日本的平台經濟發展相對滯後。中國擁有多個專屬直播電商平台,使用者已形成日常觀看的習慣。反觀日本,雖存在若干具備直播功能的服務平台,但這些平台並不專注於直播電商領域。例如,直播平台“Pococha”和“17LIVE”均限制以商品銷售為目的的內容創作,禁止引導使用者跳轉至外部電商平台的行為。直播電商平台的發展不成熟,限制了消費者通過觀看直播購買商品的機會,而培養其直播消費習慣需要經歷一個過程。TikTok Shop潛力漸顯,挑戰亦多TikTok在日本推出直播電商功能滿月之際,業界有分析認為,其“可能成為搶佔電商巨頭份額的新勢力”。據日本最大財經媒體《日本經濟新聞》報導,TikTok Shop在日本上線後,聯合利華日本、美容電器品牌雅萌、LACOSTE日本、日清食品等日用品、化妝品、電器、服裝、家具裝飾、書店等行業企業迅速入駐。推出人氣洗髮水蓓甜詩(BOTANIST)系列的I-ne公司負責人表示,TikTok已成為社交媒體行銷的重要平台,期待借此擴大品牌認知度。報導同時指出,雖然TikTok直播電商蘊藏著成長為巨大商圈的潛力,但仍有許多日本企業對加入其中猶豫不決。文章分析了TikTok Shop拓展日本市場面臨的挑戰。首先,不少企業對直播電商究竟能否開花結果仍心存疑慮,對是否要開展此業務游移不定,擔心“花半天工夫賣不了多少東西”。也有企業因擔心即興直播會引發網路事件,因此更傾向於精心策劃直播的內容,這導致直播時本應展現的現場魅力無從發揮,從而影響到銷售。其次,在人才和裝置方面,有利用TikTok直播電商業務向海外銷售商品的大型日用品製造商相關業務負責人表示,“實際試著做起來,你就會發現直播需要的裝置很多,包括攝影工作室以及照明、攝像等專用器材。此外,還需要有創意的視訊企劃、拍攝、編輯等,組建專門團隊也需要一定的時間,得做各種準備”。此外,一些日本廠商擔憂由國外企業營運的TikTok Shop在日本市場能否長期穩定地發展。一名化妝品製造商的負責人甚至擔心“警戒心很強的日本人可能不願意在中國的App上輸入自己的支付資訊”。“有望提振日本零售業活力”目前日本最為活躍的直播電商平台Qoo10,月活躍使用者數僅420多萬人,與中國直播電商平台的使用者規模相比差距顯著。億貝(eBay)日本公司行銷本部長金載敦認為,“日本直播電商滲透率遠低於中國和歐美及東南亞國家。也正因如此,未來發展空間巨大。”最新資料顯示,TikTok的日本使用者數量約為3300萬人,年輕人的利用率明顯較高。“在TikTok直播電商業務登陸日本之前,TikTok直播功能已然在日本國內掀起熱潮,大量日本網紅主播在TikTok直播上通過打賞功能賺錢。人氣主播每月創收200萬至500萬日元的情況並不少見。”日本科技諮詢公司D4DR總裁藤元健太郎指出,使用者規模是重要基礎,由於TikTok使用者規模遠超其他先行開展直播業務的平台,“TikTok直播”功能在日本市場正在爆發式增長。藤元分析說,TikTok直播電商營運模式不同於傳統的商品銷售模式,但與日本的“推活”文化和“推活”經濟存在相通之處。因此,當人氣主播推廣自己喜愛的商品或親身參與設計的“周邊”產品時,有望創造更高的銷量。“TikTok Shop有可能借助‘TikTok直播’積累的使用者基數,與日本特有的‘推活’經濟融合發展,開創出具有日本本土特色的全新直播電商形態。”藤元認為,部分日本網紅預計將轉型為直播電商的主播,“作為日本直播電商普及的突破口,TikTok Shop發展前景備受期待。”I-ne公司執行董事、首席行銷官伊藤翔哉也認為,就像在歐美和東南亞各國大受歡迎一樣,“TikTok Shop很有可能也會契合日本市場”,他對TikTok直播電商業務寄予厚望。伊藤將TikTok直播電商業務定位為公司的新銷售管道,5月就在公司直銷總部組建了專門團隊。6月30日TikTok Shop正式上線當天,I-ne公司即推出公司官方網店,並開始發佈視訊,希望搶得直播市場的先機。負責營運CREOK基地的公司首席執行官櫻井吉男表示,TikTok Shop登陸日本後發展勢頭迅猛,到8月,交易額就達到了13.5億日元。他預計到年底TikTok Shop的直播電商總交易額有望達到1100億日元。風早隆弘說,“優衣庫等零售企業目前也正在積極探索直播電商模式,在直播過程中提供即時的直接購買服務。”他認為,TikTok等平台方為消費者創造的新型購物體驗,有望帶動整個日本零售行業的活力提升。 (環球雜誌)
剛剛,OpenAI前CTO Mira Murati公司Thinking Machines Lab發文,揭開了大模型不確定性的真相
Mira Murati 的新公司終於發聲了!Thinking Machines Lab 今天正式推出了他們的研究部落格 Connectionism,第一篇文章就直接瞄準了 LLM 推理中讓人頭疼的「非確定性」問題。這家由前 OpenAI CTO(及前臨時 CEO) Mira Murati 創立的公司,在今年 7 月剛完成了約 20 億美元的種子輪融資,估值達到 120 億美元。投資方包括 Andreessen Horowitz(領投)、Nvidia、AMD、Cisco 等科技巨頭。值得注意的是:在拿到如此巨額融資之前,公司還沒發佈任何產品。LLM「不確定性」的真相這第一篇博文《擊敗大語言模型推理中的非確定性》直擊要害。如果你是演算法相關從業者,你應該有發現:同樣的輸入,LLM 有時會給出不同的輸出。即使設定了相同的隨機種子,結果還是會變化。很多人以為是 GPU 並行執行和浮點數運算的鍋。但 Thinking Machines 的研究發現:真正的罪魁禍首是批次不變性缺失。什麼意思?當你向 LLM 傳送請求時,伺服器會根據當前負載情況,把你的請求和其他請求打包成不同大小的批次處理。問題就出在這裡——相同的輸入在不同批次大小下會產生不同的結果。這就像你去餐廳點菜,你點的菜味道竟然會因為廚房同時在做幾道菜而改變。聽起來很荒謬?但這就是現在 LLM 推理系統的現狀。浮點數的「蝴蝶效應」根本原因在於浮點數的非結合性:(a+b)+c ≠ a+(b+c)。不同的加法順序會產生微小差異,這種差異在深度神經網路中層層放大。具體到 LLM 推理中,矩陣乘法、RMSNorm、注意力機制等核心操作,在不同批次大小下會採用不同的約簡策略。你的請求結果竟然依賴於伺服器同時在處理多少其他請求——這太魔幻了。讓核心「批次不變」Thinking Machines 提出的解決方案很直接:實現批次不變的核心。RMSNorm:採用資料平行策略,避免分割約簡。矩陣乘法:使用固定核心配置,避免 Split-K 策略。注意力機制:採用固定分割大小策略,確保約簡順序一致。實驗結果可謂是令人驚訝:在 1000 次採樣中,原本會產生 80 個不同的完成結果。但在啟用批次不變核心後,所有結果完全一致。當然,這種確定性是有代價的。未最佳化版本性能下降約 2 倍,但經過改進後性能損失已經可以接受。Connectionism:不只是一個名字有意思的是,部落格名「Connectionism」是 1980 年代研究神經網路與生物大腦相似性的 AI 子領域名稱。Mira Murati(@miramurati)表示:Thinking Machines 使命的重要部分是提高人們對 AI 的科學理解,並與更廣泛的研究社區合作。今天推出 Connectionism 來分享我們的一些科學見解。聯合創始人 Lilian Weng(@lilianweng)補充了一個有趣的歷史細節:除了 Connectionism 與 AI 領域早期的聯絡,以及強調神經網路與人類大腦的相似性這個有趣的事實外,第一代 Thinking Machines 的旗艦產品就叫 Connection Machine。豪華團隊陣容除了 Mira Murati,核心團隊還包括 OpenAI 聯合創始人 John Schulman、前研究 VP Barret Zoph、前 AI 安全與機器人 VP Lilian Weng 等人。而 Andrew Tulloch 甚至拒絕了 Zuckerberg 15 億美元回 Meta 的邀請,選擇繼續與 Murati 一起創業。團隊約 30 人,其中三分之二來自 OpenAI。技術崗位年薪高達 45-50 萬美元。Bob McGrew 和 Alec Radford 等 OpenAI 核心研究者擔任顧問。Thomas Ip(@_thomasip)精闢總結道:LLM 推理非確定性不只是浮點數非結合性或 GPU 並行執行,核心罪魁禍首是批次方差,伺服器負載不可預測地改變了數值計算。批次不變核心解鎖了真正的可重複性,終於讓強化學習『線上策略』變得可行。這項工作的意義不僅在於解決了一個技術難題,更重要的是為 LLM 的可重複性和可靠性提供了科學方法。尤其是對強化學習等對一致性要求極高的應用場景,該文具有重要價值。科學確實在分享中變得更好。 (AGI Hunt)
《全台首座ESG創新基地萬華啟用 打造永續城市新典範》臺北市政府產業發展局攜手全球最大社會創新網絡Impact Hub Taipei,於7月31日在萬華區福星社會住宅正式啟用「ESG Co:lab」創新基地。這座全台首個以ESG(環境、社會、治理)為核心的共創空間,不僅是市府推動「永續臺北」政策的具體實踐,更將成為10月舉辦的2025社會企業世界論壇(SEWF25)重要前哨站。ESG Co:lab展現循環經濟精神,空間裝潢50%材質來自舊家具回收與環保建材,完美詮釋永續設計理念。基地結合公有空間活化、社區參與、企業協作與社創實踐四大面向,打破傳統行政邊界,成為推動永續行動的實驗場域。開幕典禮特別採用廢棄布料製作剪綵緞帶,儀式後轉化為實用提袋,象徵循環經濟的創新落實。市府產發局長陳俊安表示:「ESG Co:lab不僅是實體空間,更是促進政府、企業與公民社會協作對話的重要平台,展現臺北市開放政府精神。」多家企業積極響應永續行動,包括Nespresso提供咖啡膠囊回收方案、恆隆行推出不完美家電租賃計畫、ViewSonic協助設置低碳互動顯示設備等,體現ESG實踐的多元樣貌。Impact Hub Taipei共同創辦人陳昱築指出,今年適逢該組織成立十週年,SEWF25將吸引來自60多國、超過1,200名國際社會創新領袖來訪。ESG Co:lab將作為論壇延伸交流場域,讓世界看見台灣社創扎根成果。未來基地將持續舉辦ESG小聚、社區共學、環境教育等活動,讓永續理念融入居民生活,深化城市治理與全民參與,為台北邁向永續城市樹立新典範。
20億美元!輝達AMD聯手投出史上最大種子輪
前OpenAI CTO創業,2/3團隊來自OpenAI,北大學霸也加盟。智東西7月16日消息,今日,前OpenAI首席技術官Mira Murati創辦的AI公司Thinking Machines Lab(簡稱TML)宣佈完成20億美元種子輪融資,由a16z領投,NVIDIA、Accel、ServiceNow、CISCO、AMD、Jane Street等參投。這是史上最大規模的種子輪融資,而TML成立於2025年2月,至今僅5個月。成立之初,OpenAI聯合創始人John Schulman等二十餘位頂級AI研究員便加入了TML,使其迅速成為行業焦點。01. 企業定製AI + 消費級產品雙線佈局雲服務巨頭爭相競逐TML的核心業務圍繞“企業定製型AI”和“通用消費級產品”兩條路徑展開,Murati對投資人尤為強調前者。多位與Murati接觸過的投資人透露,TML主攻方向之一是企業AI定製。該團隊正基於強化學習(Reinforcement Learning)建構模型,讓AI圍繞客戶的核心KPI(如營收、利潤等)進行最佳化,直接服務於業務增長目標。這種“以業務指標為導向”的強化學習思路,被稱為“RL for business”,尤其適用於客服、投行、零售等垂直行業,具備較強的商業轉化和客戶價值提升潛力。在基礎模型選擇上,TML計畫以開源體係為起點。雖然開源模型在能力上略遜於閉源系統如GPT-4,但Murati認為性能差距正在縮小,如近期DeepSeek的突破。儘管尚無明確證據表明TML使用了DeepSeek,但其開源+定製的策略已基本成形。除了企業服務,TML也在孵化通用型消費級AI產品,目前尚未公佈具體形態。但據知情人士透露,TML曾內部討論開發一款與ChatGPT競爭的對話型助手。若該方向落地,TML將直接切入OpenAI的核心賽道。在模型建構路徑上,TML採用“模型層融合”(model merging)方式,將多個已有模型的關鍵處理層拼接為新模型,跳過從零開始訓練,顯著提升研發效率。據悉,其模型訓練在Google雲租用的輝達GPU伺服器上進行,也正因此成為Google潛在投資對象。Google此前已通過“雲資源換股權”的方式支援了Anthropic、Safe Superintelligence、Character.ai等初創AI公司。與此同時,亞馬遜CEO Andy Jassy也於4月與Murati在舊金山會面,表達希望TML能成為AWS雲生態一部分的意願。02. 北大學霸當聯創OpenAI元老級班底齊聚TMLTML的另一大看點在於人才結構。Murati不僅吸引了資本青睞,也聚攏了OpenAI乃至AI領域的核心人才。以下為目前已知的部分核心成員名單:(1)Mira Murati:TML創始人兼CEO,前OpenAI首席技術官(CTO),GPT-4、ChatGPT和DALL·E核心負責人。曾任特斯拉Model X及Autopilot系統項目負責人,後在Leap Motion主導增強現實方向的人機互動產品。▲Mira Murati(左)和Sam Altman(右)。(2)John Schulman:OpenAI聯合創始人,前強化學習團隊負責人,現擔任TML的聯合創始人兼首席技術官(CTO)。Meta創始人兼CEO祖克柏曾試圖挖走Schulman,但未能成功。▲UC Berkeley EECS講座中,John Schulman在講台上演講。(3)Barret Zoph:前OpenAI研究副總裁,深度學習最佳化領域專家。(4)Luke Metz:前OpenAI研究員,Transformer架構與元學習方向活躍開發者。(5)翁荔:北大校友,前OpenAI安全團隊副總裁,現為TML聯合創始人,為目前公開團隊中已知的華人核心成員。此外,TML還邀請了兩位OpenAI早期技術元老擔任顧問:(6)Alec Radford:GPT-1主要作者之一,Transformer架構推動者;(7)Bob McGrew:前OpenAI研究主管,曾長期負責公司研究路線的統籌管理。據內部消息,TML目前規模約30人,三分之二來自OpenAI,整體班底與DeepMind早期高度相似,已被多家科技巨頭視為潛在併購對象。有消息稱,蘋果和Meta已與Murati進行接觸,探討投資或收購的可能性,但尚未進入實質階段。在外界看來,TML的成長經歷正重演十餘年前DeepMind的故事。當時,DeepMind在倫敦集結了大批機器學習博士,吸引Google與Facebook爭相競購。最終Google以超5億美元的價格將DeepMind收入麾下,由此建構起今日AI版圖的核心。而DeepMind現任CEO Demis Hassabis,正是GoogleAI體系的掌舵者。03. 結語:面對競品TML如何“攪局”?2025年AI投融資依舊火熱,僅上半年,美國市場就出現至少25筆超億美元融資,重點集中在大模型、AI程式設計、醫療和法律等熱門賽道。TML所選擇的“企業AI定製+消費級AI產品”雙線模式,與當前市場熱點基本對齊。不過,定製化AI並非新鮮事物,Scale AI、Turing等初創公司也在押注“AI+諮詢”,為企業量身定製模型,但普遍面臨規模化難題。不同於單一的定製服務,TML或許能通過通用型AI產品,在定製化和規模化之間找到突破口。目前,TML尚未對外發佈正式產品,但其融資速度、團隊構成與戰略佈局,已使其成為最受矚目的AI創業公司之一。未來其產品落地路徑與技術轉化能力,將成為評判其是否能“挑戰OpenAI”的關鍵。 (智東西)
手機大佬,入局機器人市場
連續四年中國手機的銷量王vivo,官宣進軍家庭機器人市場。3月25日,在2025 博鰲亞洲論壇上,vivo 執行副總裁、首席營運官、vivo 中央研究院院長胡柏山在演講中宣佈,vivo成立了機器人Lab。和話題度更高的人形機器人不同,vivo瞄準的是個人和家庭場景的消費級市場。未來將利用vivo在AI大模型與影像領域十年的技術積累,疊加vivo自研混合現實頭顯積累的即時空間計算能力,聚焦vivo機器人的“大腦”和“眼睛”。作為“飯前甜點”,vivo率先秀出了當前階段的技術成果:vivo Vision混合現實頭顯。這是自vivo 2023 年年底官宣即將推出混合現實頭顯裝置後拿出的首款產品,外觀科技感十足,採用了外掛電池設計,大機率也是目前主流的VST方案。這是一枚投向市場的深水炸彈。在頭部品牌都在尋找“第二增長點”的大環境中,vivo選擇了家庭機器人而非新能源車。政策扶持、市場熱炒,“造車”彷彿成為了政治正確,不僅科技公司染指,連家電、航空公司都要來摻一腳。而機器人賽道,多少帶點“未來”屬性。雖然機器人題材也是最近半年的大熱,僅2024年11月單月人形機器人指數漲幅超過56%,多支相關ETF基金漲幅超過40%,熱潮還帶動了減速器、伺服系統、感測器等核心零部件相關個股瘋漲,但“未來”這個詞就意味著,它沒法立即兌現價值。是什麼讓vivo堅定地選擇家庭機器人賽道?沒有如大眾的希冀去造車,vivo是不想做、不敢做還是做不了?我們從蛛絲馬跡中,尋找答案。藍廠更愛機器人不怪大家訝異,在外界看來,vivo的確有一定的造車積累。和其他科技公司一樣,vivo在車機系統、智能座艙領域早有建樹。vivo的Jovi InCar車聯網品牌和絕大部分的新能源車企都達成了合作,自動駕駛領域則擁有數量過千的專利。vivo多年的供應鏈經驗、所展現出的全球供應鏈管理能力,可以為造車提供支援,特別是智能座艙和車載電子裝置的開發。同為手機品牌的友商入局汽車行業表現不錯,也為支援vivo造車提供了案例參考。作為2021年至2024年中國區智慧型手機的銷量王,vivo在全球60多個國家和地區擁有超過5億使用者,又不缺技術不差錢,被大家看好是人之常情。但並不意味著每一個風口,都需要為它奮不顧身。進入2025年,行業的共識是,新能源車的“大逃殺”開始縮圈了。目前,中國新能源車市場活躍的品牌超過了100家,馬太效應明顯。行業內主流的價格戰,極大壓縮了邊緣車企的單車利潤。像比亞迪這樣的頭部品牌尚可以通過規模效應維持盈利,其他品牌的車只怕只會落得“降無可降”的地步。疊加智駕大戰的激烈競爭、牌照審批、重資產投入等關鍵問題,新能源車對新品牌而言是一個有著“地獄難度”的市場。再說了,目前市場上在售車型超過 400款,幾乎每一個價格段、每一個車型都有超過10款以上的車型覆蓋,消費者真的需要更多選擇嗎?vivo就算真的入局了新能源車賽道,也未見得能為消費者提供足以改變生活的變化。而資源是有限的,將有限的資源投入到能真正發揮影響的道路上,顯然是更聰明的做法。相反,機器人市場,特別是家庭機器人市場潛力巨大,一片藍海, 2025博鰲論壇上,胡柏山稱“機器人會應用在家庭服務、養老、醫療健康、教育等多個領域,既能幹好活,還能很懂你”,點出了vivo機器人未來核心使用場景:從產線走向家庭,最終成為每個人生活的伴侶。這種設定,來自家庭養護領域未來巨大的需求。截至2023年底,全國60歲及以上老年人口達2.97億,佔總人口的21.1%;65歲及以上人口2.17億,佔比15.4%,標誌著中國已進入中度老齡化社會。衛健委曾預計,到2035年,60歲及以上人口將突破4億,佔比超30%,進入重度老齡化社會;2050年前後,老年人口峰值將達4.87億,佔總人口的34.9%。而按照設計,家庭機器人主要面向養老、育兒等關乎社會民生的領域,除了提供常規的物品傳送、家務協助、健康監測、危險報警等功能外,還有著提供情緒價值、心靈撫慰的願景。《“十四五”機器人產業發展規劃》也明確家庭服務機器人為重點方向,業內預計到2035年,家庭機器人市場規模或突破千億,成為家庭標配。vivo選擇的家庭機器人之路,既是有迎合未來社會發展趨勢的正確性,也有為消費者提供實現更美好生活工具的必要性。而想要打造多功能的家庭機器人,AI又是關鍵詞。當前機器人產品的問題集中在環境感知和決策能力不足、運動精度偏低和AI的理解能力有限,和機器人搭載的端側大模型、環境感知技術與伺服電機、減速器、六維力感測器等關鍵部件都有密切關係。正好,vivo在AI互動和環境感知方面頗有建樹。vivo選擇不造車而是進軍家庭機器人,就是為了在自己的優勢領域“開花結果”。無縫銜接的技術力對於“為什麼選擇機器人”而不是造車這個問題,vivo自己的答案頗有趣的。博鰲論壇中,胡柏山稱“機器人是手機行業的未來”。他的理由是,手機作為最前沿技術的試驗田,實現了多項新技術的首次商業應用,全新製程的晶片、5G、AI、虛擬現實等等。而未來,在高新技術也會先在手機上孵化、成熟,最終孕育出能夠我們理想中的機器人。因此,vivo選擇進軍機器人也有手機技能點能順勢繼承的考慮。vivo擅長的AI和移動影像,就被看作是孕育vivo家庭機器人的溫床。vivo是中國最早一批擁抱AI的廠商,早在2018年就成了AI全球研究院,累計投入了超百億元,組建了超千人的AI團隊,覆蓋演算法、晶片、通訊等領域。vivo最得意的AI產品藍心小V,它基於2023年推出的“藍心大模型矩陣”,涵蓋10億至1750億參數規模。vivo手機很早就在端側部署了30億參數的藍心端側大模型,積累了非常豐富的“端雲協同”經驗,可以為日後家庭機器人訓練、部署端側大模型提供技術支援。同時,每年穩定千萬等級的銷量也能為vivo在模型訓練、語料供給方面提供巨大優勢。未來作為機器人大腦的AI Agent必然需要前所未有的海量資料進行訓練,vivo現在就能打好基礎。此外,AI對vivo的影響已經從獨立的App拓展到整個系統,手機影像也得到來自AI的強力支援,目前已形成“光學硬體+自研晶片+演算法矩陣+生態協同”的全鏈路技術體系。當前vivo的影像技術就是強大的環境感知系統。將影像技術復用到家庭機器人上,vivo就能為機器人打造強力的“眼睛”。比如vivo自研的VCS仿生光譜技術、超感人像系統、蒼穹夜景系統等影像增強功能,在未來能發揮影像系統高速對焦、極強夜拍的優勢,最終能提高機器人在家庭的各個場景對人物的捕捉能力和環境感知能力。藍圖影像晶片、異構計算架構等則能在機器人處理圖像資訊鏈路提供幫助。目前最新的藍圖影像晶片V3+可以實現與CPU毫秒級的資料協同,功耗降低80%的同時性能提升35%。未來晶片繼續進化升級,可以降低家庭機器人在環境識別中的功耗,提高資訊處理效率。上面舉例的僅是vivo在AI、影像領域技術的冰山一角。去年vivo還展出了6G原型機,6G網路擁有更高上限的資料吞吐量、更低的延遲、更穩定的訊號。如果說手機是家庭家庭機器人的橋樑,那麼6G就可以成為連結橋樑的強力鋼纜。毫秒級的響應速度,讓能夠家務協助、健康監測甚至情感陪伴的家庭機器人成為自己在千里之外的“遠端助手”,將手機和機器人的使用場景緊密相連。相比造車,家庭機器人賽道能復用的技術更多,切入更加絲滑,讓vivo的技術亮點盡情揮灑,也擁有更加廣闊的想像空間。藍廠不自己“造”機器人儘管vivo將會提供大量技術用於機器人研發、製造,但嚴格來說,這次vivo不“造”機器人。胡柏山在博鰲論壇中並沒有提到除了深耕機器人“大腦和眼睛”之外的消息。一貫以來vivo都不強求實現整個供應鏈上下游環節的“全掌控”,這是對供應鏈的信任,也是促進行業繁榮的哲學。vivo以技術入局,只做自己擅長的部分,將機器製造交給最熟悉的供應鏈,不僅自己收穫了輕資產的好處,也能帶動供應鏈的共同繁榮。這一招,是vivo在手機領域的“產業共榮”的自我復刻。vivo素來對待供應鏈都非常厚道。多個媒體報導,vivo的帳期基本都在2個月之內,大部分供應商30到45天就能收到款項,比以爽快聞名、帳期僅有90天的特斯拉,還要縮短一半以上。當前機器人產業的硬體供應商只有45.17萬家,相比手機、汽車等成熟的產業還有巨大的增長潛力。手機巨頭攜資金、技術入局,吸引更多的企業參與到機器人製造的生成環節中,可以降低零部件採購的成本;vivo以技術入局不需要在硬體生產中投入龐大的試錯成本,可以進一步降低成本,降低家庭機器人走入千家萬戶的成本。10萬、50萬甚至100萬人民幣一台的家庭機器人,在市場上完全沒有存在的價值。只有帶動產業鏈企業共同繁榮,做大蛋糕,才能真正讓家庭機器人普及。屆時,vivo的家庭機器人將會成為使用者生態中的強大拼圖,就像vivo所願景的:機器人將會成為聯接物理世界和數字世界的橋樑,讓更多的使用者體驗到前沿科技帶來的便利生活。在手機時代,vivo造出了不少激動人心的好產品。不僅是AI和影像領域所取得的亮眼表現,還有無障礙功能、無網通訊和藍海電池等一系列技術、硬體,幫助冒險家、探險家、科研人員,甚至是普通人上天下海,將“人文”和“科技”結合到一起。家庭機器人賽道也有突出的“人文+科技”屬性,它的初心和歸屬,都是讓普通人過得更好。胡柏山說:“科技的高度,終須回歸人的尺度”,似乎已經點明了vivo進軍機器人的主旨:以人為本,以科技對人賦能。未來還有多遠也許大家對vivo進軍機器人賽道而非造車感到疑慮,在於機圈造車有成功的先例,但家庭機器人尚無。人天生不相信不確定的東西。不過看來vivo很相信,甚至是堅信。目前,vivo正開出百萬年薪招聘精英,準備在全新賽道大“鬧”一場。進入手機行業的三十多年來,vivo從最開始的主打輕薄,到後來的音樂手機,再到現在的攝影領先,他們緊跟消費者的需求,不害怕變化,總能取得成功。這次進軍家庭機器人賽道,不僅是面對藍海市場的提前部署,還是vivo對AI未來的一次探索。那怕已經擁有能聽懂人話的藍心小V、能理解使用者意圖打造互動“蟲洞”的原子島,大家距離我們想像中的AI還有一段距離。除了大模型自身的水平問題外,還因為AI被“困”在了小小的手機裡。而家庭機器人擁有更大的體積,理論上更好的散熱條件,更高算力的晶片。也許未來五年,輝達GB300性能的計算晶片,也能從容地在家庭機器人中飛速運算。說不定,vivo只想知道在一個體積、散熱、性能不受限制的載體裡,自己的AI能飛多高、飛多遠。在長期主義的“種因哲學”指導下,vivo向著可能的未來大步進發。 (金角財經)