#位元組
抖音張一鳴又出爆款,已經手握多張王炸
張一鳴:你對事情的認知越深刻,你就越有競爭力。背靠抖音爆款頻出字節系應用霸榜App Store最近,蘋果App Store中國區免費榜上演了一場罕見的“字節霸榜”。在榜單前五名中,三款來自字節跳動——豆包、紅果短劇、汽水音樂。同時,抖音商城和星繪AI也躋身前十。字節系五款應用同時登榜,強勢表現展示了字節跳動作為“爆款App工廠”的強大實力。圖源:App Store儘管後續排名有所浮動,但是榜單中的部分應用已經難掩“爆款相”,比如普通使用者還比較面生的星繪AI。據DataEye研究院結合ADX行業版、點點資料發佈的8月全球AI產品月度觀察報告,字節跳動旗下的AI圖片生成應用“星繪”以454.4%的下載環比漲幅位列漲幅第一,以466萬的下載量位居大陸市場蘋果端AI應用下載榜第二。圖源:DateEye據公開資料顯示,星繪是由字節跳動旗下Flow部門推出的一款AI相機類應用,專注於創作AI人像,擁有AI分身、AI證件照、趣味變寶寶、照片動起來、視訊換裝等功能,旨在為使用者提供低門檻、創意十足的AI繪畫和寫真生成體驗。其不僅與即夢AI、豆包共同組成字節C端AI應用的“三駕馬車”,更成為抖音AI應用矩陣中不可或缺的一部分。而對於近期星繪下載量的大幅提升,DataEye研究院認為,其主打功能“分身寫真”升級至2.0版本或是主要原因。核心功能的效果更新,有效地帶動了產品吸引力的增長。圖源:DateEye星繪的迅猛增長並非偶然,這背後正體現了字節跳動對其AI業務資源整合與戰略聚焦的持續加碼。2025年4月,字節對AI產品部門Flow進行了重要調整,將社交陪伴類AI產品“貓箱”更換負責人,原星繪產品負責人西原接任,同時星繪團隊併入豆包,由豆包App負責人陸游統一管理。Flow部門由朱駿帶隊,旗下涵蓋豆包、貓箱、星繪、豆包愛學、Gauthmath等多款產品。資源向核心產品集中,表明字節的AI戰略從廣泛播種轉向重點培育。值得注意的是,星繪和即夢都使用Seed研發團隊提供的基座模型,但在產品功能和使用者體驗上存在差異。這種內部競爭體現了字節跳動一貫奉行的策略,即在多個細分領域同時佈局類似產品,通過市場選擇優勝者。也許正是因為這樣的戰略,字節跳動才擁有持續打造爆款應用的系統能力。同時,字節也擅長將其核心產品的成功經驗複製,即夢AI被比喻為“初代的抖音”,星繪則是“初代的剪映”。相較於還在增長中的星繪,字節旗下的汽水音樂和紅果短劇則已經有了突出的市場表現。根據QuestMobile資料顯示,2025年6月汽水音樂的月活使用者達到了9922.33萬,即將破億,與去年同期相比增長了95.21%。圖源:QuestMobile紅果短劇表現也極為突出。自2023年8月上線,紅果短劇獨立APP經歷了驚人的增長曲線。QuestMobile最新資料顯示,截至2025年6月,紅果免費短劇的使用者規模同比增長率高達179.0%,月活使用者達2.1億,超越優酷視訊的月活使用者規模2.006億。同時,這也是短劇平台的月活首次超越長視訊平台。但做到這個資料,紅果只用了兩年。除此之外,字節跳動不同產品之間的生態協同效應也十分明顯。抖音成為汽水音樂和紅果短劇的重要引流入口。QuestMobile資料顯示,截至今年6月,汽水音樂82.1%的流量來源於抖音App,而紅果免費短劇的抖音流量來源佔比更是達到了88.3%。圖源:QuestMobile這種高度依賴抖音的流量結構,凸顯了字節跳動獨特的生態協同戰略——通過抖音龐大的流量和成熟的推薦機制,精準識別並引導使用者至垂直應用,完成從內容消費到深度使用的閉環。例如,使用者在抖音刷到短影片背景音樂時可一鍵跳轉汽水音樂收聽全曲,刷到短劇片段時也可絲滑進入紅果免費短劇繼續追更。這種無縫銜接的體驗,不僅極大降低了新應用的獲客成本,也提高了使用者轉化與留存效率。這種生態協同成為字節系產品快速搶佔市場份額的關鍵路徑,也為字節跳動建構了難以踰越的競爭壁壘。抖音電商大步向前憑藉著字節系應用在流量獲取上所向披靡的能力,抖音電商也正在急速擴張。資料顯示,抖音電商GMV從2023年的2.54兆元增長到了2024年的3.43兆元。據抖音電商業務負責人康澤宇在2月的字節會議上透露,其市場份額已衝到行業第三。內容+電商,一直是抖音電商的驅動模式,其通過短影片和直播等內容形式激發使用者購買慾望,再通過完善的交易系統完成轉化。2025年618期間,抖音商城成交額同比增長77%,236個品牌直播成交破億,超53萬電商作者成交額同比翻倍,表明平台正在成功培養使用者的主動購物心智。此外,平台還通過一系列扶持政策助力商家成長。自2025年開始,抖音電商推出九大商家扶持政策,包括商品卡免傭、返還推廣費、降低運費險和保證金等。2025年上半年,這些政策已累計為商家節省經營成本超140億元。618期間,平台更投入億級現金補貼和千億級流量資源,支援商家業務增長。圖源:抖音同時,抖音電商的創新之處在於其對傳統電商人貨場關係的重構。平台逐漸從依賴達人直播轉向扶持店播模式。據虎嗅統計,2021年抖音大盤流量中52%為店播,48%為達播;2022年57%為店播;2023年超過60%為店播;2024年抖音電商GMV大盤中超過70%為貨架場景和店播,頭部達人貢獻佔大盤已降至9%。圖源:虎嗅同時,抖音電商積極佈局即時零售領域,推出"小時達"和"次日達"等消費場景。雖然自建物流體系尚未成型,但平台通過與傳統物流企業建立深度合作關係,打造"當日達""次日達"的消費場景,逐步推進"即買即到"消費閉環的建設。儘管取得顯著成功,抖音電商仍然面臨著多重發展困境。首當其衝的是物流短板問題。想要實現真正意義上的即時零售,需要完善的倉儲網路、高效的配送體系以及先進的物流技術,而這些正是抖音電商目前的薄弱環節。其次,商家面臨著盈利壓力。雖然平台GM持續增長,但許多商家發現儘管銷售額在增長,利潤率卻在不斷下滑。流量成本不斷攀升,商家所需支付給達人和平台的費用激增,導致盈利能力持續承壓。此外,抖音電商還面臨著內容生態與商業化的平衡難題。過度商業化可能影響使用者體驗,導致內容質量下降;而過於克制又難以滿足業績增長需求。平台需要精心營運和持續調整,才能在商業化和使用者體驗間找到最佳平衡點。背靠月活10億的抖音,抖音電商的商業化道路證明內容與電商結合的巨大潛力。但其未來發展仍需突破現有困境,建構更加健康的電商生態,才能真正實現可持續發展。 (電商之家)
千台機器人將進廠螞蟻、位元組重金押注
成立僅三年的星塵智能(深圳)有限公司背後,站著一串重量級投資方:螞蟻集團、雲啟資本、道彤資本,以及一家與原字節跳動集團淵源頗深的基金——錦秋基金。在具身智慧賽道上,少見的「千台級大單」出現了。9月2日,星塵智能(深圳)有限公司宣布與仙工智能達成策略合作,計畫未來兩年內向工業製造、倉儲物流等場景分階段部署數千台AI機器人。這一數字在當前市場中較少——大多數同行僅限於數十台、百台的小批量訂單。這家成立僅三年的公司背後,站著一串重量級投資方:螞蟻集團、雲啟資本、道彤資本,以及一家與原字節跳動集團淵源頗深的基金——錦秋基金。錦秋基金由原字節跳動集團財務投資部負責人楊潔創立,核心團隊多來自過去字節跳動集團投資條線,基金名稱取自原字節跳動集團的第一個辦公室「錦秋家園」。該基金在過去兩年內持續重倉具身智慧賽道,先是領投宇樹科技C輪,如今又押注星塵智能。目前,星塵智能已完成數億元A輪及A+輪融資。其創辦人兼CEO來傑在人工智慧與機器人領域深耕17年,曾是騰訊機器人實驗室首位員工與核心架構師。星塵智能聯合創辦人兼CFO方科在接受《經濟觀察報》採訪時稱,這些機器人將逐步承擔生產線上的物料配送、周轉箱搬運、上下料、空箱回收等關鍵任務。那些枯燥、重複甚至存在安全隱患的工作環節將逐步交給機器人處理。他認為:“機器人必須盡快進入真實應用場景。千台級部署絕不是一筆市場訂單,更是數據回流、演算法持續優化、機器人本體迭代升級的重要起點。”千台大考從手工組裝到規模化量產從產業現狀來看,絕大多數企業的人形機器人部署仍停留在數十台、百台的試點階段,而千台訂單是從實驗室產品向工業化量產的跨越。深圳人工智慧產業協會預測,2025年,中國人形機器人出貨量可望超過2萬台。截至9月,今年官方宣布獲得千台級訂單的企業只有宇樹科技、智元機器人、松延動力等少數頭部企業。星塵智慧躋身“千台俱樂部”,一定程度說明其技術和產品的成熟度。目前,星塵智能的科研版機器人S1單台售價約50萬元,包含遙操作平台及軟體開發工具包(SDK)。此訂單的交付機型為S1,會針對場景進行調整。2024年發表的Astribot S1,是星塵智慧目前的代表性產品。在公開展示中,這款機器人已能完成煮飯泡茶、熨衣清掃、奏樂跳舞、競技疊杯等多類複雜任務,產品在海內外高校、企業、資料中心等多個場景投入使用。方科告訴經濟觀察報,該訂單將於今年第四季度啟動交付,首批應用場景將集中在工業製造、倉儲與物流環節,後續也計劃借助仙工智能的客戶網絡拓展至計算機通信消費電子(3C)、新能源、半導體、工程機械、生物醫藥等行業。要完成千台交付,星塵智慧面臨的首要挑戰是生產模式的轉變。人形機器人製造仍主要依賴手工裝配,千台級訂單要求企業必須建立標準化的生產系統。為此,星塵智能在過去半年內對供應鏈系統進行了重構。在產品設計上,他們採取「易用性優先」原則,開發了適配普通用戶的遙操作系統,並預設模組化SDK接口,方便後續客戶進行功能擴展與定制開發。在機器人本體傳動方案上,星塵智能選擇了相對小眾但更接近人體仿生學的繩索驅動傳動系統。與傳統剛性馬達驅動不同,此方案模仿人類肌肉的收縮與舒張原理,能夠實現更快的反應速度、更精細的操作靈活性和更安全的人機互動性能。這項技術方案在複雜任務中已得到驗證。例如,在長序列任務(如泡茶、製作咖啡)、高動態操作(如競技疊杯、投籃)以及高精度力控任務(如演奏揚琴)中都展現出卓越的靈活性與執行能力。不過,繩索驅動技術路線也伴隨著不小的工程挑戰。星塵智慧團隊引進了結合剛性和柔性材料的力學建模技術,並對傳動機制與製造流程進行持續優化,以應對摩擦損耗、繩索張力精確控制及系統整合等技術難題。方科稱,目前星塵智慧的機器人產品已通過24小時連續運行測試,在多場景下可穩定工作3.2年至6.2年,並支援模組化零件更換。面向工業應用的新一代產品正在研發中,預計今年下半年發布,並將在成本控制方面進一步優化。產業協同與仙工智能深度合作星塵智能與仙工智能的這項合作,不僅是簡單的採購訂單,更是產業協同的實驗。仙工智慧成立於2020年,總部位於上海,現已發展為全球領先的機器人控制器供應商。其招股書引述灼識諮詢的數據顯示,仙工智能在2024年以23.6%的市佔率位居全球首位,連續兩年蟬聯全球出貨量冠軍。其客戶規模從2022年的380家躍升至2024年的832家,業務足跡遍及65個國家和地區,服務領域涵蓋3C電子、汽車製造等20多個細分行業。透過仙工智慧的產業生態網絡,星塵智慧的人形機器人將獲得快速進入多元工業場景的機會。從商業角度來看,這項合作也反映了雙方對新興技術商業模式的押注。 2025年5月,仙工智能首次向港交所遞交招股書,並計畫在香港主機板以18C章節模式上市。招股書數據顯示,仙工智能2024年營收達3.4億元,毛利率接近46%,研發投入佔營收比重超過20%。儘管維持了35.7%的年營收複合成長率,營收從2022年的1.8億元提升至2024年的3.4億元,毛利率也穩定在45%以上,但仙工智能仍未獲利。 2022年至2024年,仙工智慧淨虧損分別為0.3億元、0.5億元及0.4億元,其商業化路徑仍在優化中。方科稱,仙工智能等合作夥伴對此合作的期待是多維度的:既有對即期降本增效的現實需求,也有對長期演算法迭代與泛化能力提升的戰略考量。這次合作的核心不只是簡單的硬體對接,而是和星塵智慧技術體系的深度融合——機器人本體、遙操作資料擷取平台、AI演算法模型構成的完整解決方案。他認為,星塵智慧的遙控系統是一個容易被外界忽視,但實際上極為關鍵的核心能力。遙操作技術不僅是訓練AI模型的高品質資料源頭,更是在實際交付場景中處理突發異常事件、確保服務連續性和穩定性的重要技術保障。三階段遙操作戰略當前人形機器人產業的技術路徑分化明顯。以特斯拉為代表的純AI路線,致力於透過大模型實現端到端的自主決策;以波士頓動力為代表的傳統路徑,專注於機械本體的動力學優化;而以Figure、1X等為代表的新興企業,則探索AI與人機協作的混合模式。在這一背景下,遙操作技術正成為業界關注的焦點。有別於早期簡單的遠端控制概念,現代遙操作系統已演進為集資料擷取、AI訓練、即時介入於一體的綜合技術平台。這條技術路徑的核心邏輯在於:透過人機協作彌補當前AI在複雜場景下的能力邊界,同時為未來的完全自主化累積訓練資料。依照星塵智慧的技術演進規劃,遙操作系統將在三個關鍵階段發揮核心作用:第一階段:近程遙操資料收集期,透過VR頭顯、力回饋設備等交互裝備,收集高品質的多模態異構數據,為AI模型訓練提供豐富的學習樣本。此階段的重點在於建立完備的資料基礎,涵蓋各類工業場景下的操作模式、環境變數和任務序列。第二階段:AI+遠端遙操協作部署期,AI系統主導處理標準化、重複性任務,遙操作系統則專門涵蓋邊緣案例(corner case)和異常情況,形成「AI+人工」的協同作業模式。這種分工機制既確保了交付的穩定性,也持續優化了AI模型的泛化能力,驅動資料飛輪、形成良性循環。第三階段:遠端遙操兜底期,即便在AI實現高度泛化之後,遙操作仍將作為長期的技術保障機制存在,類似於自動駕駛系統中的「遠端安全員」角色,在極端複雜場景下提供最後一道安全屏障,確保服務的連續性和可靠性。方科稱,這套遙作業系統既是星塵智慧產品技術架構的核心組成部分,也是長期的商業交付策略。這份千台訂單是驗證整個機器人產業鏈能否真正跑通的關鍵起點。(經濟觀察報)
國產大模型「五強爭霸」,決戰AGI!
【新智元導讀】中國基礎大模型市場,徹底變天了!如今牌桌上的玩家已經變成了「基模五強」——字節、阿里、階躍星辰、智譜和DeepSeek。接下來的巔峰之戰,關鍵制勝點又會在那裡?DeepSeek的橫空出世,已經徹底改變了全球的AI局勢。從此,不僅中美大模型競爭格局改變,國產大模型的產業版圖,也被一舉打破!縱觀中國基礎大模型的市場,可以看到,如今的基礎大模型版圖已然改天換地,演變為全新的五強格局——字節、阿里、階躍星辰、智譜,以及DeepSeek。新基模五強突圍,下一個制勝點在那?脫穎而出的這五強,為何能成為留在最後的玩家?答案很簡單——要麼有錢,要麼有人。前者,道理不言自明。訓練大模型是明牌重注,要麼得自家有糧,要麼就得有大腿。像字節、阿里、DeepSeek,都屬於有糧的類型;而智譜和階躍星辰,則無疑屬於後者。其中,上海隊的階躍星辰,最新一輪融資發生在24年底至25年初,B輪已融資數億美金;北京隊的智譜,在2025年3月已經拿下18億人民幣的融資。而說到人,當然就是高密度人才,尤其要有行業認可的技術領軍人物。我們仔細盤盤就能發現,五強在這方面是分足鼎立,各有骨幹。字節的吳永輝,阿里的吳泳銘、周靖人,階躍星辰的姜大昕、張祥雨、朱亦博,智譜的唐傑、張鵬,DeepSeek的梁文鋒,都是在業界足以撼動局勢的人物。滿足了有錢又有人,在這方面起跑線上各家都差不多,接下來要比拚的,就是硬貨了。基模五強,各領風騷其實仔細分析,就能發現這五強的共性。要麼是全才,模型的能力要能做到全面覆蓋,且性能在第一梯隊。要麼就是專才,模型在某一方面遙遙領先。阿里:開源王者,全球第三阿里以「開源王者」的獨特定位,不僅在國內市場佔據重要席位,更在全球AI開源生態中,穩居全球TOP 3模型貢獻者。斯坦福2025年人工智慧指數報告可以說,阿里是國內過最開源自研LLM網際網路巨頭,也是全球唯一一家實現「全尺寸、全模態」開放原始碼的雲端運算廠商。可以說,作為開源最早、最完整的大公司,阿里在AI的投入上最堅決,也是如今佈局最全、最先賺到錢的中國網際網路大廠。自2023年以來,通義團隊累積開源200+模型,涵蓋了千問(Qwen)大語言模型和萬相(Wan)視覺生成模型兩大基座系列。這些模型覆蓋了文字生成、視覺/語音理解生成、文生圖,以及視訊生成等全模態,參數規模從0.5B到235B不等,跨越119種語言及方言。兩年前,國內LLM市場尚處於「百模」混戰階段,阿里率先將Qwen-7B開源,吸引了全球開發者的關注。截至目前,Qwen全球下載量超3億,衍生模型數量超10萬,超越Llama成為全球第一開源模型。在Hugging Face社區,2024年Qwen系列佔全球模型下載量的30%以上,穩居第一。25年2月,Hugging Face全球開源大模型榜單中,排名前十開源模型全部基於Qwen二次開發在這場「燒錢」的遊戲中,未來三年,阿里還將投入3800億元用於AI研發,用於雲和AI硬體基礎設施,總額超過去十年總和。這一投入規模在國內網際網路公司中首屈一指,恰恰展現了阿里在AI賽道上的戰略決心。相較於其他大模型玩家,阿里憑藉成熟的商業化路徑和廣泛的客戶基礎,率先實現了投入到回報的閉環。截止2025年1月底,通過阿里雲百煉平台呼叫通義大模型API的企業已超過29萬。字節:巨型航母,重回創業字節的大模型以「綜合能力強」為特色,覆蓋了文字生成、圖像理解、視訊生成、語音處理等多模態領域。在這場技術與資源的巔峰對決之中,字節不僅在自研大模型和AI應用領域,展現出了「凶殘的戰鬥力」。目前,字節旗下的AI應用超20多款,爆火核心產品「豆包」憑藉其強大文字生成和多模態能力,迅速佔領使用者心智,月活使用者超1億。視訊生成工具「即夢」也被賦予了更高的戰略優先順序,已在虛擬偶像、電商直播等領域,實現商業化落地。同樣,字節在AI程式設計領域不敢落後。他們推出的AI程式設計工具Trae,直接對標Cursor等AI整合開發環境。在企業服務方面,基於豆包大模型,火山引擎「飛連」也在多場景落地AI應用等。字節的全面佈局,還體現在其生態整合能力上。通過抖音、今日頭條、飛書等平台,字節將大模型嵌入到內容推薦、協同辦公中,形成了技術到應用的生態閉環。而如今,字節以「巨型航母重回創業」姿態,憑藉雄厚資金、超高人才密度、多方向全面佈局,成為中國AI賽道領跑者之一。階躍星辰:低調的大模型國家隊跟其他家相比,階躍星辰可以算是這五強中最低調的大模型國家隊了。可以說,階躍星辰是生於上海、長於上海的國家隊。2024年底,階躍星辰完成了總額達數億美元的融資,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰略和財務投資人包括騰訊投資、五源資本、啟明創投等。如今,才成立2年的階躍星辰,已累計發佈22款自研基座模型,覆蓋文字、語音、圖像、視訊、音樂、推理,其中有16款是多模態模型,性能領跑全行業,成為行業內公認的「多模態卷王」。其中,Step-1o Vision便在2025年初分別在知名大模型競技場Chatbot Arena和國內權威評估平台「司南」(OpenCompass)中,分別拿下了視覺領域中國大模型第一,以及多模態模型榜單第一的成績。更難得的是,階躍星辰的多模態矩陣既全面,又在全行業領先。要知道,多模態模型的核心,就是綜合能力,既要求語音、圖片、視訊多個模態的能力,又要求模型能理解、生成、推理。在此佈局上,階躍星辰的每條線都達到了第一梯隊。而多模還有一大難點,就是融合過程中不能損失單個模特的性能,尤其不能降智。而階躍星辰採取了原生多模的方式,在此方面經驗獨到。在階躍星辰看來,多模態是通往AGI的必經之路。隨著多模態互動和推理的融合愈加成熟,更多Agent會在智能終端上湧現。現在,階躍星辰正在發力徹底解決視覺領域根本難題——表徵和對齊的基礎問題,也即「predict next frame」。未來,按照階躍星辰的多模研發路徑,AI將能建模物理世界互動,模擬整個世界,建構世界模型。至此,AGI就將實現。在成立之初,姜大昕團隊曾繪製過這樣一幅智能演進路線圖,將智能進化分為模擬世界、探索世界、歸納世界三個階段與此同時,階躍星辰的核心技術人員已經在一線親歷十年AI發展,這支隊伍的人才密度極高,既有技術洞察,又有實戰經驗,堪稱是基模的「夢之隊」。其中,創始人、CEO姜大昕曾擔任微軟全球副總裁,微軟亞洲網際網路工程院副院長、首席科學家。入選2025年IEEE Fellow的姜大昕博士,是唯一來自中國大模型創業公司的入選者。而首席科學家張祥雨,其參與著作的《用於圖像識別的深度殘差學習》論文(ResNet)是21世紀以來全球被引用次數最多的論文,引用量已超過25萬次。商業化方面,目前已有多家頭部企業和大量AI應用開發者對階躍的多模態模型表示認可,紛紛接入。同時,階躍還將智能終端Agent視為大模型落地的核心突破點,已和吉利汽車、千里科技、OPPO、智元機器人、原力靈機、TCL等達成了深度合作。智譜:全端創新,發力智能體作為國內首個開啟IPO大模型創業公司,智譜背靠清華技術底蘊以「學院派」獨特氣質脫穎而出,在基座模型、多模態技術和智能體展開全面佈局。目前,智譜已經建立了新一代認知大模型技術體系,研發了全端自主GLM系模型,性能指標與國際頂尖LLM對齊。去年8月,GLM-4-Plus問世在多個任務上表現優異,與GPT-4系不相上下。今年4月,智譜再次開源32B/9B系列GLM模型,包括基座、推理和沉思模型。以320億參數比肩千億參數主流模型性能。其中的GLM-Z1-Rumination沉思模型,便是智譜對AGI下一代技術的最新探索。在智能體方面,智譜先於OpenAI提出Phone Use概念並推出Agent產品,並行布了全球首個集深度研究與實際操作於一體L3級智能體——AutoGLM沉思。如今,他們正憑藉AutoGLM及GLM-PC與全球車企、PC及手機廠商展開深度合作,推動大模型從Chat走向Act。智譜的商業化路徑以2G和2B業務為核心,深度繫結政府和企業需求。其建構了MaaS私有化部署和智能體平台等服務模型,形成了包含百萬規模開發者的模型服務新生態。據統計,MaaS平台支撐80余萬企業、應用開發者。這種學院派創業模式,使得智譜在技術深度和戰略穩定上,佔據領先優勢。DeepSeek:研究導向,厚積薄發DeepSeek,則是五強中目前最受國外矚目的一位。在中美AI競賽中,也是被提及最多、存在感最強的一家。可以說,這是一位特立獨行的技術奇兵,直接以一己之力,掀翻了大模型的牌桌。DeepSeek技術的特點,就是聚焦語言模型,特別是數理能力,走堅定的開源路線。今年過年時,DeepSeek-R1給全世界帶來了億點點震撼,以極低的計算資源,取得了媲美GPT-4等頂級AI模型的性能。相比OpenAI、Anthropic訓模型時動輒投入的數億美元資金、數萬張高端GPU,DeepSeek四兩撥千斤的核心秘訣,就在於下面這種極致的工程最佳化。比如,MoE架構讓模型總參數量達到671B,而在執行階段卻只需啟動37B,大幅降低了計算需求;多token預測(MTP),則提高了AI的訓練效率,避免逐字預測;多頭潛注意力(MLA),讓模型更精準地分配了計算資源。總之,DeepSeek成功的關鍵,就在於偏研究型的導向,而非以盈利為短期目標。從研究角度鼓勵工程師提效,不必面臨財務變現壓力。而DeepSeek團隊,也匯聚了多位頂尖人才。創始人梁文鋒,在用人上也有著自己獨特的原則。比如,以應屆和畢業一兩年的人才為主,不追求規模,而是建構小而精的團隊。隨著大規模的破圈,雲廠商、行業夥伴紛紛積極接入,讓模型的生命力持續旺盛。在DeepSeek的熱潮下,如今已經有億萬普通使用者開始擁抱AI。決戰下一階段「智能上限」與「多模態能力」當「基模五強」的格局初步形成,競爭的焦點也隨之轉向更為核心和前沿的技術領域。技術決勝點,聚焦何處?顯然,追求更高的「智能上限」和突破的「多模態能力」,已成為通往AGI路上必須搶攻的兩大技術高地。一方面,追求智能的上限,仍是當下大模型領域最重要的事情。當前領先的模型雖然在許多工中表現驚豔,但在邏輯推理、常識理解、長文字處理等方面,仍有較大的提升空間。提升智能上限的最終目標,是邁向能夠執行任何人類智力任務的AGI,這需要模型具備更深層次的理解、學習、推理和創造能力。另一方面,多模態理解與生成的統一是走向AGI的必經之路。人類通過多種感官與世界互動,並獲取資訊。要讓AI真正理解並融入複雜的世界,就必須賦予其處理和融合文字、圖像、音訊、視訊等多種模態資訊的能力。當理解與生成統一,不僅能推動智能體在智能終端的普及,還能通過具身智能與物理世界互動,自己收集環境資料,建構世界模型。在世界模型的基礎上,再加上複雜任務的規劃、抽象概念歸納的能力,強化學習演算法能力,以及超級對齊能力,就有可能實現AGI。總而言之,未來對更高智能上限的無盡探索和多模態能力的深度融合,將是決定這場競賽勝負的關鍵。如今站在AGI的門檻前,「基模五強」的競爭不僅是技術的較量,更是資源、人才、生態的全面博弈。字節、阿里、階躍星辰、智譜、DeepSeek這五大領軍者,正以其各自獨特的優勢和戰略遠見,引領中國AI不斷逼近世界前沿。而這場競爭的終點,或許正是AGI的曙光。 (新智元)