我們經常將中國在生成式人工智慧領域的領先地位與 DeepSeek 或阿里巴巴的 Qwen聯絡在一起。但儘管西方媒體都在報導 OpenAI 或Google的新人工智慧產品,但騰訊、百度和字節跳動等中國科技巨頭也在努力培養大模型。
預計到2025年,字節跳動將在AI晶片和AI基礎設施上投入120億美元。TikTok的母公司字節跳動早在ChatGPT問世之前就已是全球領先的消費級AI應用開發商之一。2024年,TikTok母公司字節跳動報告稱,其營收增長29%,達到1550億美元。
字節跳動在2025年的推理模型方面也不會落後,例如即將推出的大型語言模型(LLM)Seed -Thinking-v1.5 ,旨在提升科學、技術、數學和工程(STEM)領域以及通用領域的推理性能。這甚至可能促使DeepSeek在本周更新其R1推理模型。雖然DeepSeek的故事如今已廣為人知,但字節跳動在LLM方面的實力尚未被西方受眾所瞭解。字節跳動豐富的應用程式和社交商務帝國也是如此。
到 2025 年底,中國將成為不限權重LLM項目的領先者
最近,字節跳動開源了 Bagel。Bagel是一個多模態 AI 模型,可以同時接受文字和圖像作為輸入。開放原始碼的 VLM 總共包含 140 億個參數,其中 70 億個參數同時處於活動狀態。
主要特點
模型設計和訓練
圖像編輯和其他功能
訪問和可用性
BAGEL 是根據 Apache 2.0 許可證授權的。
當中國大陸以外的人想到字節跳動時,他們會想到 TikTok——一款讓短影片風靡一時的應用程式,也讓字節跳動處於中美緊張關係的中心。
但你很少聽到的是字節跳動的人工智慧。與阿里巴巴和百度等其他中國科技巨頭不同,字節跳動很少為了吹噓其模型而吸引全球媒體的關注。然而,在幕後,字節跳動已經建構了一些全球最先進的LLM和消費級人工智慧應用程式。
我們為什麼不多談一談呢?部分原因是字節跳動刻意保持謹慎。人工智慧是地緣政治敏感領域。對於一家業務遍佈全球、面臨美中兩國雙重審查的公司來說,低調行事或許是一種戰略。
但這同時也關乎全球人工智慧敘事的塑造。在西方,我們關注OpenAI的崛起、xAI的狂野以及Google的創新。即使在中國公司中,DeepSeek和阿里巴巴也憑藉其開源大模型登上了新聞頭條。然而,字節跳動的模型是閉源的。他們的旗艦人工智慧產品大多在中國市場銷售,而全球同類產品往往缺乏品牌知名度。
這個故事探討了字節跳動如何更安靜、更深入地轉型成為世界上最強大、也可能是最被低估的人工智慧參與者之一。
字節跳動一直是一家人工智慧公司,儘管它並不總是表現得像一家人工智慧公司。
早在ChatGPT成為年度熱門詞彙之前,字節跳動就已將機器學習融入其最成功的產品 TikTok(中文版抖音)的 DNA 中。其著名的推薦演算法驅動了無限滾動,展現了字節跳動對資料、使用者行為建模和內容個性化的深厚理解。字節跳動多年來一直在探索人工智慧,只是其方式並非人工智慧界通常所推崇的。
他們的人工智慧實驗室於2016年左右成立,主要支援公司應用程式。2023年之前,實驗室的NLP小組約有100名成員,由字節跳動研究主管李航領導。只有一個十人的小團隊負責研究大型語言模型(LLM)。
字節跳動研究部負責人李航
但一切都在2022年末發生了改變,OpenAI推出了ChatGPT,引發了全球範圍的實驗,並在中國科技行業掀起了衝擊波。到2023年初,百度發佈了ERNIE Bot,阿里巴巴放棄了Qwen,而Moonshot AI和MiniMax等初創公司也加入了競爭。
字節跳動姍姍來遲。到2023年年中,其他公司紛紛展示聊天機器人和API,而字節跳動卻鮮有斬獲。直到8月,字節跳動才發佈了其首款大模型產品Skylark(中文名雲雀),比競爭對手晚了幾個月。其旗艦聊天機器人豆包也於同月亮相,但表現平平,到11月日均活躍使用者僅為130萬,而ChatGPT的周活躍使用者則高達3億。
在2024年初的一次全體會議上,首席執行官梁如波直言不諱。由於競爭對手憑藉基礎機型一路領先,公司一直“低迷”。
梁汝波說:我們公司對新機遇的反應遲緩,缺乏初創公司那樣的敏銳度。我們每六個月在公司層面進行一次技術評估,直到2023年才開始認真討論GPT,而大多數成功的LLM初創公司都是在2018年至2021年之間成立的。
自2023年末以來,字節跳動加速發展。成立了名為Flow的專門AI部門,其地位與抖音等核心部門相當。Flow迅速拆分為三個部門:應用團隊Flow 、基礎模型團隊Seed以及基礎設施和工具團隊Stone 。
到2024年,字節跳動發展速度驚人。他們致力於完全自主研發人工智慧,從大模型到圖像和視訊生成器,無所不包。2024年5月,字節跳動將Skylark更名為豆包,豆包專業版的定價為每百萬token 0.8元人民幣(約合0.11美元),遠低於行業標準。9月,字節跳動發佈了視訊生成器PixelDance和Seaweed,能夠在短影片中生成複雜的連續動作。
其次,他們專注於自身最擅長的領域:應用程式。作為中國無可爭議的“應用工廠”,字節跳動擁有眾多精英產品經理。他們將模型轉化為具有粘性、可用性和病毒式傳播的體驗。豆包起步雖慢,但其使用者體驗迅速領先。它整合了搜尋功能,提供個性化的AI角色,並可輕鬆跨任務運行。字節跳動借鑑TikTok的策略,為其幾乎所有AI應用建立了國際版本——從豆包和Cici;到扣子和AI應用開發平台Coze。
第三,他們利用自身生態系統主導分銷。中國家喻戶曉的短影片平台抖音成為字節跳動AI應用的增長引擎。據報導,字節跳動斥資10億元人民幣(1.5億美元)在其應用網路中推廣豆包,實現了大規模使用者轉化。到2024年11月,豆包的月活躍使用者已接近6000萬,2025年4月,豆包MAU已經接近1.2億。毫無疑問地位居中國AI應用排行榜榜首。
支撐這一增長的是人才的湧入。字節跳動積極招募工程師和科學家,通過提供有競爭力的薪酬和清晰的長期願景,吸引了行業頂尖人物,例如阿里巴巴的首席科學家和李開復領導的人工智慧初創公司零一的聯合創始人。
創始人張一鳴在推動這一戰略方面發揮了積極而非被動的作用。據報導,他每天都閱讀最新的研究成果,與全球人工智慧專家會面,並親自指導公司的人工智慧項目。張一鳴和其他關鍵高管認為,人工智慧是一場不容輸的戰鬥。
成果隨之而來。字節跳動提升了在學術會議上的影響力,發表基礎研究成果,並與北京大學等機構合作撰寫論文。在堪稱人工智慧界奧運會的2024年NeurIPS大會上,字節跳動榮獲了最佳論文獎。
到 2024 年,中國 AI 未來的戰爭似乎已經結束。字節跳動正在吞噬整個市場。隨著其模型的迅速改進、應用生態系統的蓬勃發展以及多模態 AI 的發展勢頭,字節跳動從各方面來看都取得了勝利。
然而,DeepSeek 的出現打破了這種敘事。這家總部位於杭州的初創公司已經得到了中國人工智慧研究人員的認可,但在 2024 年 12 月和 1 月推出最新的基礎模型 DeepSeek-V3 和推理模型 R1 之前,它基本上在全球範圍內一直處於低迷狀態。反響是爆炸性的。在沒有廣泛的公關活動或複雜的應用程式介面的情況下,DeepSeek Chat 迅速成為一種全球現象,迅速成為中國最受歡迎的聊天機器人,並實現了移動應用程式歷史上最快的使用者採用率。
這種激增震驚了字節跳動。據報導,字節跳動在 2024 年向 AI 投資了高達 800 億元人民幣(~110 億美元) 後,發現自己出乎意料地被一個更精簡、更開放的競爭對手超越了。作為回應,2025 年初召開了一次全體會議,首席執行官梁在會上公開承認了這些失誤。雖然豆包仍然成功,字節跳動的模型保持了頂級地位,但該公司再次誤讀了市場動態。具體來說,他們低估了測試時計算創新的戰略意義——以 DeepSeek 的 R1 為亮點,以 OpenAI 的 o1 為藍本,最初被字節跳動認為是邊緣的。
為瞭解決這個問題,字節跳動啟動了一個名為 Seed-Edge 的大膽項目 ,旨在推動智能的前沿發展。該計畫將大量資源重新定向到高級 AI 研究,探索 Transformer 架構之外的新框架、複雜推理系統、AI 代理,甚至可能是專有 AI 晶片。它標誌著對基本雄心的決定性回歸。
與此同時,字節跳動聘請了來自 Google Brain 的受人尊敬的專家吳永輝來領導他們的基礎 AI 工作。
到 2025 年初,字節跳動已經恢復了勢頭。他們推出了豆包-1.5-Pro,這是下一代基礎模型,具有改進的多模態能力和更快的推理速度。他們還推出了超越 DeepSeek-R1 的專用推理模型 Seed-Thinking-1.5,並開發了讓人想起 Cursor 的編碼助手。報導甚至表明,字節跳動正在開發內部 AI 晶片,旨在減少對 Nvidia 硬體的依賴並最佳化其獨特模型架構的性能。
因此,雖然 DeepSeek 暫時獲得了關注,但字節跳動仍然保持著激烈的競爭,並深入參與了正在進行的 AI 之戰。
以下是字節跳動的大模型LLM 產品、AI應用程式和相關計畫的概述。
Doubao:基礎LLM
豆包以中式糕點命名,是字節跳動對 GPT 和類似模型的回應。豆包於 2023 年全年內部孵化,前身為 Skylark,於 2024 年年中作為 LLM 系列正式推出。它包括至少八種變體,從入門級的豆包精簡版到處理大量 128,000 個令牌上下文的頂級豆包專業版。一些版本專門用於語音識別和“虛擬字元”生成。
字節跳動將豆包定位為超低成本以推動採用。在發佈時,該公司將豆包的使用量定價為每百萬個代幣 0.8 元人民幣,比 OpenAI 的 GPT-4 定價便宜 99.8%,這讓競爭對手感到驚訝。即使是百度和阿里巴巴的模型,每個代幣的成本也高出 150 倍。這種激進的定價引發了中國 LLM 市場的價格戰,並幫助豆包迅速獲得企業使用者。
到 2025 年初,字節跳動發佈了豆包-1.5-pro, 這是一個升級後的 MoE 多模態模型,經過調整以加快推理速度。該公司聲稱 Doubao-1.5-Pro 的分數與 OpenAI 的 GPT-4o 模型相當。字節跳動在某些版本中將模型的上下文窗口擴展到 256k 令牌,針對需要長文件的任務,同時保持極低的令牌成本(例如,對於 32k 上下文模型,每百萬輸出令牌 2 元)。值得注意的是,字節跳動強調該模型對獨立來源資料的訓練。
Seed1.5-VL:視覺語言模型
Seed-1.5-VL 於 2025 年 5 月剛剛發佈, 是由 Seed 團隊開發的視覺語言基礎模型,旨在推進通用多模態理解和推理。它將一個 532M 參數的視覺編碼器與一個包含 200 億個活動參數的 MoE 語言模型整合在一起。儘管架構緊湊,但 Seed-1.5-VL 在 60 個公共視覺語言基準測試中的 38 個基準測試中實現了 SOTA 性能,展示了在視覺理解、視訊理解和多模態推理任務方面的強大能力。值得注意的是,它在以代理為中心的應用程式(如 GUI 控制和遊戲)中表現出色,優於 OpenAI 的 CUA 和 Anthropic 的 Claude 3.7 等領先的多模態系統。
seed-coder:開源編碼模型
雖然大多數字節跳動模型都是閉源的,但 Seed-Coder 是一個開源編碼模型系列。Seed-Coder 專為程式碼生成、推理和軟體工程任務而設計,由三個 80 億個參數的模型組成:base、instruct 和 reasoning。
Seed-Coder 的一個顯著特點是其“以模型為中心”的資料管理方法,其中採用較小的 LLM 從 GitHub 等來源和與程式碼相關的 Web 內容中自動過濾和選擇高品質的訓練資料,從而減少人工干預。基準評估表明,Seed-Coder 在各種編碼任務中在類似大小的開源模型中表現具有競爭力。
Seedream 3.0:文字到圖像模型
字節跳動的 Seedream 3.0 於 2025 年 4 月推出,是一種雙語(中英)文字到圖像模型,可在大約 3 秒內提供高解析度(高達 2K)的圖像。它採用缺陷感知訓練和雙軸資料採樣來增強圖像-文字對齊和美學質量。該模型在兩種語言中都實現了 94% 的文字渲染精準率,在密集排版和照片級逼真的肖像生成方面表現出色。Seedream 3.0 已整合到字節跳動的豆包和極盟應用程式中,並通過 Volcano Engine API 訪問。
PixelDance & Seaweed:視訊生成
在視訊生成方面,字節跳動於 2024 年底推出了兩款文字轉視訊模型,作為豆包家族的一部分:PixelDance 和 Seaweed。PixelDance 可以從文字或圖像提示合成高保真 10 秒視訊,從而生成複雜的連續運動,而 Seaweed 則將其功能擴展到 30 秒的剪輯。這些模型可在豆包聊天機器人上使用,是中國首批將視訊創作引入面向消費者的聊天機器人的模型之一。
字節跳動在視覺 AI 方面的研究進一步開展了世界首創的實驗。2025 年初,其 AI 實驗室開源了一個名為 VideoWorld 的實驗模型 ,該模型顛覆了視訊生成的指令碼。VideoWorld 不是從 DALL-E 或 Runway 等文字提示開始的;相反,它僅從原始視覺資料中學習。VideoWorld 在未標記的視訊片段上進行訓練,成為第一個“通過純視覺輸入識別和理解世界......不依賴文字或語言模型”的 AI 系統。
為了製作人類主題的動畫,字節跳動於 2025 年 2 月首次推出了 OmniHuman-1,這是一種端到端模型,可以將人的單個靜態圖像轉換為流暢、逼真的視訊序列。
Seed-ASR & Seed-TTS:語音
豆包的聊天機器人具有即時語音通話功能,聽起來非常接近人類,這種體驗的背後是兩種先進的語音模型:Seed-TTS 和 Seed-ASR。
Seed-TTS 是一系列大規模自回歸模型,旨在生成與人類自然性和表現力密切相關的語音。它支援零樣本語音克隆,允許僅使用簡短的音訊樣本合成特定說話人聲音中的語音。該模型提供對人聲屬性(如情感、語氣和說話風格)的精細控制。
Seed-ASR 是一種基於 LLM 的語音識別模型,使用音訊條件大語言模型 (AcLLM) 框架開發。它經過超過 2000 萬小時的語音資料和大約 900000 小時的配對 ASR 資料的訓練,使其能夠準確地轉錄各種領域、語言和口音的語音。Seed-ASR 支援普通話、13 種中國方言、英語和其他 7 種語言。與其他最先進的 ASR 模型相比,Seed-ASR 在公共測試集中的單詞或字元錯誤率降低了 10% 到 40%。
種子音樂:音樂一代
2024 年,字節跳動涉足 AI 音樂和音訊領域。字節跳動的主要 AI 音樂生成模型是 Seed-Music,於 2024 年 9 月推出。該模型將自回歸語言建模與擴散技術相結合,以產生高品質、可控的音樂作品。Seed-Music 支援多模態輸入,包括文字描述、音訊引用、樂譜和語音提示,允許使用者生成各種類型的聲樂和器樂作品。值得注意的是,它具有零鏡頭語音轉換功能,可以將 10 秒的語音樣本轉換為富有表現力的歌唱表演。此外,Seed-Music 還提供生成後編輯功能,允許使用者直接在生成的音訊中修改歌詞和旋律。該模型可通過字節跳動的豆包應用程式和 Volcano Engine API 訪問,既適合新手創作者,也適合專業音樂家。
Seed-Thinking-v1.5: 複雜推理
為了趕上 OpenAI 的 o1 和 DeepSeek R1,字節跳動於 2025 年 4 月發佈了 Seed-Thinking-v1.5 模型 ,該模型明確適用於數學、編碼和科學問題解決等領域的複雜推理。它將多模態輸入與邏輯推理相結合,使其能夠“關聯和思考它所看到的人類”。在具有挑戰性的數學競賽中,這款視覺增強的 LLM 與 OpenAI 最新的 mini-o-model 性能相匹配,並展示了強大的編碼能力。
為了實現這一點,該公司推出了 OS Agent 工具包,本質上是一個與專用模型和工具捆綁在一起的代理開發平台。一個值得注意的元件是 UI-TARS,這是一種 GUI 代理模型,可以觀察電腦或電話介面並像人類使用者一樣對其進行作。UI-TARS 結合了視覺理解、邏輯規劃和 UI 元素互動,通過使用 AI 來適應螢幕上的變化,克服了指令碼自動化的限制。這為一類新的代理提供了支援,例如,他們可以規劃旅行行程並實際端到端預訂機票,自主點選應用程式和表單。
AI 應用和平台
字節跳動一直在積極將其 AI 研究轉化為多個領域的產品,從 ChatGPT 風格的聊天機器人和充滿 AI 代的社交媒體應用程式,到雲 API 和開發者平台,字節跳動在多個方面推出了 AI 驅動的產品。
豆包於 2023 年 8 月公開推出,與字節跳動的 LLM 同名,已成為中國轟動一時的 AI 聊天機器人。與 OpenAI 的 ChatGPT 非常相似,豆包提供中英文的對話答案和即時語音通話,但字節跳動通過多模式功能和社交平台的支援為其增強了動力。
使用者不僅可以用自然語言聊天,還可以讓豆包理解和建立圖片,生成數位化身,甚至製作音樂剪輯。多媒體生成可以以山寨捲軸格式在豆包的社交社區上分享,這是 OpenAI 正在考慮的一項內建功能 。
與字節跳動的龐大內容庫相連接,豆包已將自己打造成可與百度相媲美的 AI 搜尋引擎。其 AI 生成的答案得到了抖音短影片或今日頭條新聞的支援。最近的研究表明,豆包的深度研究精準性在中國聊天機器人中達到了 SOTA。
豆包並非沒有爭議。2024 年 5 月,使用者報告直接在 Google 上找到豆包生成的文章。據報導,Google上曾經有超過 1500 萬個豆包生成的頁面。豆包還允許使用者將他們的對話作為靜態網頁分享,然後可以被搜尋引擎編入索引。這些頁面中的大多數已被刪除。
到 2025 年 3 月,豆包積累了超過 1.16 億月活躍使用者 ,僅次於 DeepSeek 的 1.94 億月活躍使用者。行業排名顯示,到 2024 年,豆包將成為面向中國消費者的NO.1 的AI應用。它的西方版本稱為 Cici。
火山引擎:AI 雲平台
在企業方面,字節跳動的主要載體是火山引擎Volcano Engine,其雲和AI服務部門可與 Microsoft Azure 和阿里雲相媲美。Volcano Engine 將字節跳動的許多 AI 模型商業化,作為企業和開發人員的按需 API 或平台。當豆包 LLM 於 2024 年 5 月面向企業推出時,它通過 Volcano Engine 以極低的價格提供。結果是使用量大幅上升,每日token呼叫量達到 12.7 兆次(自 2024 年 5 月以來增長超過 100× 次)。
即夢:AI 時代的 TikTok
據中國當地媒體報導,儘管豆包的增長令人印象深刻,但字節跳動發現,到 2024 年,會話時長和消息頻率等使用者參與度指標已經趨於平穩,這與其他聊天機器人的趨勢相呼應。字節跳動將聊天機器人視為人工智慧發展的過渡階段,並將極盟(西方稱為 Dreamia)視為“人工智慧時代的 TikTok”。
即夢是一個生成式 AI 平台,提供 AI 驅動的圖像和視訊建立工具。即夢由字節跳動的剪映(西方稱為 CapCut)團隊開發,允許使用者將文字提示轉換為像 Sora一樣的視覺內容。即夢具有視訊滾動功能,讓人想起 TikTok 的標誌性垂直提要。它允許使用者滑動瀏覽精選的 AI 生成的短影片流。
即夢在中國的 Android 和 iOS 平台上均可作為移動應用程式使用。它的開發由抖音前首席執行官 Kelly張楠帶頭,她已轉而專注於字節跳動內部的人工智慧驅動計畫。它採用訂閱模式,計畫起價為每月 69 元(約合 9.65 美元),允許使用者每月生成大量圖像和 AI 視訊。
Coze:AI 開發平台
字節跳動的 Coze 是一個 AI 聊天機器人和應用程式開發平台,旨在使使用者能夠(無論程式設計經驗如何)在各種平台上建立、自訂和部署 AI 代理。Coze 於 2024 年初推出,提供使用者友好的介面和拖放介面,允許整合高級語言模型,包括字節跳動自己的豆包系列,以及來自 OpenAI 和 Thropic 的模型。該平台支援多模態輸入,並提供一套工具,如工作流建構器、外掛庫和知識庫管理,以增強機器人功能。在 Coze 上開發的機器人可以部署在多個社交和企業平台上,包括豆包、飛書 (Lark)、微信、Discord、Telegram 和 Slack。
進入 2025 年,Coze 推出了扣子空間Coze Space,旨在促進 AI 智能體的開發。它基於豆包智能體 (Doubao LLM) 建構,支援模型上下文協議 (MCP),並支援與 Lark(飛書)和高德地圖等應用程式無縫整合。該平台引入了一個“專家智能體”系統,能夠處理從回答查詢到執行複雜任務的各種任務。這些智能體可以將使用者輸入解構為子任務,自主使用瀏覽器和程式碼編輯器等工具,並生成報告和簡報等綜合輸出。
Gauth:流行的 AI 家庭作業應用程式
Gauth,前身為 Gauthmath,是由字節跳動的子公司 GauthTech 開發的人工智慧驅動的教育應用程式。它於 2020 年推出,允許學生拍攝問題的照片並接收分步解釋,從而為學生提供數學問題的即時解決方案。該應用程式涵蓋廣泛的學科,包括代數、微積分、幾何、物理、化學和生物學,並提供 24/7 全天候人工導師處理複雜查詢。
Gauth 在全球範圍內廣受歡迎。到 2025 年 4 月,該應用程式的網站 gauthmath.com 每月訪問量約為 1444 萬次,其中美國約佔流量的 26%。此外,Gauth 成為美國 Apple iOS 裝置下載量第二大的教育應用程式,僅次於 Duolingo。
Ola Friend:AI耳機
Ola Friend 是一對於 2024 年 10 月推出的開耳式無線耳塞。它標誌著該公司進軍人工智慧驅動的可穿戴裝置。這些耳塞旨在用作個人音訊助理,允許使用者直接與豆包聊天機器人互動,而無需訪問他們的智慧型手機。只需說出“豆包豆包”喚醒詞,使用者就可以參與語言翻譯、練習英語、聽音樂或尋找資訊等任務。Ola Friend 耳塞售價 1,199 元(~170 美元),目前僅在中國銷售。
AI 晶片和基礎設施
為了支援其 AI 雄心壯志,字節跳動在計算基礎設施方面進行了大量投資,尤其是高端晶片。訓練 LLM 和向數百萬人提供 AI 功能是計算密集型的,字節跳動一直在競相通過購買和定製研發來獲得足夠的晶片,以保持領先地位。
2025 年 1 月, 英國《金融時報》 的一篇報導顯示,字節跳動計畫僅在 2025 年就花費驚人的 $120 億用於人工智慧基礎設施。大約 $5.5B 專門用於在中國境內購買 AI 晶片,使其晶片支出比上一年翻了一番。剩餘的 $6.8B 留作 AI 產能的海外擴張,主要用於採購先進的 NVIDIA GPU 用於訓練基礎模型。事實上,字節跳動已成為 NVIDIA 最大的中國客戶,到 2024 年估計購買了 230,000 個 GPU(主要是 H20)。
字節跳動並不止於購買現成的晶片;它還在共同設計定製 AI 處理器。2024 年年中, 路透社報導稱,字節跳動正在與美國晶片製造商博通合作,開發一種適合其需求的先進 5 奈米 AI 晶片。該晶片是一種定製 ASIC,旨在遵守美國的出口限制(針對中國的 14 奈米以下技術),並將由台灣台積電製造。分析師將此視為字節跳動為控制其 AI 硬體命運而採取的主動舉措,就像Google的 TPU 或亞馬遜的定製 AI 晶片一樣。
鑑於字節跳動的規模(在使用者覆蓋率方面可與Google或 Meta 相媲美),其開發自力更生的 AI 晶片供應的動力被視為未來幾年的進攻和防禦策略。
最後的話
字節跳動不僅僅是中國最強大的人工智慧公司之一。字節跳動再次將自己定位為全球競爭者——比 OpenAI 更安靜,比 Anthropic 更注重產品驅動,比任何其他中國參與者都更加整合。憑藉龐大的資源、頂級人才以及對最高等級 AI 研究的重新承諾,字節跳動的新篇章已經開始。
字節跳動可能在 2026 年超越 Meta
字節跳動不僅僅是中國的 Meta。如果生成式 AI 損害了搜尋廣告 ,那麼字節跳動和亞馬遜一樣是最有可能從中斷中獲利的公司之一,而不僅僅是 OpenAI。
據彭博社報導,字節跳動預計到 2025 年將產生約 1860 億美元的收入,比 2024 年增長 20%。這略低於 Meta 預測的 1870 億美元,突顯了這家中國科技公司成為全球力量的速度有多快。
字節跳動擁有堅實發展軌跡的主要原因之一是,它不僅僅是一個數字廣告商,它更加多元化,如果他們的搖錢樹動搖,Google尤其是 Meta 都會容易受到攻擊。Meta對Instagram和whatsApp 的潛在反競爭收購的命運現在取決於一位法官。
字節跳動收購應用程式並不是為了變得偉大,他們建構並擴展了它們。在 ChaGPT 病毒式傳播之前,字節跳動很容易成為全世界最擅長這樣做的人。他們製作和擴展了如此多的應用程式,其中大多數都帶有重要的 AI 元件,其中許多已不復存在。他們認真涉足遊戲和 VR,但並不總是成功。現在,他們是一家更成熟的公司,對生成式 AI 進行了合理的投資。隨著美國採取更加封閉和昂貴的方法來從他們的領導地位中獲利,中國越來越似乎將成為面向全球的開源且負擔得起的 AI 模型、工具和具有成本效益的企業 AI 的主要出口國。 (共識流通處)