大模型之爭，中國勝負手何在

2024/06/27

•

中國作為後起之秀，憑藉龐大的市場需求、持續的政策支援和不斷湧現的創新力量，在AI領域取得了長足的進步

仿生人形機器人在 2024 中關村論壇年會會場設定的諮詢台“迎賓”（2024 年 4 月 27 日攝）任超攝 / 本刊

2022年末，ChatGPT的橫空出世在全球範圍內引起轟動。一時間，成百上千個大模型如雨後春筍般湧現，生成式人工智慧遍地開花，“大模型之爭”開啟序章。“群模”亂戰的2023年，文字生成、文生圖、語音處理、程式碼處理、視訊處理等應用產品海量井噴。

有資料顯示，截至4月底，國內共推出305個大模型；10億參數規模以上的大模型數量已超100個。

5月，全球數得上名號的大模型玩家更是一窩蜂地拋出大動作——

5月9日，阿里雲正式發佈通義千問2.5，模型性能全面趕超GPT-4 Turbo；
5月13日，零一萬物正式發佈千億參數規模的Yi-Large閉源大模型；
次日，OpenAI發佈了迄今最像“人”的AI大模型GPT-4o；
台北時間5月15日凌晨，Google召開開發者大會，全線更新了Gemini；
同日，字節跳動發佈包括多模態大模型在內的豆包大模型家族……

整個5月，中美大模型巨頭“你方唱罷我登場”，膠著的競爭態勢將轟轟烈烈的“大模型之爭”帶入了“卷”技術與價格的下半場。

從區域分佈來看，全球大模型“美領跑，中緊跟，其他區域跟不上”的態勢已基本明朗。

中國科學技術資訊研究所、科技部新一代人工智慧發展研究中心去年發佈的《中國人工智慧大模型地圖研究報告》顯示，中國研發的大模型數量排名全球第二，僅次於美國。中美兩國發佈的大模型總數，佔全球八成以上。

在“大模型之爭”的下半場，中國的勝負手何在？受訪專家表示，持續穩定的政策支援、龐大的算力規模和廣闊的應用場景是中國獨特的競爭優勢和巨大的發展潛力。

差距不斷縮小

在全球“大模型之爭”開啟之初，“中美在AI領域差距有多大”曾是公眾關注的熱點議題，彼時業內人士給出的判斷從1～2年到8～10年不等，判斷依據主要包括創新生態、高端人才數量、基礎研究、演算法創新、算力規模、市場應用規模等。

經過一年多的發展，業內認為，這種差距正在大幅縮小。清華大學基礎模型研究中心聯合中關村實驗室發佈的《SuperBench大模型綜合能力測評報告》顯示，在14個海內外具有代表性的模型當中，GPT-4系列模型和Claude-3等國外模型在多個能力上依然處於領先地位，國內頭部大模型GLM-4和文心一言4.0表現亮眼，與國際一流模型水平接近，且差距已經逐漸縮小。

“一年前，我們（中國）落後OpenAI、Google 7～10年，我認為現在差距在6個月左右，大大降低了。”創新工場董事長、零一萬物首席執行官李開復近期在接受公開採訪時說，從落後7～10年，到落後6個月，是一個不可思議的“超級速度”。

穩定的政策支援為大模型快速發展“補能”。《瞭望》新聞周刊記者梳理髮現，近年來，中國高度重視人工智慧發展機遇和頂層設計，出台了一系列扶持政策：2017年，國務院印發《新一代人工智慧發展規劃》；2022年，科技部等六部門印發《關於加快場景創新以人工智慧高水平應用促進經濟高品質發展的指導意見》；2024年政府工作報告提出開展“人工智慧+”行動……

賽迪顧問人工智慧與巨量資料研究中心發佈的《中國大模型發展研究報告（2024）》認為，中國大模型產業發展的政策重點在於強調創新驅動與生態最佳化，通過創新體系整合與政策支援強化、資料開放共享與隱私安全並重、跨界融合與行業標準化建設、加速人才培養與國際合作、促進產業生態協同發展等幾方面為大模型技術與產業發展提供強有力的政策支撐。

受訪人士表示，穩定的政策支援有助於中國集中力量推動大模型技術的快速發展，盡快縮小差距，搶佔技術高地。

算力規模大驅動大模型加速成長。全球範圍內來看，隨著大模型規模日益龐大，算力能耗已成為制約大模型進一步發展的瓶頸。資料顯示，中國算力規模、存力規模、運力質量都在不斷提升。截至去年8月，全國在用資料中心機架總規模超過760萬標準機架，算力總規模達到197EFLOPS（FLOPS即每秒執行的浮點運算次數，1EFLOPS=10的18次方FLOPS），位居全球第二；圍繞算力樞紐節點建設130條幹線光纜，資料傳輸性能大幅改善。

受訪人士說，算力是大模型訓練與應用的核心驅動力。近年來，國產晶片產量大增，智能算力全球佔比領先，顯示出中國在算力領域的強勁發展勢頭。國家推動的“東數西算”等重大項目，將進一步最佳化算力佈局，為人工智慧發展提供有力支撐。

豐富的應用場景為大模型迭代提供試驗載體。從本質上看，大模型的技術能力再強，最終落點也是要為生活和生產所用。北京智譜華章科技有限公司首席執行官張鵬說，大模型發展需要場景驅動，中國產業門類齊全、經濟規模巨大，在預測、採購、行銷、定價、營運及改善使用者體驗等方面有極大的應用潛力。

5月，大模型與學習機結合的熱度開始爆發。在這一個月中，小度科技在新發佈的小度學習機Z30上，落地了文心大模型；猿輔導首次披露了大模型架構，以及AI課程的結合；網易有道旗下“子曰”教育大模型技術升級，並披露了“LLM翻譯”“虛擬人口語教練”“AI作文指導”等六大落地應用。

網易有道首席執行官周楓認為，當前已經是“模型即應用”的時代，大模型的發展需要結合應用場景去迭代最佳化，在“產模一體”的框架下去同步提升模型與產品。

中國資訊通訊研究院院長余曉暉說，從近期來看，大模型已在日常辦公、文字創作、圖像視訊生成、客服問答等領域展現較大發展潛力和應用價值；從中長期看，大模型將與製造、生物醫藥、能源、交通等實體經濟領域深度融合，不斷提升創新效率、拓展應用領域、提高生產效率，成為各行業轉型升級的基礎賦能工具，帶動更大範圍創新。

趕超仍存挑戰

當前，大模型與人工智慧技術仍處於中美科技競爭的焦點，中國在過去幾年取得了快速進步，但仍面臨一些發展困境。受訪人士認為，中國在基礎演算法創新、底座大模型訓練資料、公共算力佔比等方面仍存在一定差距，需要盡快補足。

基礎技術創新不足。受訪人士認為，國內大模型的差異主要表現在模型設計和訓練方式上，但從技術路線看，國內大模型發展缺少具有顯著創新性的原創理論支撐，研發以追隨全球先進成果為主。例如，人工神經元模型、知識圖譜、深度學習框架、Transformer架構等開創性技術，大多由美國科學家提出。

理論突破和技術創新是大模型發展的首要驅動力，缺乏原始創新，在“別人的地基上建房子”使中國大模型發展容易被“牽著鼻子走”。

優質開源中文資料集短缺。作為大模型的“養料”，優質中文資料與英文的差距也不容輕視。

受訪人士說，得益於開源共創的網際網路生態，海外已有大量優質、結構化的開源資料庫，文字來源既包含嚴謹的學術寫作、百科知識，也包含文學作品、新聞媒體、社交網站等，更加豐富的語料資料能夠提高模型在不同情景下的對話能力。而受制於搭建資料集較高的成本以及尚未成熟的開源生態，國內開源資料集在資料規模和語料質量上相比海外仍有較大差距，資料來源較為單一，且更新頻率較低，模型的訓練效果受限。

《全國資料資源調查報告（2023年）》顯示，2023年中國資料生產總量達32.85ZB（澤字節）。北京大學人工智慧安全與治理中心執行主任楊耀東認為，不同國家及行業之間的資料壁壘依舊存在，如何讓資料供得出、流得動、用得好依舊是重要課題。

公共算力佔比低制約大模型規模化應用。國家資訊中心發佈的《“人工智慧+”時代公共雲發展模式與路徑研究》顯示：2018年至2022年，中國在用資料中心機架總規模年均增速超過30%，但2022年上架率僅58%，低於全球平均水平。

國家資訊中心資訊化和產業發展部主任單志廣表示，目前中國算力利用率仍不高，尤其公共雲佔比較低，制約了大模型規模化應用。

有媒體認為，中美兩國伺服器數量差距並不大，但美國60%以上的算力都是以公共雲的方式提供，而中國只有約28%。在企業有著迫切算力租用需求的時候遠水難救近火。

處理好全面追趕和局部突破的關係

美國特斯拉公司首席執行官、太空探索技術公司首席執行官埃隆·馬斯克在近期的演講中談到，中國作為後起之秀，憑藉龐大的市場需求、持續的政策支援和不斷湧現的創新力量，在AI領域取得了長足進步。中國企業在AI技術的研發和應用方面展現出極高的靈活性和創新能力，不斷推動著AI技術的邊界向前拓展。

提高中國大模型競爭力，還應發揮優勢，處理好全面追趕與局部突破的關係。

強化公共雲對大模型的廣泛支撐作用。國內大量自建IDC的平均資源使用效率往往不到5%，而亞馬遜AWS、Google等公共雲廠商的資料中心資源使用效率一般可達30%～40%。所以，破解中國算力瓶頸的關鍵路徑之一在於提高既有晶片和產能的利用率。

單志廣表示，通過發揮公共雲大規模機器調度等，不僅能將已有先進晶片集約化利用，還能充分利用已有的通用CPU資源，為AI大模型訓練和推理應用提供必要的算力支援。

推動業內創新研究協同。中國工程院院士鄔賀銓表示，不少單位各自獨立研究大模型，難免低水平重複，建議在國家科技與產業計畫的協調下合理分工形成合力，如組建算力聯盟，集中已有高檔GPU的算力資源。

深圳開鴻數字產業發展有限公司首席執行官王成錄也認為，更多領域的開源共享，是實現技術積累量變到質變的有效途徑，“必須克服各人自掃門前雪的單兵作戰思維。”

加速產業化落地，在應用層實現更快追趕。“產業的‘AI+’，是可以重點發力的方向。”中國新一代人工智慧發展戰略研究院執行院長龔克認為，得益於龐大完備的工業體系，中國有著數實融合的天然基礎，應盡快發掘對於傳統領域的賦能作用。

百度創始人、董事長兼首席執行官李彥宏說，看PC時代，基本上只有Windows一個作業系統，但是基於Windows系統開發的軟體有很多；移動網際網路時代，主流作業系統也只有Android和iOS兩家，而移動應用有800萬之多。AI時代，我們需要100萬量級的AI原生應用，但是不需要100個大模型。產業政策應鼓勵基於大模型的AI原生應用，推動建構起繁榮的AI生態。（瞭望）