大模型沒有免費午餐

2024/06/24

•

618的風刮到了大模型圈。僅僅一周，大模型從「厘」時代跨入了「免費」時代。

根據統計，此次降價潮共涉及21款大模型廠商。從手機大戰、叫車大戰、共享單車大戰、社區團購大戰，再到後來的造車大戰和現今的大戰。熱鬧的大模型降價潮是否能再次「便宜」消費者？中小企業、雲端廠商、大模型廠商，誰才是真正的贏家？

而隨著降價潮帶來的推理成本的降低，大模型商業化的進程也許加速C端應用的爆發。

誰也沒想到，大模型降價潮的多米諾首先被一家小公司推開了。

5月6日，幻方旗下DeepSeek發表的DeepSeek-V2，其價格為GPT-4-Turbo的近百分之一。 5月11日，智譜AI大模型開放平台也將入門級產品GLM-3 Turbo模型呼叫價格下調80%。

中國大模型廠商價格戰隨即開啟。 5月15日，在春季火山引擎Force原動力大會上，字節主力模型在企業市場定價只有0.0008元/千Tokens，比行業價格低99.3%，讓大模型從「以分計價」進入到「以厘計價”階段。

其他大廠紛紛跟進，5月21日，阿里雲宣布將旗下通義千問的多款商業化及開源模型進行大幅降價，其中對標GPT-4的商業化模型Qwen-Long的API輸入價格從0.02元/千Tokens降至0.0005元/千Tokens，下降97%；輸出價格從0.02元/千Tokens降至0.002元/千Tokens，下降90%。同時，百度智能雲也發佈公告稱，百度文心大模型的兩款主力模型ENIRESpeed、ENIRElite將全面免費，並立即生效。

騰訊、科大訊飛等廠商也宣布降價。科大訊飛宣布訊飛星火API能力正式免費開放，訊飛星火Lite API永久免費開放，頂級版（Spark3.5 Max）API價格為0.21元/萬Tokens。

又是降價，又是免費，「虧本買賣」的廠商們是要把大模型推向免費時代嗎？

仔細分析下，率先降價的豆包大模型只是降低輸入價格，輸出價格降幅並不明顯。阿里雲降低了輸入和輸出價格，但Qwen-Max的輸出價格並沒有降低，這是千問系列當中參數規模最大、成本最高的模型，百度降低了也是兩款參數規模較小的模型，文心4.0並不在此次降價範疇。大幅降價的都是小規模模型，雖然對外聲稱水準可以對標GPT-4，但實際上連GPT-3.5都不如，模型水準不達標，根本無法在實際的生產環境中運作。

降價的誠意讓人懷疑，看起來像拿幾個不好吃的小菜出來，還聲稱可以免費吃飯。難怪網友懷疑，大模型企業把開發者和企業吸引過來使用，或許就要開始卡調用速度、推理速度、任務處理量等關鍵指標了。「逼你變成vip，再逼你成為svip」的套路很讓人熟悉。

目前，AIGC產業的商業模式主要包括按呼叫量收費、SaaS （Software as a Service）訂閱收費、加值服務和解決方案等多種形式，涵蓋了從內容生產公司到一般消費者的廣泛客戶群。

以OpenAI為例，其主要收入來源有三：一是針對C端的會員收取訂閱服務費用；二是為企業端開發者提供API呼叫服務，透過付費接取OpenAI埠後，B端用戶可在金融、醫療、繪畫等領域調用GPT系列大模型、DALL·E系列文生圖模型、Whisper語音辨識模型進行應用開發，這也是OpenAI最核心的業務；三是來自微軟Azure雲端服務的分成。憑藉這三項主要業務，2023年OpenAI收入突破了13億元。

由於處於相同的賽道，目前中國大廠的收費模式也基本上類似OpenAI，但無論是C端或B端，中國大模型發展的瓶頸早已是現實。大模型推理價格的降低，主要是因為各廠商為了搶佔市場佔有率、加速商業化進程。

一個現實是，中國大模型的使用人數還是太少且用戶成長乏力，使用數據不夠豐富。其次，中國大模型在應用層面，也就是基於AIGC應用端的使用者數量也不高。因此，透過免費擴大用戶規模，增加用戶互動和訓練資料是這次價格戰的主要目標。

市場普遍認為，價格戰的本質是中國大模型技術差異不大，使用者難以感知技術上的區分。網路大廠透過雄厚的資金，快速削弱並踢出資金實力薄弱的公司。從當年的手機大戰、叫車大戰、共享單車大戰、社區團購大戰，再到後來的造車大戰都是相似的套路，背後都是技術差距過小導致的。

但大模型「價格戰」不只是簡單的市場競爭策略。不少人認為，降價標誌著國產大模型發展的商業化轉折點已到。申萬宏源研究所資訊化研究部總監、TMT產業首席分析師劉洋在公開訪談中表示，中國大模型企業重視產業價值優於財務價值，用戶端以及增值版本已經到了可以大規模推廣的時候。科大訊飛在發表會中表示，目前公司基於國產自主可控大模型工程化優勢，訊飛星火API能力正式免費開放，有利於幫助開發者降低呼叫成本，驅動產品創新驗證，加速大模型賦能及AI普惠化的到來。

人類每一次技術進步的結果，就是技術成本的不斷降低，大模型同樣遵循著一種「摩爾定律」和規模效應。 OpenAI等國外公司早已率先實現了降價，模型能力和算力成本的雙重困境下的中國大模型敢於降價，未嘗不是算力成本下降的結果。

對於堅持做大模型的雲端廠商來說，搶佔市場份額之外，更大的算盤其實在公有雲市場。

公有雲是大模型的技術基礎。 OpenAI發布4o大模型後，引起了社交媒體的一段鼓吹，但亦有專業人士指出，基於Transformer架構下的ChatGpt如果一直依賴公有云，就必然要面對大量用戶使用時低延遲無法得到滿足的現實。

公有雲在生成式人工智慧時代神經網路和啟動機器般基石作用的體現。因此，大模型產業的快速發展，公有雲仍然是龐大的獲利方。如果大模型應用真正爆發，AI推理市場也將迎來爆發，打造了具有基座大模型能力的公有雲廠商，透過公有雲+API的模式，才能走出新的成長曲線，獲得更大的獲利空間。以阿里雲為代表的雲端運算廠商，透過從底層算力、AI平台再到模型服務的不斷創新，同時AI也反哺了雲端從管理、應用、運算、基礎架構能力的提升。

像叫車大戰時用戶能極低價格打車一樣，每次價格大戰都是消費者再次收割紅利的時候，但不同的是，此次大模型的降價也許受益者並不是普通消費者。

一直以來，大模型面臨的尷尬是：用戶成長乏力不可避免，寫複雜的提示詞仍然是一般用戶最大的障礙。目前面向C端的主要是各手機廠商植入式的AI助手，但這些AI工具難以從消費者手中變現。

大模型降價究竟誰能得利？

透過AIGC 產業鏈中各層級關係來看，目前位於產業最底層的是基礎設施層，核心是支撐算力的AI伺服器，如CPU、GPU等，此產業領域以輝達和AMD為代表；往上是需要許多頂尖科學家進行長時期投入的模型層，國外的OpenAI和Google以及中國大廠目前主要在這一領域競爭。基於大模型的應用層，則是致力於解決C端用戶的消費終端以及為B端用戶提供產業解決方案。

對於大模型產業來說，僅僅具有技術的先進性並不能帶來應用的落地，如果不能降低大模型的推理成本，任何商業化都將是一種昂貴的嘗試，尤其是C端應用，成本可能是個無底洞。

由此可見，大模型全面降價最大的利多仍是進行應用開發的中小企業，成本的降低有助於這一類企業的百花齊放。

以AI大模型為技術底座打造具針對性的應用軟體，最典型的就是今年首個爆火的國產生成式AI產品Remini。醜萌搞怪的黏土風濾鏡，一躍讓Remini直接衝上了中國iOS免費APP下載榜榜首。 Remini的爆火讓人們想起了另一款圖像生成軟體妙鴨，僅用9.9元和20張日常照就可以生成自己的“數位分身”，效果堪比市場價數百元的藝術寫真。和妙鴨一樣，Remini的結局也許只是曇花一現，和那些不溫不火的AI應用產品一起，讓人不得不對生成式AI的商業化應用路徑及其穩定性擔憂。

所以API貴是限制應用端發展的主要原因嗎？顯然不是。正如阿里巴巴原副總裁賈揚清所言，今天企業在使用AI時，並不是成本驅動的。企業如果搞不清怎樣才能產生業務價值，再便宜也不過是一種浪費。

360董事長兼CEO也公開表示了自己對當下大模型產業的看法。他認為，公用大模型到應用大模型轉變才是產業正確的想法。針對C端用戶，需要找到用戶需求進行個人化客製化；另一方面為企業客製化專業的大模型並進行私有化部署。「未來的企業內部應該擁有多個垂直大模型，這樣的模型既要簡約又要便於使用，提高企業內部效率。」例如，最近國產自研的聚焦財稅領域的垂類大模型——BPai財稅大模型。

既要抓模型技術，又要抓商業應用，價格戰之後的路還很遠。

“便宜贏得不了商戰，誰能落地獲得利潤才是笑到最後。” (零態LT)