大模型賽道的參與者一度處於比以往更深的焦慮。在這一領域內,基礎技術研究動輒融資上億,而可行的商業模式,卻仍在空中摸索。
但三月的「長文」概念破圈,重新攪動了一池心意。
自3月18日,剛滿一歲的中國新創AGI公司月之暗面宣布旗下大模型Kimi智能助理開啟200萬字無損上下文內測後,國內各家大廠先後下場,秀肌肉一般宣布起各自在長文本領域的升級。
上傳輝達過去幾年的完整財報,讓Kimi成為輝達財務研究專家,幫用戶分析總結輝達歷史上的重要發展節點
3月中旬,阿里旗下大模型工具通義千問宣布,向用戶開放免費長文檔解析處理功能,支援約1000萬字的超長文檔處理;
百度向《科創板日報》透露,4月將在版本升級後開放長文本能力,文本處理範圍在200萬-500萬,是當下最高2.8萬字文檔處理能力的上百倍;
360智腦宣布內測500萬字長文本處理功能,並表示早在2月底,360AI瀏覽器已向用戶開放100萬字長文本閱讀和拓展功能。
被強烈的FOMO(Fear of Missing Out)情緒裹挾,這場大模型文本處理能力比拼,掀起二級市場一股猛烈的跟投風。三月下旬,與Kimi有關聯的上市公司被打包進「Kimi概念股」板塊,強勢拉漲AI應用板塊。與Kimi存在關聯的華策影視、掌閱科技、中廣天擇等多股,在18日後股價相繼迎來漲停。
高燒兩週後,如今「Kimi概念」逐漸降溫,但背後這個閃爍著「小天才」光環,由90後創辦人建立的、估值達25億美元的國內初創公司,無疑讓更多人看見低門檻投身大模型領域淘金的抓手。
對資本市場而言,2023年的初始基礎建設時期已經過去,這一領域的商業落地故事,才剛剛起勢。
01 長文本,關用戶什麼事?
在技術圈內,風頭正勁的長文本並不是一種稀奇物。
簡單來說,大模型支援的上下文視窗容量,可類比計算機的運行內存,也可理解為大模型的理解力與記憶力。在與大模型進行內容互動(如問答對話)的過程中,大模型有一個可容納的文字容量上限。這上限不僅關係到大模型單次處理文本的能力,也關係到大模型記憶連續對話的容量。
當大模型的長文本容量增加,該大模型在對話時可以考慮的上下文資訊就越多,越有助於產生有針對性的連貫對話,也能確保在這一容量內的文本信息丟失情況減小。用戶可以餵給大模型更多信息,而大模型根據這一用戶與機器的歷史互動,回以個性化解釋。
月之暗面CEO楊植麟曾詩意地表示,長文本(long context),是做成通用世界模型的第一步,「登月第一步」。
這一步,在技術圈內被認可為重要但並非獨特的一步。
正如曾經電腦內存在過去幾十年內漲了好幾個數量級一樣,越來越大的長文本容量同樣出現在大模型領域。各家均會發力做記憶升級,但受限於長文本對算力消耗大、成本高,真正入局卷基礎技術的公司有限,長文本也不是各家大模型的宣傳重心。
月之暗面則另闢蹊徑,看見了長文本技術在用戶端可以產生的影響,並實行了Kimi與長文本強綁定的宣傳策略。
早在2023年10月,推出Kimi應用的第一天,月之暗面便在官方公眾號上宣傳,「歡迎與Moonshot AI共同開啟Loooooooooong LLM時代」。
它高調宣稱,Kimi Chat是第一個支援輸入20萬漢字的智慧助理產品,其文字容量2.5倍於Cloude的100K,8倍於GPT-4的32k。
容量升級,導向的是更好的使用者體驗。月之暗面表示,當前大模型使用過程中的遺漏重要資訊、不支援長文本prompt輸入導致的場景設定不清晰、無法基於大量給定材料給出專業回應等問題,均會在大模型擁有足夠長的上下文輸入容量後迎刃而解。
這相當於一個記憶容量更大、理解能力更好的大腦。
「它很本質。」楊植麟如是說。
如此強調,是為了搶奪產品在使用者心中的定位。成立之初,月之暗面便定下了獨特的商業模式,不做目前看來商業模式更清晰的B端,而是在做基礎大模型研究的同時,面向C端發力,意圖通過技術提升,攻克C端用戶個人化服務的需求。
楊植麟曾表示,在大模型領域,基礎技術突破和提供個人化服務走的是同一條路。透過不斷升級這個“大腦”的“腦容量”,每個C端用戶都會獲得一個更能記憶與自己的互動歷史的模型,從而得到更獨特的、無法被復刻的反饋。
這是一招燒錢獲客的險棋。由於目前各家大模型C端應用同質化程度高,普遍為對話助手形式,在資金充裕的阿里、百度等大廠仍提供免費應用的情況下,各家公司不敢貿然進行收費。當公司將商業模式定在用戶端,暫時看來,其只能仰賴投資人的源源不絕的資金流入,以確保研發及營運的現金流。
根據《新浪科技》報道,月之暗面目前投放廣告獲客成本約10元,加上拉新後用戶問答產生的算力成本,每位用戶的獲客成本約為12-13元。
依照第三方資料平台七麥資料的用戶下載量預估,近一個月IOS端Kimi累計下載量超82萬,光是iPhone端日均獲客成本已超32萬,近一個月iPhone端獲客成本近一千萬。若加上安卓端、網頁端的營運成本,獲客成本更要上一級台階。
儘管費用不低,但這項數據在某種程度上驗證了月之暗面發展策略的有效性。
在文心一言、通義千問這類大廠產品已形成一定的用戶口碑的當下,Kimi憑藉其對長文本技術和使用場景的強調,在用戶心中營造出「精確+個人化」的觀感,為許多用戶找到了試用Kimi的理由。
此外,在發布Kimi的半年內,月之暗面進一步宣布升級Kimi長文本容量為200萬漢字,比今年2月谷歌Gemini1.5支持的100萬token還高。這項技術升級在用戶端完成了口碑累積與破圈。
根據AI產品榜(aicpb.com),2023年2月,Kimi在2月訪問量驟增一倍,增速在國內訪問量前十的AI產品中位居第一。
也正因這套脫胎於新創公司的軟體在用戶端獲得如此大的反響,各家大廠才按耐不住,參與進自家大模型長文本能力的展示中。
在許多投資人看來,科技已不是目前大模型下一步發展的困難點,更困難的在於找到適應市場的產品模式。
多位AI產業分析師向鹽財經表示,大模型技術領域的突破依賴人才、資金和數據,技術升級背後的邏輯往往能歸功於規模定律。在資本投資意願仍旺盛、商業模式尚不清楚的當下,新創公司和大廠各有優勢。
正如峰瑞資本投資合夥人陳石在Sora發布後所言,「這輪AI行情有一個突出的特點,就是『天底下沒有秘密』。」對擺出更大數據來「圍剿」Kimi的大廠而言,這不僅是秀實力,更是爭奪用戶市場的先聲。
02 搶灘入局,機會與恐懼
儘管Kimi激起了一陣水花,但在兩週內迅速降溫的概念股指數,展現了當下大模型領域尷尬的商業現狀:不想錯過,害怕做錯。
早在「Kimi概念」興起之前,大模型領域就已經經歷了數輪類似的技術比拼。如在更為吸睛的多模態大模型領域,國內大廠在2023年年底,已在文生影片、圖生影片領域暗暗角力。
2023年11月18日,字節跳動推出了視訊產生模型PixelDance,緊接在後,阿里上線Animate Anyone模型,並先後宣布開源圖生視訊模型I2VGen-XL和文生視訊模型ModelScopeT2V。
今年1月,大廠在文生影片、圖生影片領域角逐更甚,字節跳動、騰訊、百度相繼推出影片產生模式MagicVideo-V2、VideoCrafter2和UnivG,皆支援文圖產生影片。
站在未來的風口前,各家均不想錯過搶先的可能。但這也導致了在技術門檻不高、規模定律起主導作用的當下,企業堆疊大量資金與精力於其中,做出來的模型卻面臨「重複造輪子」的窘況。
更殘酷的是,當Sora這類支持生成60秒視頻,達成技術突破的大模型出現後,此前辛苦做出的“輪子”,也面臨被迭代風險。
對月之暗面這類技術信仰派的公司而言,大模型領域的種種廝殺故事,確實是在一次次驗證其創始人楊植麟的“第一性原理”,即未來屬於一個超級應用AGI(人工通用智能),而目前唯一要做的事是做到最強的技術能力,走向這個超級應用。
目前,外部整體投資意願收縮,這也導致大模型領域的投資人雖身處熱門賽道,也不得不在開始時便為自己多想退路。
根據投中研究院數據,2024年2月,中國VC/PE市場投資總規模年減33.17%,季減40.31%。
儘管AI領域展開的投資畫卷仍有吸引力,讓人工智慧成為當期細分領域下獲投規模最高的細分賽道,但冷靜的資本市場,也讓投資人更願意分散下注,期待在大模型應用領域跑出黑馬。
資本對重複造輪的厭倦與猶豫,正如市場派的投資者,金沙江創投主管合夥人朱嘯虎所言:「整出200多個大模型有啥意義呢?沒啥意義。但在應用層有很多創新。中國在數據和應用場景上是遠遠超過美國的。”
對技術派而言,大模型的終極意義或許在實現AGI,但在更實際的市場派看來,更終極的問題在於,「大模型的商業模式到底怎樣才有效」?
多位產業分析師向鹽財經表示,當前,大模型商業化尚處於萌發期,2024年可被看作大模型應用元年,資本與技術都已累積到一定程度,在迫切地尋找可行的商業模式。比起模糊不定的C端市場,目前發展垂域大模型,與產業結合,是較為可行的方向。
創道硬科技創辦人步日欣表示,目前的基礎大模型由於資料來源龐雜,是難以實現專業化應用的泛化大模型。因此,將大模型與垂直領域資料結合,培育出專業小模型,是一條能走出差異化的路徑。這類模型在預處理後可以面向B端客戶,而其內部資料的稀缺性,便是產品的護城河。
“這類似於上一個互聯網時代,利用大模型技術,在各個細分領域與行業耦合。”
這同樣需要儘早入局。步日欣指出,誰在產業內有足夠的數據積累,誰便更能在這場應用變革中佔據優勢。
至於基礎大模型的贏家將在出現在哪邊,人們觀感並不一致。步日欣表示,AI領域所需的資金投入遠大於先前SaaS發展時期,資本雄厚的傳統網路大廠,更有發展大模型的優勢。
艾媒顧問創辦人張毅則認為,在網路大廠提昇入局門檻的情況下,新銳企業有更強的融資能力、引才能力。這就像網路發展的早期階段,大廠尚未成型,新銳企業更願意試錯,而新的道路往往誕生於這無畏的嘗試中。
這場圍繞著Kimi而起的長文本大戰,背後湧動的是兩種發展觀念的對抗。站在技術果實成熟的前夕,原本漸趨固化的競爭格局,重新展現出許多可能性。(鹽財經)