解構商湯暴漲:讓AI幫助程式設計師提效,而不是取代他們
4月23日,商湯發表日日新SenseNova5.0,性能一舉超越GPT4,全面對標GPT4 Turbo。
隔日,商湯港股僅一上午暴漲31.15%直接暫停交易,截至發稿連漲三天。
在一眾對股價的分析討論中,絕大多數觀點認為商湯暴漲的主要原因是其大模型能力的飛躍,誠然國產大模型超越GPT4確實令人振奮,但或許,更重要的原因,是商湯在AI時代的定位——
提供全套AI落地,實現降本增效的解決方案。
相較於各類AI公司創造一個全新場景,或許對於人工智慧尚未普及的當下,利用大模型改造現存場景以提升生產力,才是產品視角下更現實的思路。
一台AI,等於一個初級程式設計師的年薪
大摩先前研究報告顯示,中國生成式AI應用的日活正在快速成長,但平均每日的使用時間大多只有短短的6-8分鐘。
這正說明對於一般人而言,本該成為先進生產力的AI工具,仍舊處於「嚐鮮」階段。
這不僅僅是AI所遇到的問題,絕大多數生產力工具在普通人手中都難逃“買前生產力買後愛奇藝的命運”,平板電腦的沒落,Vision Pro遇冷都是如此。
目前大多數引爆社群平台的AI應用,也都是娛樂為主,例如之前的「決戰拜年之巔」「舔狗模擬器」。
這些利用AI創造出的全新場景幾乎沒有發揮其作為先進生產力的能力,更好的思路或許還是應該利用AI來提升現有場景的效率。
譬如辦公應用。
對於絕大多數企業而言,使用Saas,甚至是外包等服務的出發點都出奇的類似:它能為我省多少錢?
這筆帳很好算,人力外包財務外包等公司大行其道,請一個外包和招三五個專員之間的人力費用差能夠清楚落在每年的財務報表中,但購買人力軟體或是財務軟體到底能省多少錢則是見仁見智的問題。
企業多將其歸類在IT費用中,而這筆費用通常只占公司營運成本的2%~5%,再怎麼折騰也是螺螄殼裡做道場。
因此對於Saas軟體而言,如何將自己的定位從“IT成本”轉換到“人力成本”,是當下最迫切的難題。而提供先進生產力的AI,與之高度契合,起到一個「10個人用AI工具,能夠帶來12個人的產出」的效果。
商湯給出的解決方案,是一台一體機。
簡單而言,商湯一體機系列產品就是一台部署在本地,預置搭載各類適用於不同場景的大模型,一方面是為了提供辦公場景使用AI提效的方案,另一方面則是出於資料需要私有化部署的安全問題所做出的考量。
一個典型案例就是商湯日前推出的「小浣熊家族」。
以程式碼小浣熊為例,它依托日日新基礎模型,專注於智慧程式設計助理功能,支援Python、Java、JavaScript、C++、Go、SQL等30+主流程式語言和VS Code、IntelliJ IDEA等主流IDE,實際應用中,可協助開發者提升程式效率超50%。
並以此為基礎,同步推出代碼小浣熊推理一體機輕量級版,與代碼小浣熊相同的編程助手功能,但部署於本地,主打高性價比、開箱即用、數據安全以及能夠完成國產化芯片的適配。
有趣的是,這台代碼小浣熊一體機售價35萬元,差不多剛好是一個初級程式設計師的年薪。
在醫療、政務、金融等產業,商湯同樣推出了對應的一體機產品,這些產品其實解決的都是同一個問題,也就是利用AI的資訊資料處理能力,實現更有效率的決策。
它們最終都依賴於商湯的基礎模型能力之上。
大算力+大模型雙輪驅動
商湯的模型能力,首先依託於其“大裝置”,也就是算力。
在今年3月的一次訪談中,山姆阿爾特曼明確指出算力將會成為未來的貨幣,並且成為全球最寶貴的資源。
假如算力價格異常高昂,那麼從商業角度考慮可能只會被用來解決癌症治療或發射火箭之類的重大事件,反之如果算力價格低廉,那麼大家才會用它來解決日常問題。
從這個角度來看,AI的落地和普及首先需要的是低成本的算力。
目前,商湯大裝置總算力規模在超過4.5萬塊GPU的加持下,達到12,000 petaFlOPS。
量化來看,這個算力可以支撐超過20個千億級參數大模型同時訓練,並支援兆參數大模型的全生命周期生成。
龐大的算力只是基礎,用戶真正需要的是低價的算力,多卡集群的效率就是算力成本的關鍵,兩張GPU互聯往往會產生1+1<2的結果,這種損耗往往導致了算力成本的激增。
而商湯實現了萬卡的超大集群互聯,並保持90%的加速效率。
在訓練穩定性上,商湯實現了超30天穩定訓練不間斷的能力,而出現訓練間斷時的診斷恢復時長也優化到了半小時。
在大模型推理服務上,商湯也實現了領先業界的推理極致優化,過去一年內推理服務的性價比提升了3倍,為客戶提供了業界性價比最優的大規模彈性推理服務。
在提供算力這項基礎設施之外,商湯為解決重複造輪子的問題,推出了雲端、端側、邊緣側全端基礎大模型矩陣。
使用者可以依照自己的需求選擇最適合自身場景的大模型進行微調,做到即取即用、開箱即用。
雲端大模型即商湯日日新5.0,在一眾評測基準中對標GPT-4 Turbo,並以此為基礎開發出一系列模型,例如對話模型SenseChat、多模態大模型SenseVision、擬人大模型SenseChat-Character、以及行銷、醫療、文生圖等一系列模型。
數量眾多的模型看似散亂,但其實商湯只是在當下最常見的一些AI應用場景中“打樣”,其目的則是說明在日日新基礎模型之上,可以輕鬆微調出一系列適合企業自身場景所需的形態。
與之類似,端側模型SenseChat-Lite面向手機平板智慧汽車等輕量場景,邊緣側產品「一體機」則是部署在本地,提供給資料需要保存在本地,有隱私需求的企業使用。
透過大裝置+大模型的雙輪驅動,給予不同企業最符合自身狀況的解決方案,最終實現「模型即服務」的商業模式。
每個行業都可以有一套“商湯模式”
商湯在商業化落地的嘗試早已開始。
近日商湯發布的2023年年報顯示,其生成式AI業務收入短短一年從零達到12億元,這塊收入主要來自於一些2B的場景,為企業提供AI解決方案。
例如小米的小愛同學,就是一個典型的B2B2C的場景。
先前與小愛同學的對話基本上停留在操控智慧家居,和簡單的知識檢索型的問答,能力非常有限,還經常出錯,比如那個經典段子:“我有21萬,小愛讓我買本田思域” 。
在這個過程中想讓小愛變得更有智慧有三個困難:反應速度、資訊收集、輸出內容處理。
商湯與小米小愛的合作正是基於這三個問題。
首先在接取商湯大模型後,小愛在使用者說完後能夠在兩秒內完成回應。其次在商湯大模型的資訊檢索能力輔助下,小愛生成的答案都會由明確的引用來源。最後在保證了時效性的同時,商湯大模型可供微調的能力保證了小愛不會攻擊友商。
另一個典型案例是商湯醫療領域大模型「大醫」。
面向醫師端,其拓展了臨床輔助決策、醫學文獻解讀、醫學統計助理等一系列全新使用情境。
不僅支援智慧分析解讀論文PDF文件,還可協助醫師在「0代碼」條件下完成複雜醫學資料統計並取得視覺化醫學統計圖表,成為醫師診療、科研工作的得力助手。
面向患者端,商湯科技推出健康管理小程序,在移動端實現用藥諮詢、體檢報告解讀、檢查檢驗結果分析、健康檔案管理等多樣化功能,為用戶打造“專屬AI健康管家”,實現全周期個人健康管理。
類似的場景涉及各個行業,例如在辦公場景中,商湯與金山辦公達成合作,內建在WPS 365各個場景中,譬如程式碼產生工具和文件表格管理。
又例如在金融領域,商湯與海通證券合作,在智能客服、合規風控、代碼輔助、展業辦公助理等領域助推業務落地,並共研智能投顧、輿情監控等行業前沿場景。
去年9月,紅杉資本曾發表過一篇文章,認為AI浪潮正轉向“第二幕”,即利用新技術端到端地解決現實社會中的問題。
但當時的紅杉認為,進展效果並不理想,大模型仍需要證明價值。
而商湯如今所做的,正是在各行業深入合作,將大模型與產業、應用場景結合,探索出一套解決現實問題的方案。 (遠川科技評論)