這一次,騰訊要讓人人都能「用好」大模型



“ 2024年的大模型百花齊放、各出奇招,而騰訊卻想要走一條自己的路。 ”


今天的大模型To B 賽道,仍然是一個非共識的時代——大模型如何落地,給企業產生實際價值,即使一年過去,也沒有一個標準答案。

而廠商想用大模型開拓B 端市場,則大多從自己的基因和能力出發,各出奇招,至今已經有了幾條比較成熟的打法:

有些廠商,意在用更大、更強的基礎大模型做突破,以更好的泛化能力應對需求多樣的To B 市場;

有些廠商,則透過資料清洗、精調等手段,把大模型精調成具體行業的形狀,再用「大模型商店」讓客戶可以自由挑選,甚至自己做自己的定製化;

有些廠商,意識到了AI 原生應用的重要性,便依託自己的大模型能力,接連推出不少應用,快速登陸搶佔市場。

各廠商八仙過海,路徑各有千秋,賽道競逐至今,幾個流派仍然還未能分出勝負,非共識向著共識的收束仍在繼續著。

當人們討論到大模型To B,常常各持己見,有人說技術、有人說應用、有人說生態,難以爭出個高下;

而在這個紛爭的非共識時代,作為一家擁有豐富經驗的To B 大廠,騰訊卻想要走一條自己的AI 之路。


01 大模型工具鏈,捲到什麼程度了?

大模型賽道的火熱,最能讓人感受到的是AI原生應用和Agent產品的爆炸性增長,繁榮如同煙花升空,好不熱鬧。

作為看客,自然可以額手稱慶,感慨於國內大模型產業發展之迅速;而如果撥開鮮花和掌聲,著眼於實際的To B 生意,就能發現,AI 大模型在B 端市場的滲透率,則遠不如一年前預期的高。

在實際推進落地的工作中,騰訊自然也看到了這一點。

去年6月19日,騰訊雲向外界推出了“行業大模型”,一時間讓大家看到了大模型在行業落地的希望。雷峰網過去的報導《行業大模型落地肉搏:誰先紮進行業,誰就先入“咸陽”》就講到:“騰訊行業大模型給出的方案,是在平台上開放多個模型,企業在選用了更適合的模型後,可以針對自己的具體需求,進行定製化的訓練。

這條道路,也被不少追隨者所認同——紛紛開放大模型商店,「貨架」上擺滿了不少琳瑯滿目的模型以及原生應用。而實際的效果,正如今天所看到的一樣,還並不能非常完全地解決企業的問題。

而回到騰訊雲,在去年619——甚至是在製定AI 大模型戰略的第一天,他們應該就清楚,行業大模型想落地,必須往前再走走。

一方面,騰訊知道,一個模型就算再大,也無法滿足大To B 行業中眾口難調的多樣、複雜需求,同時也要考慮到Scaling Law 對於成本的消耗,於是去年6月19日,騰訊推出了自己的行業大模型,把大模型的資料、調優等能力交給使用者,讓用戶定製適合自己的大模型;

這樣的想法終歸很好,但卻遠不是大模型To B 的完成形態——不少IT能力稍弱的用戶很難做數據清洗、篩選,更別提模型的精調和評估,行業大模型再好,也不是能覆蓋大部分B 端客戶的「解藥」。

去年發佈產業大模型時,騰訊早就有捲起褲腿,深入To B 戰場的決心。而到了今天,騰訊則必須向深處更進一步,距離使用者更近,提供更一站式、傻瓜式的服務,做可以「開箱即用」的大模型產品。

在這一點上,騰訊則展現出了謹慎而克制的一面——從金融、醫療、教育等行業大模型為起點,騰訊不做大水漫灌,也不做激進探索,而是一步一個腳印,做單點的產業突破,聚焦使用者需求細節,站穩腳跟,小步快跑。

「騰訊始終以'產業使用',作為發展大模型的核心戰略。」在今天召開的騰訊雲生成式AI產業應用峰會上,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生說道。

而到了實際的產品發布,一站式AI智能體創作與分發平台「元器」、一條由三大引擎組成的大模型工具鏈,也被正式推出向公眾展示。

實際上,如果用心留意,工具鏈幾乎是每個大模型平台的標配——畢竟,沒有好的工具鏈支援,AI 原生應用就沒法在平台上落地發芽。而各大平台要爭奪使用者,工具鏈產品必須得捲,讓開發者用得舒服,才能轉化為平台上的活躍使用者,進而為平台帶來活力。

而騰訊雲大模型工具鏈的“卷”,則上升到了一個新的高度。

別人「卷」大模型,卷的是模型效率優化,卷精調的易用性,卷低代碼——甚至零代碼的用戶體驗。

而騰訊雲,除了這些“必修課”,還“選修”了不少別的“小課”。

以知識引擎為例,使用者輸入一系列檔案,就可以產生一個基於檔案知識的AI 助理。

舉個例子,一個保險業的客戶,只需將自己保險產品的說明書錄入知識引擎,再加上一些簡單的功能描述,按幾個按鈕,幾分鐘過去,就能獲得一個專屬於自己的AI “保險代理人”,而完全不必關注所謂數據清洗、模型精調等等“高大上”的操作。

而做好知識引擎,騰訊雲的殺招不在大語言模型能力上,而是檢索增強(RAG)和輔助檔案解析和理解的OCR 大模型。

整合RAG 進入大語言模型,對於大模型來說,並不是一個獨特的技術路線:透過對輸入檔案的檢索,減少大模型表現的浪費,並減少幻覺——而這兩點,都是B 端客戶使用大模型時,最重視的指標。

在接受採訪時,騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲就提到,在將大模型推向B 端時,遇到過兩個很大的難題:

一個是大模型廠商和客戶在行業Knowhow 上的資訊差、經驗差,讓大模型很難真正「落到地上」;

一個是客戶對於AI 的預期很高,都希望AI 可以一鍵解決自己的大部分問題,而這與實際上還有不少差距。

兩個問題統合起來,就把矛盾集中到了一個點:“如何讓AI 可以快速理解企業Knowhow,並用更低的成本、更簡單的操作來帶來價值。”

人們對AI 的想像,是把自己的資料輸入給人工智慧,人工智慧就能理解檔案,從而基於檔案的內容作答。而實際上,想要AI 像人一樣理解檔案的內容,卻不像想像中那麼簡單。

AI 要理解、輸出知識,首先需要精確地將資訊進行切分一個個的資訊塊,其次還得可以精確地檢索到用戶問題指向的內容。騰訊集結團隊,自研了Tencent RAG (TRAG)架構,為了讓客戶能省心、放心,騰訊在TRAG 做了不少新的嘗試:

在知識切分的角度,TRAG 用了相當暴力的方式,先讓AI 理解檔案的結構,理清各級標題,再對每個文字做語義級的拆分,在每個切片長度可控的前提下,讓AI 對資訊的理解不缺字漏字、斷章取義;

而在檢索的角度,TRAG 的工業級檢索已經支援4K 左右的規模,並繼承了多種檢索策略,在各種檢索的榜單上,也經常盤踞頭名的位置。

也正是這種對細節問題的堅持,讓騰訊知識引擎得以在大模型推理、生成能力不掉隊的前提下,可以在回復質量上完成突破——相比之前的AI 客服,騰訊方面的專家介紹道,知識引擎在客服領域的使用者滿意程度,上升到了之前的兩倍。

除了知識引擎,騰訊雲本次推出的圖像、視頻創作兩大引擎,也同樣各有千秋,服務了不少重點客戶並且獲得許多好評,本質上,也離不開對用戶需求細節的關注。

依託騰訊混元大模型的多模態能力,騰訊雲的圖像、視頻創作引擎,給用戶提供了圖像風格化、AI寫真、運動筆刷、圖片跳舞幾大功能,讓一般用戶可以用AI 改變過去拍照、拍攝影片的方式;

而生產力工具線稿生圖、視頻轉譯、視頻畫布拓展等能力,則讓專業使用者大幅提高了創作與生產效率,能切實地為產業帶來一波巨大的產能紅利。

就如上面提到的,相較於同賽道的競逐者,騰訊雲大模型To B 關注的領域和行業更加聚焦,以金融、醫療、教育等重點行業為錨點,不斷地升級技術、深入理解需求、完善產品,把打下的山頭站住、站穩,把每一步都走得踏實。

在金融業,騰訊與圓心惠保合作,讓AI 成為保險代理人的高效智囊。圓心惠保過去以傳統NLP 作答的機器人,回答精準率僅在57%,幾乎對錯「五五開」;而得到騰訊知識引擎的支援後,這個數字則提高至了85%,平均下來,給保險經紀人提效了50%。

而教育業同樣對大模型需求非常旺盛。河南省數位教育發展有限公司就在知識引擎的幫助下,僅僅兩三個月的前端開發,就成功地把AI 放進了教案生成、活動策劃、虛擬輔導員等教育活動全流程當中,讓人工智慧在教輔場景的採納率接近90%,而習題解析和百科問答的精確率則接近了95%。

有技術實力,也有下探行業Knowhow 和實際需求的耐心,騰訊的“穩”,就是決心要使用者危險,做開箱即用的“傻瓜式”產品,讓企業用好大模型的“最後一公里」能走的順暢、穩健。


02「傻瓜」產品,背後一定是硬實力

傻瓜式產品,是最符合世界對AI想像的場景-細枝末節的事情由人工智慧操心,人類只需要提供創業和構思,生產力就自然被解放了出來。

而要把AI 做得“傻瓜”,也絕不像人們想得這麼簡單——背後沒點硬實力、強支援,開箱即用的產品還真不這麼好做。

在平台支援的角度上,騰訊雲TI 平台在背後提供的超強能力,讓做成「傻瓜」產品成為了可能。

在今天的峰會上,騰訊也揭露了TI 平台的全新升級:

新增了三大類資料處理流程,簡化了100多種任務類型的資料配比;透過優化Prompt和提供Notebook代碼,降低了資料處理的複雜性;同時,支援任務排隊,提昇平台處理能力與穩定性。

資料處理鍊和精調工具鏈的全面升級,讓TI 平台有了做好這個爐台的底氣-讓知識引擎等等PaaS 產品,進一步降低B 端使用者使用大模型的門檻;

而在與知識引擎的聯調中,TI 平台也同樣擔任了大模型優化飛輪的一部分——支援客觀和主觀兩種評測方式,TI 平台可以結合業務難例和知識庫,進行端到端的效果評測,並且持續關注模型精調後的效果,讓使用者能及時理解、優化大模型的業務效果。

TI 平台給大模型的資料清洗、精調、評估帶來了全面、輕量化的升級;

而到了MaaS 層,產業大模型也被內建進了知識引擎,讓知識引擎可以針對具體的垂直領域,完成有針對性的效能優化。

例如,騰訊的金融業大模型,在金融輿情分析、投資顧問等場景下,有針對性地進一步強化了專業術語理解、數值計算、文案生成及合規性等方面的性能,讓降低了AI 產品的定製化成本,試圖打破AI To B 的行業「魔咒」。

有了TI 平台和產業大模型的加持,騰訊自己的混元大模型,同樣也是To B 戰場上,一個重要的利器。

經歷了另一輪全面升級,又在騰訊內部600個業務場景中開始落地,混元大模型今天已經分化成了hunyuan-pro、hunyuan-standard、hunyuan-lite等多種尺寸的版本,並已經在騰訊雲上,向企業和開發者全量開放。

「能文能武」的騰訊混元,在這一輪升級後,總體性能較之上代,又飛速提升了50%,部分中文能力已經可以追平GPT-4,距離世界領先的AI 水準更進一步,而Standard 版本開始支援256K 上下文的理解,在長檔案的理解和處理上也提效不少;

在多模態能力上,混元也開始支援圖片、影片、甚至3D 內容的生成,生成的影片長度可以達到16秒,效果也不輸不少競品。

除此之外,持續升級的還有騰訊的向量資料庫,和大模型資料向量化工具-在一系列技術加持下,騰訊和B 端客戶的距離,正通過一套完整的工具鏈生態,變得越來越近。


03 一年過去,騰訊變了嗎?

「我們肯定是沒變過的——騰訊自始至終的導向,都是要距離客戶更近。今天,我們提出了知識引擎等三大引擎以及一系列行業應用,和一年前一樣,都是為了使用者用AI的門檻進一步降低。

「我們還是要將產業大模型不斷地迭代,目的只有一個,就是做『距離產業更近的AI'。相比產業大模型,知識引擎距離使用者更近,未來可能還會有可以讓我們更進一步的成果。

To B 與To C 行業不同,不能“一招鮮吃遍天”,而是要隨時面對持續產生的新問題,做新的變化,跨過新的挑戰;

在這一點上,騰訊大模型To B 如果不“變”,或者說,不持續地進化,那麼終將被B 端市場無情的大浪淹沒。

從長遠來看,這一年,不管技術如何變遷,產品如何演進,騰訊的初心沒變,路線更沒變——通過不斷升級行業大模型能力和工具鏈、產品生態,完成小步快跑,逐個擊穿產業,完成滲透和突破。

而從基礎大模型到產業大模型,再到AI 智能體應用的演變,實際上是騰訊正堅持自己大模型To B 戰略路線的印證。

去年一年,業界已經目睹了盛行在AI 大模型賽道的“加速主義”,對“錯過”的恐懼支配了不少狂飆突進的廠商,讓整個賽道炙手可熱。

而面對新的激流,吳運聲似乎表現得相當淡定。當被問及「今年最大的KPI 是什麼」時,他的回答也一如騰訊雲的戰略氣質——冷靜,而克制:

我們今年最大的KPI,既不單純是技術,也不是市場或商業化,而是我們是否能真正讓客戶用得滿意。反過來說,只要客戶滿意,我們的技術自然可以得到滋養,市場覆蓋率和收入也自然就上來了。 (雷峰網)