今年6月,在2023騰訊股東大會(huì)上,當(dāng)被問及大模型進(jìn)展時(shí),馬化騰曾說,“我們一樣在埋頭研發(fā),但是并不急于早早做完,把半成品拿出來展示。”
如今雖遲但到,鵝廠終于也推出了自己的通用大模型。9月7日,騰訊在一年一度的全球數(shù)字生態(tài)大會(huì)上,正式“亮相”了自己的混元大模型。
【資料圖】
騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生介紹:混元大模型通過騰訊云對外開放,并已接入了騰訊廣告、游戲、金融科技、騰訊會(huì)議、微信搜一搜等產(chǎn)品。
湯道生表示,該大模型產(chǎn)品是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens,將作為騰訊云MaaS服務(wù)的底座,支持API直接調(diào)用,以及專屬大模型產(chǎn)品應(yīng)用構(gòu)建。
如今一個(gè)普遍行業(yè)共識是:大模型正在改變云生態(tài)。它有可能成為互聯(lián)網(wǎng)云廠商在價(jià)格戰(zhàn)之外謀求份額增長的新動(dòng)力,并為云計(jì)算行業(yè)帶來全新的變革契機(jī)。
而在今年以來,騰訊云在公有云業(yè)務(wù)(IaaS+PaaS)市場份額下降的現(xiàn)實(shí)基礎(chǔ)上,抓住此次時(shí)機(jī),也顯得尤為重要。騰訊云總裁邱躍鵬也在會(huì)上表示:“云是大模型的最佳載體,大模型將開創(chuàng)下一代云服務(wù)的全新形態(tài)。”
為何騰訊姍姍來遲
據(jù)賽迪顧問數(shù)據(jù)顯示,截至 2023 年 7 月,中國累計(jì)已經(jīng)有130個(gè)大模型問世。
今年上半年,在百度、阿里等一眾大廠爭發(fā)大模型之時(shí),“不趕風(fēng)頭”的鵝廠,顯得較為謹(jǐn)慎。不過相較于各家大廠普遍踏足的通用大模型,騰訊從一開始就把大模型重心引向了B端應(yīng)用。
6月19日,騰訊云首次公布了行業(yè)大模型進(jìn)度,發(fā)布了TO B客戶解決方案:騰訊云MaaS(Model-as-a-Service,模型即服務(wù)),覆蓋了金融、文旅、政務(wù)、傳媒、教育等10大行業(yè)的多個(gè)模型,并提供了超過50個(gè)解決方案。
那時(shí),行業(yè)和客戶已經(jīng)有很多關(guān)于大模型的需求。在經(jīng)歷幾個(gè)月的在騰訊文檔、會(huì)議等應(yīng)用磨練后,騰訊才終于有信心把大模型開放出來,服務(wù)更多企業(yè)。
▲圖注:騰訊集團(tuán)副總裁蔣杰
據(jù)騰訊副總裁蔣杰介紹,彼時(shí),已經(jīng)收到了很多客戶需求詢問,但還沒有對模型進(jìn)行全面深度的評測,處于半研發(fā)半應(yīng)用的階段。
“騰訊的混元的大模型的體系,一開始不光是為了業(yè)界做一個(gè)發(fā)布,甚至評測、去打榜,我們一開始就是根據(jù)騰訊企業(yè)自己的自身的應(yīng)用,去做了一個(gè)這樣的研發(fā)和匹配,去做一些跟大模型更深度結(jié)合的應(yīng)用,才能夠去抵消整個(gè)大模型高昂的設(shè)備、訓(xùn)練、人員的成本。”蔣杰說。
早在2022年4月,騰訊首次對外披露了旗下“混元”AI大模型的研發(fā)進(jìn)展,完整覆蓋了NLP(自然語言處理)、CV(計(jì)算機(jī)視覺)、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)模型。但類chat大語言模型則是遲遲未推出。
事實(shí)上,過早地推出大模型,也容易“翻車”,出現(xiàn)“幻覺”。
所謂“幻覺”,簡單說就是大模型“胡言亂語”。為了確保大模型更加可靠,降低“幻覺率”是大語言模型的重中之重,即便不能徹底解決,但也盡力從概率上降到最低。
據(jù)介紹,騰訊混元的“幻覺率”相比主流開源大模型可降低30%至50%, 用的是自研的“探真”技術(shù)來解決“幻覺”。
“外界其實(shí)一般多會(huì)用到知識圖譜,甚至搜索外掛來讓模型的檢索支持能力變得更強(qiáng),騰訊也會(huì)用,但不能用的比例很高。我們一定要在整個(gè)的大模型的預(yù)訓(xùn)練階段把這個(gè)問題解決掉,控制掉。現(xiàn)在看到很多家開源模型和廠家發(fā)布的模型,搜索增強(qiáng)用到10%以上甚至更多,但這個(gè)會(huì)導(dǎo)致出現(xiàn)不一樣的幻覺。”蔣杰說。
終局還是云之戰(zhàn)
如今,大模型與To B的結(jié)合,已經(jīng)越來越成為行業(yè)共識。在國內(nèi)大模型之戰(zhàn)打到焦灼之時(shí),最近OpenAI 也推出了ChatGPT企業(yè)版,開始探索To B市場。
根據(jù)第三方網(wǎng)站 SimilarWeb 的監(jiān)測數(shù)據(jù),今年7 月,OpenAI 網(wǎng)站與移動(dòng)客戶端流量月環(huán)比下降了10.35%。8月中旬,市場調(diào)查分析機(jī)構(gòu) Gartner 也在發(fā)布的生成式 AI 炒作周期報(bào)告中指出,當(dāng)前大模型發(fā)展已達(dá)到“膨脹預(yù)期峰值”,在未來的兩到五年內(nèi),要么實(shí)現(xiàn)轉(zhuǎn)型,要么跌入幻滅的低谷。
當(dāng)下,前有ChatGPT企業(yè)板,后有開源的Llama2(Meta 的大語言模型),整個(gè)大模型行業(yè)門檻降低,市場則陷入了營收難的境地。
云廠商們也開始意識到 , 相較于難以預(yù)見的大模型商業(yè)化落地前景, 云作為最前端可以售賣的 To B產(chǎn)品, 更容易盡早賺錢。大模型的發(fā)展需要依靠算力、算法和數(shù)據(jù)的支持,這都需要云計(jì)算應(yīng)用場景。也就是說,大模型之戰(zhàn)的最終落地,還是要搶奪公有云市場。
而今年以來,隨著個(gè)人、中小企業(yè)用戶使用量減少,增速放緩,加之“政務(wù)云”的崛起,阿里云和騰訊云的市場份額均有所減少。
從資源利用率以及趨勢來看,私有云難以成大勢,公有云依然是主流市場。
根據(jù)中國信通院最新發(fā)布的《云計(jì)算白皮書(2023年)》,2022 年IaaS 市場收入穩(wěn)定,規(guī)模在2442億元,是PaaS+SaaS的3倍,依然占據(jù)主導(dǎo)地位。
IaaS靠規(guī)模效應(yīng)賺錢,但投入過程長。但在激烈競爭下,產(chǎn)品同質(zhì)化嚴(yán)重,云廠商不得已通過價(jià)格戰(zhàn)來搶占市場。今年4月,新一波的降價(jià)潮開啟,先是阿里云帶頭降價(jià),京東云、騰訊云、華為云、天翼云等緊隨其后。
IaaS 業(yè)務(wù)的高度雷同,低價(jià)策略難以可持續(xù)發(fā)展,騰訊云也開始探索不同的路線。PaaS、SaaS業(yè)務(wù)雖然體量小,但毛利率更高。但這兩塊業(yè)務(wù)投入大,騰訊云仍處于艱難的“爬坡”時(shí)期。
也因此,騰訊推出大模型,以提效為第一要義。“大語言模型更有商業(yè)永遠(yuǎn)價(jià)值的應(yīng)該是提效,提效是更有價(jià)值的。”
蔣杰提到,騰訊是一個(gè)海量高并發(fā)的業(yè)務(wù)。“開源的很多的架構(gòu)是不適應(yīng)騰訊的體量,所以一定要走出一套基于自主體系的研發(fā)的道路,才能夠去應(yīng)對這些海量高并發(fā)的業(yè)務(wù)的沖擊。”
大模型之戰(zhàn)的同質(zhì)化,讓大廠間的競爭身位也難分軒輊。
蔣杰提到,如果未來對大語言模型進(jìn)行評分,是一個(gè)綜合實(shí)力的過程,“可能未來幾個(gè)大的頭部的廠家,評分差距只可能僅僅1分和2分的差距。這個(gè)版本他高了1分,下一個(gè)版本另外一個(gè)國內(nèi)廠家就是再高了一兩分,這是一個(gè)不斷博弈和循序漸進(jìn)的過程。所以其實(shí)隨著大家投入這種資源不一樣,摳的細(xì)節(jié)不一樣,到最后這個(gè)差異才會(huì)出來。”
作者 | 趙子坤
編輯 | 李 原
運(yùn)營 | 解一帆