全面趕超GPT-4 Turbo? 通義千問(wèn)也追上來(lái)了

0 評(píng)論 1714 瀏覽 1 收藏 8 分鐘

近日,阿里云正式官宣發(fā)布通義千問(wèn)2.5,并表示該模型性能全面趕超GPT-4Turbo。不過(guò)在這積極的動(dòng)態(tài)背后,阿里的AI之路,仍然不能忽略來(lái)自其他家友商的壓力。

阿里云,當(dāng)然不能落后。

在百度文心一言、商湯日日新等當(dāng)下國(guó)內(nèi)主流大模型,陸續(xù)產(chǎn)品迭代升級(jí)至“全面對(duì)標(biāo)GPT-4Turbo”之后,阿里云也入場(chǎng)了。

近日,阿里云正式官宣發(fā)布通義千問(wèn)2.5。

阿里云方面表示,該模型性能全面趕超GPT-4Turbo。

據(jù)介紹,與通義千問(wèn)2.1版本相比,通義千問(wèn)2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%;與GPT-4相比,中文語(yǔ)境下,通義千問(wèn)2.5文本理解、文本生成、知識(shí)問(wèn)答及生活建議、閑聊及對(duì)話、安全風(fēng)險(xiǎn)等多項(xiàng)能力趕超GPT-4。

在權(quán)威基準(zhǔn)OpenCompass上,通義千問(wèn)2.5得分追平GPT-4Turbo,阿里云表示,這是國(guó)產(chǎn)大模型首次在該基準(zhǔn)取得該項(xiàng)成績(jī)。

很明顯,國(guó)內(nèi)通用大模型的“跑分”競(jìng)賽,已經(jīng)到了白熱化的階段。

正如此前kimi引領(lǐng)的長(zhǎng)文本處理能力上,文心一言、通義千問(wèn)也隨之跟進(jìn),將長(zhǎng)文本能力分別開(kāi)放至500萬(wàn)、1000萬(wàn)一樣,在大模型賽道上,在追趕OpenAI的路上,通用大模型玩家都不容絲毫松懈。

當(dāng)然,“跑分”再?gòu)?qiáng),也得落地。

在基礎(chǔ)能力之外,此次升級(jí)的通義千問(wèn)2.5還拓展了文檔處理、音視頻理解、智能編碼等多種能力。

比如文檔處理上,通義千問(wèn)2.5支持單次最長(zhǎng)1000萬(wàn)字、100個(gè)文檔,覆蓋PDF、Word、Excel等多種文件格式,可解析標(biāo)題、段落、圖表等多種數(shù)據(jù)格式。

音視頻理解方面,通義千問(wèn)2.5融合語(yǔ)音、LLM、多模態(tài)、翻譯能力,具備實(shí)時(shí)語(yǔ)音識(shí)別、說(shuō)話人分離功能,能夠提取全文摘要、總結(jié)發(fā)言、提取關(guān)鍵詞等,可同時(shí)上傳處理50個(gè)音視頻文件。等等。

C端上,阿里云還將原“通義千問(wèn)APP”升級(jí)為“通義”APP,將通義實(shí)驗(yàn)室文生圖、智能編碼、文檔解析、音視頻理解、視覺(jué)生成等全棧能力“All in one”,目標(biāo)是成為每個(gè)人的全能AI助手。

并且是放出了免費(fèi)大招。

AI算力的高成本,有目共睹,尤其是迭代至更智能的GPT4后。有數(shù)據(jù)顯示,OpenAI的GPT4 API價(jià)格是Chat-GPT API 使用價(jià)格的15-30倍。

在業(yè)內(nèi)人士看來(lái),生成式AI產(chǎn)品收費(fèi)是大勢(shì)所趨,訓(xùn)練和運(yùn)行大模型需要大量的計(jì)算資源,包括高性能服務(wù)器、大規(guī)模數(shù)據(jù)集和算法工程師團(tuán)隊(duì)等,如果不收費(fèi),沒(méi)有任何一家企業(yè)能夠持續(xù)燒錢提供服務(wù)。

目前在GPT4水平能力上,OpenAI采取了每月20美金的收費(fèi),百度在去年11月上線文心一言專業(yè)版,定價(jià)59.9元/月,連續(xù)包月優(yōu)惠價(jià)為49.9元/月,同時(shí)還推出文心一言和文心一格的聯(lián)合會(huì)員,價(jià)格為99元/月。

而同為國(guó)內(nèi)主流互聯(lián)網(wǎng)大廠,阿里則選擇了免費(fèi)路線,目的自然是希望通過(guò)免費(fèi),快速擴(kuò)大C端的用戶規(guī)模。

原因也很好理解。

作為通用大模型,基于阿里云以及釘釘在B端的多年深耕,尤其是釘釘早就完成了接入,通義千問(wèn)在B端是非常有優(yōu)勢(shì)的。

此次2.5版本的發(fā)布上,通義千問(wèn)就打出了“最受企業(yè)歡迎的大模型”旗號(hào)。

數(shù)據(jù)顯示,目前,通義大模型已通過(guò)阿里云服務(wù)企業(yè)超9萬(wàn)、通過(guò)釘釘服務(wù)企業(yè)超過(guò)220萬(wàn),通義開(kāi)源模型累計(jì)下載量突破700萬(wàn)。通義落地應(yīng)用進(jìn)程加速,現(xiàn)已進(jìn)入PC、手機(jī)、汽車、航空、天文、礦業(yè)、教育、醫(yī)療、餐飲、游戲、文旅等領(lǐng)域。

但在C端,相比較百度的文心一言,通義千問(wèn)缺乏在C端產(chǎn)品應(yīng)用場(chǎng)景的積累。去年12月,文心一言用戶便突破1億,今年4月,這一數(shù)據(jù)便翻番至2億。

顯然在用戶規(guī)模上,文心一言已經(jīng)領(lǐng)先不少。這自然就給通義千問(wèn)等通用大模型造成足夠的壓力。免費(fèi),也就不失為與文心一言爭(zhēng)奪用戶的一條有效路徑。

而在這背后,阿里在確立“AI電商”的戰(zhàn)略方向之后,AI這一環(huán)已然不容有失。

不僅僅是阿里云以通義大模型在通用大模型賽道參與“內(nèi)卷”,阿里也瘋狂地在市場(chǎng)上以投資的方式對(duì)大模型創(chuàng)業(yè)公司獨(dú)角獸進(jìn)行“掃貨”。

公開(kāi)信息顯示,截止目前,阿里已經(jīng)投了5家國(guó)內(nèi)市場(chǎng)上的大模型獨(dú)角獸,分別是MiniMax、月之暗面、智譜AI、百川智能、零一萬(wàn)物,是投資最為激進(jìn)的大廠。

并且在這些獨(dú)角獸的相關(guān)融資過(guò)程中,阿里也多以領(lǐng)投方的角色出現(xiàn)。

足見(jiàn)阿里的決心。

一方面是對(duì)AI的看重,另一方面,也跟阿里在大模型賽道上的戰(zhàn)略有關(guān)。

無(wú)論是通義千問(wèn)的免費(fèi),還是阿里掃貨大模型獨(dú)角獸,阿里最大的目標(biāo)不是靠自研模型賺錢,而是為一眾大模型提供云計(jì)算能力,把握成為AI算力基礎(chǔ)設(shè)施的機(jī)會(huì)。

但無(wú)論如何,都需要建立在通用大模型產(chǎn)品真正跑出來(lái)的前提下。

放到通義千問(wèn)這個(gè)“親兒子”這里,壓力也就不僅僅來(lái)自文心一言等友商,也來(lái)自于集團(tuán)投資的其他“兄弟”。

本文由人人都是產(chǎn)品經(jīng)理作者【藍(lán)媒匯】,微信公眾號(hào):【AI藍(lán)媒匯】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
145562人已学习15篇文章
作为产品经理,你多多少少得懂点技术。
专题
18994人已学习13篇文章
客户服务在整个客户生命周期主线中是一项持续的互动行为。本专题的文章提供了做好客户服务设计和体验的思路。
专题
12596人已学习13篇文章
通过仪表盘,用户可以查看并分析产品的数据和图表,还可以通过控件来控制数据的显示、过滤等功能。本专题的文章分享了仪表盘设计指南。
专题
16150人已学习11篇文章
本专题分享了算法相关的知识,汇总了算法的基础知识和进阶知识。
专题
11389人已学习12篇文章
本专题的文章分享了情人节的营销思路。