實(shí)力強(qiáng)的大模型都有哪些超能力?

0 評(píng)論 829 瀏覽 1 收藏 7 分鐘

現(xiàn)階段,許多類型的大模型涌現(xiàn)在市面上,那么,這些大模型可以分成哪些類型?實(shí)力強(qiáng)的大模型,又都具備哪些能力呢?這篇文章里,作者分享了他的看法,一起來看。

前幾日,人工智能研究公司OpenAI CEO山姆·奧特曼(Sam Altman)在談及人工智能這項(xiàng)技術(shù)的潛力以及人們對(duì)它的擔(dān)憂時(shí),曾表示“AI發(fā)展速度快得嚇人,就像停不下來的龍卷風(fēng)?!笨梢?,人工智能正在以它超前的速度改變世界。

在經(jīng)歷了年初人工智能之大模型風(fēng)口的狂熱之后,截止2023年10月,我國(guó)擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所達(dá)到了254家,這其中既有通用大模型(AGI),也有垂直大模型。換句話說,就是每隔幾天,國(guó)內(nèi)就會(huì)官宣一個(gè)新的大模型。

但越來越多的從業(yè)者會(huì)發(fā)現(xiàn),大模型的智能化與商業(yè)化落地其實(shí)并沒有那么快速。

隨著大模型技術(shù)的演變和業(yè)務(wù)的落地推進(jìn),會(huì)像大浪淘沙般將一些參與主體過濾出去,最終,只有手握硬核技術(shù)實(shí)力和資源的企業(yè)才能活下去。

那么,現(xiàn)階段國(guó)內(nèi)如此多的大模型,都有哪些類型?哪家實(shí)力最強(qiáng)呢?

一、通用大模型與垂直大模型,哪個(gè)有前景

據(jù)稱,國(guó)內(nèi)大模型已近80個(gè),這其中包括通用大模型和垂直大模型(也叫專用大模型)。它們二者相比,孰高孰低呢?其實(shí)二者如果從應(yīng)用角度出發(fā)考慮的話,都具有各自的特點(diǎn)。

通用大模型(AGI)是指適用于多個(gè)領(lǐng)域或行業(yè)的大模型,例如自然語(yǔ)言處理領(lǐng)域的預(yù)訓(xùn)練模型、圖像識(shí)別領(lǐng)域的預(yù)訓(xùn)練模型等等。

這種大模型具有更廣泛的的應(yīng)用范圍,可以在多個(gè)領(lǐng)域內(nèi)發(fā)揮作用。我們常常聽到的人工智能公司OpenAI開發(fā)的ChatGPT、阿里的通義千問、百度的文心一言等都是通用大模型的代表。

而垂直大模型則是針對(duì)某個(gè)特定的領(lǐng)域或行業(yè)研發(fā)的大模型,例如醫(yī)療領(lǐng)域的大模型、金融領(lǐng)域的大模型、物流領(lǐng)域的大模型等。

就比如物流場(chǎng)景涉及單證(物流活動(dòng)中進(jìn)行物流承運(yùn)而出具的合法效力文件,比如物流承運(yùn)合同單證等)多、格式不統(tǒng)一等問題,物流大模型可以對(duì)其進(jìn)行快速、準(zhǔn)確的標(biāo)準(zhǔn)化識(shí)別,提供結(jié)構(gòu)化數(shù)據(jù)并做好糾錯(cuò)、補(bǔ)全等操作,保障后續(xù)運(yùn)單分單、履約配送等環(huán)節(jié)的質(zhì)量和效率。

這種大模型在特定領(lǐng)域內(nèi)具有更高的專業(yè)性和針對(duì)性,能夠更好地解決該領(lǐng)域內(nèi)的特定問題,因此垂直大模型也叫專用大模型。

可以說每個(gè)跟每個(gè)之間非常難以比較,所以也很難說哪個(gè)最有前途。

二、實(shí)力強(qiáng)的大模型擁有哪些超能力

雖然無法使用一個(gè)定律來比較出通用大模型與垂直大模型的優(yōu)劣,但實(shí)力強(qiáng)的大模型擁有的“超能力”總是具有共性的,也具有更廣闊的發(fā)展?jié)摿Α?/p>

1. 超大算力

相較于一般AI應(yīng)用,大模型應(yīng)用的訓(xùn)練及推理需要更強(qiáng)的算力支持,可以說算力決定了一個(gè)通用大模型的底線。

國(guó)內(nèi)提供云服務(wù)的阿里云、騰訊云自身就擁有超大算力,這是他們研發(fā)的大模型所具有的最大競(jìng)爭(zhēng)力。

2. 數(shù)據(jù)量大

訓(xùn)練大模型需要更大的數(shù)據(jù)量,更好的數(shù)據(jù)質(zhì)量,更多樣性的數(shù)據(jù)源。因此在大家算力都?jí)?、大模型架?gòu)差不多的情況下,誰若再加上數(shù)據(jù)量多、數(shù)據(jù)質(zhì)量高的優(yōu)勢(shì),便會(huì)相應(yīng)地提升大模型的質(zhì)量,大模型落地應(yīng)用的效果也就會(huì)越好。

3. 是開源大模型

還有一個(gè)考慮的因素是是否是開源大模型。開源由于源代碼公開,可以根據(jù)用戶的需求隨時(shí)修改和定制開發(fā),且一般是免費(fèi)的(免費(fèi)使用降低了大模型的使用門檻,例如國(guó)外的ChatGPT和國(guó)內(nèi)的文心一言的爆火恰就是因?yàn)樗褂帽憬?,人人只需注?cè)即可體驗(yàn)),可以讓更多的開發(fā)人員和用戶參與,提高大模型的質(zhì)量和穩(wěn)定性開源的大模型代表有阿里的通義千問。

閉源大模型則由開發(fā)公司維護(hù),雖然可以控制大模型的質(zhì)量和穩(wěn)定性,但如果不能不斷地提升自己的模型能力,不能保持長(zhǎng)期不可動(dòng)搖的領(lǐng)先性能,有可能會(huì)被開源取代。所以屬于閉源的大模型ChatGPT、文心一言等需要保持強(qiáng)勁的性能。

4. 是否擁有API接口

開放服務(wù)能力是評(píng)價(jià)大模型能力的重要要素之一,大模型開放了API接口可以幫助其提升開放性,改善對(duì)外服務(wù)能力。

API接口開放對(duì)于專業(yè)人員來說必不可少??蒲腥藛T可以利用其做大量的測(cè)試。個(gè)人創(chuàng)業(yè)者也可以利用接口將其運(yùn)用到實(shí)際的業(yè)務(wù)中。

相信在不久的將來,隨著大模型面臨的技術(shù)和成本問題被解決,相關(guān)的企業(yè)級(jí)應(yīng)用或消費(fèi)型應(yīng)用落地的節(jié)奏將會(huì)加快。這樣也會(huì)凸顯出一批批強(qiáng)大的大模型廠商和應(yīng)用型產(chǎn)品,而這些廠商和產(chǎn)品很大可能出自于今天這些已嶄露頭角的大模型產(chǎn)品。

作者:馬曉東;公眾號(hào):馬曉東國(guó)云數(shù)據(jù)CEO

本文由 @國(guó)云數(shù)據(jù)馬曉東 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!