追趕ChatGPT,我們的差距在哪里?
在OpenAI發(fā)布ChatGPT之后,國內(nèi)互聯(lián)網(wǎng)巨頭們也加速布局大模型應(yīng)用。那么,國內(nèi)目前有可以與ChatGPT“對(duì)弈”的大模型產(chǎn)品嗎?國內(nèi)目前已有的大模型應(yīng)用與ChatGPT之間,又存在著怎樣的差異或差距?一起來看看作者的解讀。
又一家中國互聯(lián)網(wǎng)巨頭在追趕ChatGPT了。
3月底舉行的博鰲亞洲論壇上,騰訊集團(tuán)高級(jí)執(zhí)行副總裁湯道生披露,騰訊正在研發(fā)AIGC以及大模型相關(guān)技術(shù),類ChatGPT的對(duì)話機(jī)器人也在醞釀中。
百度、華為,如今再加上騰訊,ChatGPT出現(xiàn)之后,中國的互聯(lián)網(wǎng)科技企業(yè)似乎一夜覺醒。不光公司,還有資本及創(chuàng)業(yè)大佬。
3月19日,創(chuàng)新工場(chǎng)董事長兼CEO李開復(fù)在朋友圈高調(diào)宣布,正在親自籌組中文版ChatGPT公司“Project AI 2.0”。重燃創(chuàng)業(yè)野心的也不止李開復(fù),美團(tuán)王慧文、阿里賈揚(yáng)清、搜狗王小川、京東周伯文均親自下場(chǎng),趕赴大模型賽道。
“大佬攢局”往往是賽道火熱的信號(hào),僅今年前三個(gè)月,上萬家新注冊(cè)的公司在經(jīng)營范圍中寫上了人工智能。企業(yè)如雨后春筍般涌現(xiàn),人才緊俏起來。應(yīng)了周鴻祎那句話:一人捅破窗戶紙,千軍萬馬獨(dú)木橋。
這一次不光是資本生意,還有需求催生。在人工智能上,以O(shè)penAI為代表的搶跑選手引領(lǐng)自然語言大模型風(fēng)潮,從產(chǎn)品上甩開中企老遠(yuǎn),而中國還沒有合格的ChatGPT滿足各行各業(yè)對(duì)AIGC的體驗(yàn)。
騰訊們、李開復(fù)們現(xiàn)在做大模型還來得及嗎?投入10年的李彥宏說,應(yīng)用更靠譜。但真正稀缺的,仍然是底層基礎(chǔ)設(shè)施。
一、互聯(lián)網(wǎng)大佬帶頭組隊(duì)
作為目前全球最火的自然語言大模型產(chǎn)品,ChatGPT至今不對(duì)中國用戶開放,背后的算法、芯片、數(shù)據(jù)更是全部被控制在美國公司手中。國產(chǎn)ChatGPT進(jìn)入需求井噴期,一大批中國公司趕來,有互聯(lián)網(wǎng)大廠,有資本大佬,也有創(chuàng)業(yè)公司,誰都不想錯(cuò)過這一次的AI革命。
3月19日,創(chuàng)新工場(chǎng)董事長兼CEO李開復(fù)在朋友圈宣布,成立Project AI 2.0公司,“不僅僅要做中文版ChatGPT,”他這個(gè)公司定位為AI 2.0全新平臺(tái)和AI-first生產(chǎn)力應(yīng)用的“世界級(jí)公司”,野心頗大。
一個(gè)月前,美團(tuán)聯(lián)創(chuàng)王慧文在朋友圈發(fā)“英雄帖”,出資5000萬美元,要?jiǎng)?chuàng)立新公司打造中國版OpenAI。此外,阿里巴巴“框架大神”賈揚(yáng)清、搜狗前任CEO王小川、京東曾經(jīng)的AI掌門人周伯文都表明了同樣的意愿。
互聯(lián)網(wǎng)大佬蜂擁入局,中國企業(yè)重燃熱情,包括創(chuàng)業(yè)企業(yè)和上市公司。
企查查數(shù)據(jù)顯示,近三個(gè)月共有108601家新注冊(cè)業(yè)企業(yè)在經(jīng)營范疇中標(biāo)注了人工智能,同比增長超24%?!对钪嫒毡方y(tǒng)計(jì),截至今年3月,已有20家上市公司布局了AIGC相關(guān)應(yīng)用,涉及世紀(jì)虛擬人、AI寫作、AI視頻、AI繪畫、AI營銷等。
國內(nèi)上市公司AIGC相關(guān)布局
AIGC創(chuàng)業(yè)公司千帆競(jìng)發(fā),涉及領(lǐng)域包括上游的底層框架與工具、中游的行業(yè)服務(wù)、下游的包括文字、圖像、視頻、音頻、游戲等應(yīng)用場(chǎng)景,創(chuàng)業(yè)方向也從C端的娛樂游戲拓寬至工業(yè)、金融、醫(yī)療、教育等2B領(lǐng)域。不同應(yīng)用場(chǎng)景已出現(xiàn)了一批代表性的玩家。
國內(nèi)創(chuàng)業(yè)公司AIGC相關(guān)布局
而在底層大模型上,中國互聯(lián)網(wǎng)科技巨頭的動(dòng)作則最受矚目,包括百度、華為、騰訊在內(nèi)大廠均有自然語言大模型布局。
3月16日,百度履行承諾,發(fā)布基于文心大模型的生成式AI產(chǎn)品文心一言,27日又面對(duì)企業(yè)發(fā)布了智能云AI底座文心千帆。
3月27日,華為云官網(wǎng)顯示,旗下的盤古系列AI大模型即將上線,涉及NLP(自然語言)大模型、CV(計(jì)算機(jī)視覺)大模型和科學(xué)計(jì)算大模型(氣象大模型)。
3月30日,騰訊集團(tuán)高級(jí)執(zhí)行副總裁湯道生披露,騰訊正在研發(fā)AIGC以及大模型相關(guān)技術(shù),并向澎湃新聞表示,正在研發(fā)類ChatGPT的對(duì)話機(jī)器人,對(duì)于騰訊的聊天機(jī)器人是集成到QQ、微信,還是通過騰訊云向B端用戶服務(wù),湯道生說:“都會(huì)有。”
二、國內(nèi)AI“三算”與海外存差距
人工智能在當(dāng)下的中國展現(xiàn)出全面開花的熱鬧。而資金雄厚、人才濟(jì)濟(jì)的大廠被視作最能與OpenAI比肩的選手。但最早發(fā)布產(chǎn)品的百度,其文心一言在文本、代碼生成上尚不及ChatGPT的體驗(yàn),圖片生成的效果則被Midjourney拉開了距離。
賽道火熱,產(chǎn)品不佳。中國的人工智能發(fā)展進(jìn)入至暗時(shí)刻。缺的不僅是有實(shí)力的大模型,還有與之直接相關(guān)的人才和AI“三算”,即算力、算法、算據(jù)。
先是業(yè)內(nèi)曝出,百度文心大模型團(tuán)隊(duì)內(nèi)的研發(fā)人員近期受到了其他公司的瘋狂追捧,有3年左右相關(guān)經(jīng)驗(yàn)的員工,可以直接給到原先年薪的兩倍。而有涉及海內(nèi)外人才市場(chǎng)的獵頭稱,諸多互聯(lián)網(wǎng)大廠的第一訴求就是想找OpenAI項(xiàng)目里的華人。獵聘大數(shù)據(jù)研究院的統(tǒng)計(jì)數(shù)據(jù)也顯示,近一年,AIGC相關(guān)新發(fā)崗位同比增長了42.5%。
搶人大戰(zhàn)不僅在國內(nèi)上演。
由于一大批硅谷AI大牛排著隊(duì)擠進(jìn)OpenAI,谷歌一度遭遇AI人才流出。據(jù)外媒體統(tǒng)計(jì),近幾個(gè)月OpenAI已經(jīng)雇用了超過12名谷歌的AI人才。
但從公開消息看,到目前為止,還沒有哪位OpenAI背景的華人專家流入中國大廠。
AI人才緊俏,以芯片為核心硬件基礎(chǔ)的算力一直被視為“卡脖子”的狀態(tài),而國產(chǎn)大模型的算據(jù)也與GPT-4存在肉眼可見的差距,預(yù)訓(xùn)練等大模型算法的距離直接以“肉眼可見”的產(chǎn)品拉胯擺在了用戶面前。
在算據(jù)上,國產(chǎn)大模型也與GPT-4存在差距。
在自然語言大模型中,參數(shù)是衡量一個(gè)深度學(xué)習(xí)模型復(fù)雜度和能力的重要指標(biāo)。參數(shù)多,意味著模型能夠處理更多的數(shù)據(jù),學(xué)習(xí)更多的知識(shí)。國外有研究人員將GPT參數(shù)規(guī)模與大腦神經(jīng)元做類比,GPT-3的規(guī)模與刺猬大腦類似,GPT-4擁有100萬億個(gè)參數(shù),基本達(dá)到人類大腦的規(guī)模。
大模型參數(shù)對(duì)比
再看國產(chǎn)大模型,即使是排名靠前的M6大模型,其參數(shù)規(guī)模也仍與GPT-4相差一個(gè)數(shù)量級(jí),更多的大模型仍在“原始階段”。
GPT-4百萬億的參數(shù)需要強(qiáng)大的算力來完成訓(xùn)練。算力,同樣是AI的核心競(jìng)爭(zhēng)要素,核心的核心是芯片。????????????????
在AI芯片競(jìng)爭(zhēng)方面,英偉達(dá)處于壟斷地位,該公司推出的A100與H100是目前性能最強(qiáng)的數(shù)據(jù)中心專用GPU,市面上幾乎沒有可替代的方案。ChatGPT的訓(xùn)練用的正是英偉達(dá)頂配版A100。
然而,在中美競(jìng)爭(zhēng)下,A100與H100已被限制出口中國,中國廠商只能用閹割版A800芯片,數(shù)據(jù)傳輸速度被降低了30%,影響著AI集群的訓(xùn)練速度和效果。而國產(chǎn)優(yōu)質(zhì)芯片,雖能夠?yàn)轭A(yù)訓(xùn)練大模型提供算力支撐,但仍存在明顯差距。
芯片性能對(duì)比
以O(shè)penAI為例,該公司使用了數(shù)萬塊英偉達(dá)A100進(jìn)行海量數(shù)據(jù)訓(xùn)練和推理。如果以1萬枚英偉達(dá)A800 GPU為標(biāo)準(zhǔn),僅GPU采購成本就超10億美元。
如此現(xiàn)狀下,國內(nèi)的大模型研發(fā)機(jī)構(gòu)面臨兩種選擇,“燒錢”購買更多的芯片,等待國產(chǎn)芯片的算力突破。但現(xiàn)在的競(jìng)爭(zhēng)態(tài)勢(shì)下,等已經(jīng)等不起了。
高昂的前期投入成本絕非普通創(chuàng)業(yè)公司可以負(fù)擔(dān),還要具備絕對(duì)頂尖的研發(fā)技術(shù)。很顯然,AI大模型仍是巨頭的游戲。但掌握先發(fā)優(yōu)勢(shì)的OpenAI以“日更”速度向前躍進(jìn),互聯(lián)網(wǎng)巨頭與資本面臨著一場(chǎng)“燒錢”硬仗。
三、OpenAI搶跑,中企如何趕超?
回顧C(jī)hatGPT的迭代,OpenAI至少進(jìn)行了三次技術(shù)路線的“自我革命”。
從2018年GPT-1的推出到今年的GPT-4,OpenAI用了近5年。而百度在自然語言大模型的研發(fā)上用了10年。
連李彥宏也認(rèn)為,中國基本不會(huì)再出現(xiàn)一個(gè)OpenAI,“沒有必要再重新發(fā)明一遍輪子”,在他看來,“大模型時(shí)代,最大的創(chuàng)業(yè)機(jī)會(huì)在應(yīng)用,”他的判斷基于上一次的移動(dòng)互聯(lián)網(wǎng)變革,“操作系統(tǒng)其實(shí)沒幾個(gè),最成功的是微信、抖音、淘寶這些應(yīng)用?!彼赋?,未來10年,應(yīng)用領(lǐng)域可能誕生10倍價(jià)值的機(jī)會(huì)。
周鴻祎也在公開場(chǎng)所表示,目前中國發(fā)展GPT技術(shù),首先要占據(jù)應(yīng)用場(chǎng)景,同步全力發(fā)展核心算法技術(shù)。為什么要同步?如果等算法趕上GPT-4再上馬,市場(chǎng)就錯(cuò)過了。
另辟賽道,在現(xiàn)有大模型的基礎(chǔ)上創(chuàng)新產(chǎn)品應(yīng)用可能是大部分企業(yè)的超車機(jī)會(huì)。
就像移動(dòng)互聯(lián)網(wǎng)時(shí)代,盡管中國沒有自己的操作系統(tǒng),但仍有Tiktok這樣的超級(jí)應(yīng)用在海外市場(chǎng)殺出一片天。應(yīng)用先行的優(yōu)勢(shì)是能快速的將AI生產(chǎn)力轉(zhuǎn)化為商業(yè)價(jià)值,這是在移動(dòng)互聯(lián)網(wǎng)時(shí)代中國互聯(lián)網(wǎng)企業(yè)探索出的超車捷徑,也是在激烈的AI競(jìng)爭(zhēng)中,大部分中企們趕超ChatGPT最經(jīng)濟(jì)、最現(xiàn)實(shí)的路徑。
但由于GPT-3之后,OpenAI的所有模型就沒有再開源,GPT-4的運(yùn)行機(jī)制是什么,國內(nèi)企業(yè)仍無從得知。
面對(duì)競(jìng)爭(zhēng)對(duì)手全面的科技封鎖,中國人工智能想要長期發(fā)展就不能沒有“根”。曠視科技CEO印奇認(rèn)為,中國攻堅(jiān)AI大模型目前最重要的是要先能把GPT-3.5復(fù)現(xiàn)出來,”這是所有事情的起點(diǎn)”。
無論如何,發(fā)展好自身的硬實(shí)力,不在關(guān)鍵技術(shù)上被“卡脖子”,將是AI時(shí)代下中企們無法逃避的“必修課”。
針對(duì)國產(chǎn)AI大模型,周鴻祎指出:“發(fā)展大語言模型,別人已經(jīng)指明了技術(shù)路線,剩下的就是長期主義指導(dǎo)下的時(shí)間問題,”他認(rèn)為,“中國有能力發(fā)展自己的GPT,差距大概2年?!?/p>
百度有文心大模型,阿里有M6,華為的盤古大模型箭在弦上,騰訊的混元大模型也在不斷迭代。當(dāng)李開復(fù)、王慧文等一眾互聯(lián)網(wǎng)大佬也親赴大模型戰(zhàn)場(chǎng)時(shí),底層的重要價(jià)值已經(jīng)不言而喻了。
就像《三體》故事里的明喻一般,“基礎(chǔ)科學(xué)”一旦被“智子”鎖死,人類便永遠(yuǎn)失去探索宇宙真相的機(jī)會(huì)。底層大模型就是那個(gè)基礎(chǔ)科學(xué),在人工智能上,中國想要超越,不光需要資本、巨頭,更需要的是能頂?shù)米⊙邪l(fā)壓力的“面壁人”。
作者:木沐,編輯:文刀
來源公眾號(hào):元宇宙日爆(ID:yuanyuzhouribao),在這里,看見未來。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @元宇宙日爆 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!