搶人、搶數(shù)據(jù),AI原生應(yīng)用“難產(chǎn)”困局

1 評(píng)論 2839 瀏覽 2 收藏 13 分鐘

國(guó)內(nèi)已經(jīng)涌現(xiàn)出了數(shù)量相對(duì)龐大的大模型,而與之相對(duì)的,基于大模型的應(yīng)用產(chǎn)品數(shù)量卻仍然較少。這也牽扯出一個(gè)問(wèn)題,即AI原生應(yīng)用的發(fā)展,究竟面臨著哪些困局?一起來(lái)看看這篇文章的解讀與分析。

自ChatGPT發(fā)布以來(lái),大模型風(fēng)潮在國(guó)內(nèi)外如雨后春筍般涌現(xiàn)。

從百模大戰(zhàn)的火熱到如今對(duì)原生應(yīng)用的推崇,短短一年間,大模型經(jīng)歷了千山萬(wàn)水的“奇妙征程”。

2023年3月16日,百度率先發(fā)布首個(gè)和ChatGPT競(jìng)爭(zhēng)的大模型“文心一言”,截至10月,國(guó)內(nèi)已經(jīng)涌現(xiàn)出了238個(gè)大模型,幾乎每一天都有新的大模型問(wèn)世。2023年第一季度,超過(guò)17萬(wàn)家中國(guó)AI企業(yè)如涌泉般冒了出來(lái)。

然而,與競(jìng)爭(zhēng)激烈的賽道形成鮮明對(duì)比的是,基于大模型的應(yīng)用產(chǎn)品卻寥寥無(wú)幾。

過(guò)去幾個(gè)月,無(wú)數(shù)互聯(lián)網(wǎng)巨頭反復(fù)強(qiáng)調(diào)AI原生應(yīng)用的重要性。百川智能創(chuàng)始人、CEO 王小川認(rèn)為,大模型的創(chuàng)業(yè)核心,是好技術(shù)如何匹配產(chǎn)品;360集團(tuán)創(chuàng)始人周鴻祎表示,360的人工智能戰(zhàn)略用四個(gè)字形容就是“兩翼齊飛”,先占據(jù)應(yīng)用場(chǎng)景,同步全力發(fā)展核心算法技術(shù);李彥宏更是直言不諱:“中國(guó)的大模型很多,但是基于大模型開(kāi)發(fā)出來(lái)的AI原生應(yīng)用卻非常少?!?/p>

其實(shí)大廠們也并非“光說(shuō)不練”,今年下半年,百度一口氣發(fā)布超過(guò)20款A(yù)I原生應(yīng)用;騰訊云推出高性能應(yīng)用服務(wù) HAI,號(hào)稱10分鐘開(kāi)發(fā)專屬AI應(yīng)用;字節(jié)跳動(dòng)成立新部門Flow發(fā)力AI應(yīng)用層……但事實(shí)是,截至目前,相比國(guó)外動(dòng)輒千百個(gè)大熱的AI原生應(yīng)用,國(guó)內(nèi)真正稱得上火熱的應(yīng)用仍然“難產(chǎn)”。

如此現(xiàn)狀不得不讓人追問(wèn),AI原生應(yīng)用,究竟還要跨過(guò)幾道坎?

一、變現(xiàn)之難:賺取真金白銀的門檻提高

如何賺錢,是每一家人工智能公司無(wú)法回避的問(wèn)題。

身處大模型賽道,即使是“家大業(yè)大”的大廠,也面臨著“大象難以轉(zhuǎn)身”的問(wèn)題。零一萬(wàn)物CEO李開(kāi)復(fù)曾表示,大廠的優(yōu)勢(shì)是資源多、GPU多、人多、錢多、數(shù)據(jù)多,但大廠們有一個(gè)挑戰(zhàn):很難放棄已有的商業(yè)模式。

“開(kāi)發(fā)一個(gè)新應(yīng)用需要克服兩個(gè)主要問(wèn)題:一是要超越已有的大型應(yīng)用,這非常困難;二是要開(kāi)發(fā)新的應(yīng)用取代舊的應(yīng)用,就像一家公司很難在擁有QQ的同時(shí)再開(kāi)發(fā)一個(gè)微信一樣,因?yàn)橐延械钠脚_(tái)價(jià)值巨大,不愿意放棄。在這種情況下,創(chuàng)業(yè)公司雖然沒(méi)有豐富的資源,但他們的優(yōu)勢(shì)在于沒(méi)有歷史包袱。

然而,創(chuàng)業(yè)者們的處境同樣艱難,事實(shí)證明,像OpenAI那樣直接面向C端用戶的模式,在國(guó)內(nèi)市場(chǎng)面臨著巨大的挑戰(zhàn),因?yàn)閲?guó)內(nèi)C端用戶的付費(fèi)意愿相對(duì)較弱。因此,更多的大模型創(chuàng)業(yè)公司選擇為特定垂直行業(yè),如醫(yī)療、金融、法律等開(kāi)發(fā)專門的解決方案,為不同行業(yè)提供定制化的大模型服務(wù),為B端客戶提供服務(wù)并收取費(fèi)用。

這些公司需要面對(duì)To B型產(chǎn)品的固有問(wèn)題,包括依賴高續(xù)約率、回款周期長(zhǎng)等,對(duì)于“燒錢如燒紙”的大模型賽道,無(wú)疑提高了門檻。

北京開(kāi)放傳神科技有限公司創(chuàng)始人、CEO陳冉在接受媒體采訪時(shí)表示,國(guó)內(nèi)應(yīng)用都在試圖產(chǎn)生價(jià)值,但很少實(shí)現(xiàn)盈利,做數(shù)字人的“小作坊”倒是真掙錢了。

更雪上加霜的是,隨著企業(yè)在大模型領(lǐng)域布局的時(shí)間越長(zhǎng),需要的資本就越多,融資輪次越多,投資人對(duì)于企業(yè)在技術(shù)實(shí)力和盈利轉(zhuǎn)化能力方面的要求就越嚴(yán)苛。

多位接受《IT時(shí)報(bào)》采訪的業(yè)內(nèi)人士表示,當(dāng)前投資人對(duì)于大模型賽道初創(chuàng)公司的熱情正在“降溫”。與過(guò)去“井噴期”投資者慷慨解囊不同,現(xiàn)在投資者在考慮投資大模型項(xiàng)目時(shí),會(huì)對(duì)市場(chǎng)需求、技術(shù)實(shí)力、商業(yè)模式以及團(tuán)隊(duì)能力等方面進(jìn)行更為全面的評(píng)估,他們對(duì)于“投概念”和“產(chǎn)生收入”的容忍期正在縮短。

量子位智庫(kù)發(fā)布的《2023十大AI商業(yè)落地趨勢(shì)》顯示,今年上半年,國(guó)內(nèi)約有二十家大模型公司獲得超過(guò)60億元的融資,全球金額占比僅為6%,國(guó)內(nèi)實(shí)際交易金額較少。

“目前的環(huán)境是雷聲大雨點(diǎn)小,公司多收入少?!北本┽t(yī)者信息科技有限公司CEO劉呈輝此前在接受《IT時(shí)報(bào)》記者采訪時(shí)表示,國(guó)內(nèi)應(yīng)用層能產(chǎn)生實(shí)際應(yīng)用和實(shí)際收入的場(chǎng)景和公司還非常少,相比之下,有自己的垂直模型、場(chǎng)景能掙到錢的公司,才能真正獲得投資者青睞。

二、數(shù)據(jù)之爭(zhēng):高質(zhì)量數(shù)據(jù)成本高、獲取難

近日,谷歌發(fā)布的Gemini新模型陷入數(shù)據(jù)使用爭(zhēng)議,據(jù)稱其中文部分使用了文心一言進(jìn)行訓(xùn)練,這一事件引發(fā)了全球關(guān)于大模型數(shù)據(jù)短缺問(wèn)題的廣泛討論。

圖源:谷歌

無(wú)論是原生應(yīng)用還是其底層基礎(chǔ)大模型,數(shù)據(jù)至關(guān)重要。然而,高質(zhì)量的語(yǔ)料匱乏已成為限制這一領(lǐng)域發(fā)展的關(guān)鍵瓶頸之一。

業(yè)內(nèi)人士指出,盡管公有數(shù)據(jù)如互聯(lián)網(wǎng)上的信息易于獲取,但質(zhì)量和針對(duì)性往往難以滿足專業(yè)模型的需求。

相比之下,私有數(shù)據(jù)具有高度的專業(yè)性和針對(duì)性,對(duì)于訓(xùn)練精準(zhǔn)的垂直類模型具有極高的價(jià)值。

以醫(yī)療數(shù)據(jù)為例,獲取高質(zhì)量的數(shù)據(jù)集至關(guān)重要,但由于醫(yī)療數(shù)據(jù)的獲取和標(biāo)注需要大量的人力、物力和時(shí)間,因此其成本相對(duì)較高,獲取的渠道也十分有限。這類數(shù)據(jù)不僅難以在互聯(lián)網(wǎng)上找到,而且由于涉及個(gè)人隱私,獲取和使用也需遵守嚴(yán)格的法規(guī)和倫理標(biāo)準(zhǔn)。

浦因科技(上海)有限公司首席科學(xué)家秦興虎告訴《IT時(shí)報(bào)》記者,在其所負(fù)責(zé)的醫(yī)學(xué)大模型項(xiàng)目中,團(tuán)隊(duì)初期購(gòu)買了英國(guó)生物銀行的公共數(shù)據(jù)進(jìn)行大模型訓(xùn)練,這些數(shù)據(jù)主要來(lái)自歐洲人群。為確保模型在國(guó)內(nèi)的普適性,他們還需要使用中國(guó)人群的數(shù)據(jù)來(lái)更新和訓(xùn)練模型,這在無(wú)形中增加了項(xiàng)目成本。

對(duì)于國(guó)內(nèi)企業(yè)而言,他們還面臨著即使有錢也難以購(gòu)買到合適數(shù)據(jù)的困境。中文語(yǔ)料庫(kù)的內(nèi)容相對(duì)匱乏,進(jìn)一步加劇了數(shù)據(jù)獲取的挑戰(zhàn)。

因此,對(duì)于企業(yè)來(lái)說(shuō),如何合法、有效地獲取和使用高質(zhì)量數(shù)據(jù),將其轉(zhuǎn)化為模型訓(xùn)練、開(kāi)發(fā)AI原生應(yīng)用的寶貴資源,確實(shí)是一個(gè)重要的戰(zhàn)略問(wèn)題。

五、人才之困:5個(gè)崗位爭(zhēng)奪2個(gè)人才

AI原生應(yīng)用作為大模型產(chǎn)業(yè)的核心產(chǎn)品,在研發(fā)和落地試錯(cuò)過(guò)程中面臨諸多不確定性。人才成為決定成功與否的關(guān)鍵因素,也成了現(xiàn)階段大模型競(jìng)爭(zhēng)中的重要砝碼。

關(guān)于國(guó)內(nèi)人工智能人才的儲(chǔ)備,回顧中國(guó)的大模型產(chǎn)業(yè)發(fā)展史,可以發(fā)現(xiàn)“清華系”的身影無(wú)處不在。

當(dāng)國(guó)內(nèi)對(duì)人工智能的研究還是一片空白的時(shí)期,清華大學(xué)最早開(kāi)出的人工智能課程,也孕育出了目前國(guó)內(nèi)人工智能領(lǐng)域的熠熠群星。無(wú)論是王小川還是智浦AI聯(lián)合創(chuàng)始人唐杰,抑或欲打造“中國(guó)版OpenAI”光年之外的原美團(tuán)聯(lián)合創(chuàng)始人王慧文,都來(lái)自這里。

在此輪大模型創(chuàng)業(yè)背后的投資方中,“清華系”的創(chuàng)投者們也頗為矚目,包括圖靈創(chuàng)投、卓源資本、清華控股、水木清華校友種子基金、無(wú)限基金SEE Fund等清華系創(chuàng)投機(jī)構(gòu)也頻頻出手。

盡管如此,必須看到的是,由于大模型技術(shù)門檻較高,國(guó)內(nèi)大模型人才主要分布在少數(shù)頂尖高校和科研機(jī)構(gòu),人才短缺問(wèn)題日益嚴(yán)重,許多創(chuàng)業(yè)公司甚至面臨著招聘困難。

“現(xiàn)在國(guó)內(nèi)做基座類模型的人才90%都出自清華,國(guó)內(nèi)真正會(huì)調(diào)模型、訓(xùn)練模型的甚至不超過(guò)200個(gè)人。”劉呈輝表示,由于行業(yè)本身的人才儲(chǔ)備有限,加上大模型的突然“火爆”,人才短缺問(wèn)題顯得尤為突出,如果不在高校具備一定的人才資源,創(chuàng)業(yè)公司連招人都會(huì)變得很困難。

知名咨詢公司麥肯錫一份關(guān)于人工智能的報(bào)告顯示,預(yù)計(jì)2030年中國(guó)對(duì)AI專業(yè)人員的需求將增至2022年的6倍,人才缺口將達(dá)到400萬(wàn)人。

據(jù)脈脈高聘11月發(fā)布的《2023人工智能人才洞察》報(bào)告顯示,2023年1—8月,人工智能新發(fā)崗位量已與2022年全年持平。2022年人工智能行業(yè)人才供需比為0.63,而2023年1—8月下探至0.39,相當(dāng)于5個(gè)崗位要爭(zhēng)奪2個(gè)人才。

圖源:脈脈高聘

可以看到,AI原生應(yīng)用“難產(chǎn)”的背后,面臨著變現(xiàn)之難、數(shù)據(jù)之爭(zhēng)和人才之困等多重挑戰(zhàn)。Gartner發(fā)布的《2023年中國(guó)數(shù)據(jù)分析和人工智能技術(shù)成熟度曲線》指出,當(dāng)前國(guó)內(nèi)生成式AI技術(shù)仍處于“期望膨脹期”。只有當(dāng)整個(gè)AI行業(yè)在“期望膨脹期”中保持謹(jǐn)慎,才能意識(shí)到將大模型的潛能轉(zhuǎn)化為創(chuàng)新應(yīng)用尚需克服不小的挑戰(zhàn)。

作者:賈天榮,編輯:潘少穎,孫妍

來(lái)源公眾號(hào):IT時(shí)報(bào)(ID:vittimes),做報(bào)紙,也懂互聯(lián)網(wǎng)。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @IT時(shí)報(bào) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 咩咩……

    來(lái)自廣東 回復(fù)
专题
15735人已学习15篇文章
本专题的文章分享了B端组件的设计指南。
专题
103943人已学习5篇文章
PRD、MRD、DRD、BRD各种文档撰写方法在这里。
专题
16581人已学习12篇文章
供应链管理系统是最早期面向企业的软件解决方案之一,供应商管理又是供应链链条中的上游部分。本专题的文章分享了供应商管理设计指南以及供应链的基础知识。
专题
11867人已学习12篇文章
如今随着商业的发展,消费者与品牌建立起了更深的联系,商务活动也开始以消费者为中心,所以消费者的体验以及建议就非常重要。本专题的文章分享了消费者行为学。