對(duì)話ChatGPT:Prompt是普通人“魔法”嗎?
隨著ChatGPT等AI應(yīng)用模型、AI技術(shù)產(chǎn)品的出現(xiàn),Prompt這個(gè)概念,也出現(xiàn)在了眾人眼前,因?yàn)槟撤N程度上,Prompt可以理解為控制AI的指令,可以在生成式AI的語(yǔ)境里發(fā)揮引導(dǎo)價(jià)值。具體如何解讀Prompt的存在與應(yīng)用?不如來(lái)看看本文的解讀。
在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下,不少人或多或少聽(tīng)說(shuō)過(guò)Prompt的概念。
雖然OpenAI掀起的大模型浪潮再度刷新了人們對(duì)AI的認(rèn)知,但現(xiàn)階段的AI終歸還不是強(qiáng)人工智能,大模型里的“知識(shí)”存儲(chǔ)在一個(gè)隱性空間里,需要輸給AI正確的指令,也就是過(guò)去幾個(gè)月中頻頻被討論的Prompt。
有人將Prompt翻譯成“提示詞”,也有人翻譯為“激發(fā)詞”。再感性一些,就像童話故事里的魔法一樣,Prompt是AI時(shí)代的魔法,擁有它就擁有“巫師”一樣的能力。
一、Prompt是什么?
并不難理解Prompt的字面含義,可為何會(huì)出現(xiàn)Prompt這個(gè)概念?既然是ChatGPT炒熱的新名詞,不妨讓ChatGPT自己來(lái)回答。
這個(gè)回答中規(guī)中矩,但還是可以提取到一些有價(jià)值的信息:一,Prompt繼承了計(jì)算機(jī)編程里的命令行提示符,可以理解為控制AI的指令;二,在生成式AI的語(yǔ)境里,Prompt的價(jià)值在于引導(dǎo),而非計(jì)算機(jī)里的命令。
打個(gè)比方的話:大模型就像是人類的大腦,知識(shí)被存儲(chǔ)在神經(jīng)元聯(lián)接中,只有當(dāng)你遇到具體的問(wèn)題時(shí),就像“你最喜歡的食物是什么?”大腦才會(huì)給出確切的答案,Prompt等于是一個(gè)個(gè)具象的問(wèn)題。由此產(chǎn)生了一種流行的說(shuō)法,即提問(wèn)比回答更重要。你使用ChatGPT所遇到的“邊界”,實(shí)際上是你自己的“邊界”。
但Prompt的價(jià)值體現(xiàn),并不在于ChatGPT代表的對(duì)話機(jī)器人,而是Midjourney為首的圖像生成類應(yīng)用。
簡(jiǎn)單來(lái)說(shuō),你要告訴AI想要什么樣的圖,想要把自己腦海里的東西變成肉眼可見(jiàn)的圖案,需要幾十個(gè)單詞作為Prompt。哪怕只有一個(gè)提示詞的差異,AI所生成的圖像都可能有著質(zhì)的差別,怎么正確地給AI投喂Prompt,逐漸成了一門(mén)深?yuàn)W的學(xué)問(wèn),并衍生出了提示語(yǔ)工程學(xué)(Prompt Engineering)的說(shuō)法。
以至于在衡量大模型的能力時(shí),出現(xiàn)了三個(gè)標(biāo)準(zhǔn):一是大模型的預(yù)訓(xùn)練水平;二是用來(lái)進(jìn)行預(yù)訓(xùn)練語(yǔ)料數(shù)量和質(zhì)量;三是提示語(yǔ)的水平。直接的例子就是外界對(duì)文心一言文生圖的質(zhì)疑,即使不考慮前兩個(gè)因素,單單在提示詞方面,就足以讓文心一言和Midjourney拉開(kāi)幾條街的距離。
因?yàn)樵谖男囊谎陨舷胍蓤D片,普遍給的指令是:幫我生成一張XXX(這也是百度官方的示例),解析為Prompt時(shí)注定只有幾個(gè)提示詞,遠(yuǎn)不足以表達(dá)腦海里想要的畫(huà)面;同樣的需求給Midjourney,可能是十幾個(gè)乃至幾十個(gè)提示詞,大模型可以更準(zhǔn)確地理解并輸出用戶想要圖案。
理解了這些差異,便不難讀懂Prompt走紅的原因。
目前大模型對(duì)算力的要求很高,以O(shè)penAI的DALL?E為例,生成一張圖片的收費(fèi)約0.02美元,如果讓不懂Prompt的人去調(diào)用模型,大概率會(huì)浪費(fèi)掉一次次算力。何況當(dāng)前想要生成滿意的圖片,需要不斷重復(fù)調(diào)整,能否熟練運(yùn)用Prompt,直接左右了大模型所能釋放的生產(chǎn)力。
二、Prompt 還能賺錢(qián)?
利用信息差賺錢(qián)向來(lái)是最容易做的生意,生成式AI也不例外,Prompt作為AI時(shí)代的魔法,已然成了不少人用來(lái)“賺錢(qián)”的生產(chǎn)資料。
第一種:直接售賣Prompt。
國(guó)外已經(jīng)出現(xiàn)了PromptBase等明碼標(biāo)價(jià)的平臺(tái),涉及Midjourney、Stable Diffusion、DALL?E、GPT等多個(gè)模型,而且適用的場(chǎng)景越來(lái)越細(xì)分,包括音樂(lè)創(chuàng)作、兒童插畫(huà)、油畫(huà)藝術(shù)、人物肖像等等,即便是不擅長(zhǎng)整理提示詞的普通用戶,也可以直接復(fù)制Prompt生成相對(duì)不錯(cuò)的作品。
其實(shí)國(guó)內(nèi)也有類似的現(xiàn)象,一些商家早已在電商平臺(tái)上兜售Prompt,也有一些人將Prompt做成面向垂直任務(wù)場(chǎng)景的應(yīng)用,比如AI 寫(xiě)評(píng)語(yǔ)、AI寫(xiě)郵件、AI翻譯等等,吸引剛需用戶按月付費(fèi)使用。
第二種:用Prompt換流量。
國(guó)內(nèi)最早一批售賣AI課程的自媒體,多半將Prompt作為吸引用戶付費(fèi)的籌碼;小紅書(shū)等年輕人扎堆的平臺(tái)上,早早出現(xiàn)了分享Prompt的筆記;B站、抖音等視頻平臺(tái)上,教用戶使用Prompt的教程已不可計(jì)數(shù)。
個(gè)中邏輯并不復(fù)雜。Prompt是駕馭AI的“咒語(yǔ)”,但提示詞本身并沒(méi)有版權(quán)效應(yīng),或許直接兜售Prompt可以快速變現(xiàn),終歸是不長(zhǎng)久的買(mǎi)賣。將Prompt作為漲粉工具,趁機(jī)吸引到可觀的粉絲群體,在流量變相高度繁榮的互聯(lián)網(wǎng)江湖,無(wú)疑更符合市場(chǎng)規(guī)律,也是Prompt被廣泛討論的另一重誘因。
第三種:靠Prompt“找工作”。
正如前面所提到的,正確使用Prompt已經(jīng)是提升生產(chǎn)力的前提,不單單產(chǎn)生了提示語(yǔ)工程,還醞釀出了一批“提示詞工程師”(Prompt Engineer)。
國(guó)外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速漲粉,然后被硅谷獨(dú)角獸Scale AI聘請(qǐng)為“提示詞工程師”,據(jù)說(shuō)年薪高達(dá)百萬(wàn)人民幣;另一位名為Jason M. Allen的藝術(shù)家,則使用Midjourney贏得了Colorado State Fair周年藝術(shù)比賽……如果說(shuō)計(jì)算機(jī)時(shí)代的能力密碼是編程,在生成式AI席卷全球的當(dāng)下,Prompt正悄悄成為數(shù)以萬(wàn)計(jì)打工人“傍身”的工具。
至少就目前來(lái)看,程序員群體里已經(jīng)漸漸興起兩股風(fēng)潮:一類人瞄準(zhǔn)了OpenAI等大模型企業(yè)的API,想要坐在人工智能的副駕駛上創(chuàng)業(yè);另一類人打起了創(chuàng)造Prompt的主意,想要利用信息差賺到第一桶金。
倘若ChatGPT的出現(xiàn)當(dāng)真是所謂的iPhone時(shí)刻,圍繞Prompt的生意其實(shí)才剛剛開(kāi)場(chǎng)。
三、Prompt 只是過(guò)渡?
相對(duì)應(yīng)的一個(gè)問(wèn)題是,Prompt是否是人工智能大眾化不可或缺的一環(huán)?這個(gè)問(wèn)題的答案直接影響著Prompt和Prompt Engineer的紅利周期。
Open AI 的 CEO Sam Altman曾公開(kāi)表示:五年后,就不再需要 Prompt Engineering。也許在接下來(lái)的一段時(shí)間里,我們?nèi)孕枰崾菊Z(yǔ),需要去創(chuàng)造 Prompt,但生成式AI的發(fā)展速度可能超乎想象,AI對(duì)人類的理解力遠(yuǎn)未觸達(dá)天花板。
可以佐證的是,第一代iPhone上市時(shí)還沒(méi)有App Store,僅預(yù)裝了瀏覽器、iPod、郵件等少量應(yīng)用,想要安裝其他應(yīng)用,需要在電腦上安裝iTunes,用USB線將iPhone連接到電腦……為了解決用戶體驗(yàn)上的局限性,越獄工具和第三方應(yīng)用商店應(yīng)運(yùn)而生,但在蘋(píng)果引入App Store后,越獄工具漸漸被丟進(jìn)了歷史的故紙堆。
同樣的問(wèn)題詢問(wèn)ChatGPT,答案似乎客觀了許多。
想要不用特定Prompt就能和AI流暢對(duì)話,ChatGPT認(rèn)為需要解決四個(gè)挑戰(zhàn):
- AI需要更好地理解語(yǔ)境和連貫性,哪怕用戶像《大話西游》里的唐僧一樣喋喋不休,或者語(yǔ)無(wú)倫次,AI也可以準(zhǔn)確理解用戶的意圖,這樣就不需要精確的提示詞,用自然語(yǔ)言進(jìn)行提問(wèn)。
- AI需要有豐富的常識(shí)和推理能力,即根據(jù)特定的信息和場(chǎng)景做出合理的回應(yīng),而非像現(xiàn)在的模型那樣“對(duì)牛彈琴”,比如中文里的多義詞、不同場(chǎng)景下不同含義的語(yǔ)氣詞,非??简?yàn)推理能力。
- AI需要理解和處理情感信息,這也是當(dāng)前AI研究的重心所在。人的情感可以有很多種表達(dá)方式,文字只是其中重要的一種。在大模型不斷向多模態(tài)演進(jìn)時(shí),視覺(jué)和聲音是否也可以傳遞信息?
- AI需要有主動(dòng)學(xué)習(xí)和適應(yīng)能力。主動(dòng)學(xué)習(xí)是指AI系統(tǒng)在學(xué)習(xí)過(guò)程中,能夠主動(dòng)選擇最具信息量的樣本進(jìn)行學(xué)習(xí),在數(shù)據(jù)稀缺的情況下做出更好的決策;適應(yīng)能力是指AI在面臨新的任務(wù)、場(chǎng)景或環(huán)境變化時(shí),能夠自我調(diào)整并優(yōu)化其行為。
按照ChatGPT的標(biāo)準(zhǔn),在Prompt消失的時(shí)候,勢(shì)必已經(jīng)進(jìn)入到了強(qiáng)人工智能時(shí)代,目前還有很長(zhǎng)一段距離。
Prompt及其衍生機(jī)會(huì)的消亡是一種歷史必然,在時(shí)間上仍有很大的不確定性,也許會(huì)很快出現(xiàn)另一場(chǎng)技術(shù)爆炸;也許AI會(huì)進(jìn)入新一輪的瓶頸期, Sam Altman的五年預(yù)期不過(guò)是“盲目樂(lè)觀”。
四、寫(xiě)在最后
或許可以借用科技媒體《VentureBeat》的說(shuō)法:現(xiàn)在已經(jīng)到了AI藝術(shù)的轉(zhuǎn)折點(diǎn),未來(lái)的藝術(shù)家無(wú)論是自學(xué)成才還是科班出身,都需要有創(chuàng)造Prompt的能力,需要理解和學(xué)習(xí)數(shù)據(jù)科學(xué),以及大模型的工作原理。
進(jìn)一步延伸的話,需要有這些能力的絕不只是藝術(shù)家,任何職業(yè)、任何行業(yè)的工作都不可避免和AI協(xié)作,將人類的思考和需求注入給AI,不斷更新、創(chuàng)造Prompt,將是大多數(shù)人必須要掌握的一種技能,就像現(xiàn)在必須要用輸入法打字一樣。
作者:顧青云、ChatGPT;編輯:沈菲菲
來(lái)源公眾號(hào):Alter聊科技(ID:spnews),主理人:Alter。
本文由@Alter 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!