GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

0 評(píng)論 6900 瀏覽 28 收藏 21 分鐘

現(xiàn)在,AI技術(shù)、GPT等大模型應(yīng)用正在加快對(duì)互聯(lián)網(wǎng)行業(yè)的“入侵”,這也倒逼著相關(guān)的互聯(lián)網(wǎng)從業(yè)人員開(kāi)展內(nèi)容學(xué)習(xí)。那么對(duì)非技術(shù)人員來(lái)說(shuō),如果想擁抱AI時(shí)代,可以基于哪些內(nèi)容進(jìn)行搜索學(xué)習(xí)?本文作者便發(fā)表了他作為非技術(shù)人員的思考和啟發(fā),一起來(lái)看一下吧。

從2023年農(nóng)歷春節(jié)開(kāi)工到現(xiàn)在,身邊每天都充斥著對(duì)GPT、LLM領(lǐng)域大量的媒體分析、行研報(bào)告、產(chǎn)品demo、社群活動(dòng)。熱度要比過(guò)去元宇宙、區(qū)塊鏈這些技術(shù)概念更加空前,可見(jiàn)他對(duì)底層技術(shù)的變革是如此的歇斯底里。

作為一枚數(shù)據(jù)產(chǎn)品經(jīng)理,苦研數(shù)周,輸出倒逼,簡(jiǎn)單總結(jié)了一些自己的學(xué)習(xí)心得。

前言

  1. 用大白話讓非技術(shù)人員了解這一技術(shù)的關(guān)鍵點(diǎn),如想深度探索,可基于此搜索學(xué)習(xí)。
  2. 讓互聯(lián)網(wǎng)行業(yè)產(chǎn)品、運(yùn)營(yíng)等人員在工作中想要應(yīng)用這一技術(shù)時(shí)有基本的框架思維。
  3. 作者非AI技術(shù)出身,有表述不準(zhǔn)的地方,歡迎指正。

一、ChatGPT與GPT通識(shí)

ChatGPT是一個(gè)聊天應(yīng)用。一個(gè)輸入框,輸入你想問(wèn)他的任何問(wèn)題,他會(huì)給你一個(gè)答案,并且這個(gè)答案看起來(lái)是經(jīng)過(guò)思考、講究語(yǔ)法并且正確的。他理解你的語(yǔ)言,并能用你的語(yǔ)言給你答案。

而這背后,就是GPT這個(gè)大模型在發(fā)揮作用(Generative Pre-trained Transformer),翻譯為“基于Transformer的生成式預(yù)訓(xùn)練模型”(引號(hào)里的中文值得逐字理解),通俗點(diǎn)講,這個(gè)模型的目的就是理解你輸入的文字,然后計(jì)算答案,然后用你能懂的語(yǔ)言進(jìn)行呈現(xiàn)。

至于什么是Transformer、它為什么可以做到,這背后的技術(shù)點(diǎn),我們下文展開(kāi)。

對(duì)于行業(yè)小白,我們先科普幾個(gè)這個(gè)行業(yè)關(guān)鍵詞:

  • NLP:Natural Language Processing,自然語(yǔ)言處理。
  • AGI:General Artificial Intelligence,通用人工智能。
  • LLM:Large Language Modle,大語(yǔ)言模型。
  • AIGC:AI-generated content,互聯(lián)網(wǎng)人應(yīng)該都聽(tīng)過(guò)UGC、PGC,沒(méi)錯(cuò)這個(gè)就是AIGC,AI生成內(nèi)容。

連起來(lái)造句就是:要想讓AI達(dá)到通用人工智能(AGI)的程度,自然語(yǔ)言(NLP)領(lǐng)域的大語(yǔ)言模型(LLM)能力是非常重要的,大語(yǔ)言模型(LLM)領(lǐng)域有一個(gè)重要的應(yīng)用就是AIGC。

二、GPT大模型背后的關(guān)鍵技術(shù)點(diǎn)

如果你想要研究清楚GPT背后的技術(shù)點(diǎn)以及發(fā)展脈絡(luò),可以先從以下幾個(gè)概念入手。

1. Transformer

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

你可以理解為他是一個(gè)特征提取器,中文語(yǔ)義:轉(zhuǎn)換器,他的目的就是把你給他的文本數(shù)據(jù)進(jìn)行理解學(xué)習(xí),形成他認(rèn)為的人類語(yǔ)法。有資料說(shuō)明,光GPT3就用了45TB的文本數(shù)據(jù),涵蓋中文、英文等多國(guó)語(yǔ)言,模型生成了超1.7萬(wàn)億的參數(shù)。就像一個(gè)一兩歲的孩子,沒(méi)背單詞、沒(méi)背語(yǔ)法、沒(méi)學(xué)拼音也會(huì)說(shuō)話一樣。這中間的實(shí)現(xiàn)就是這個(gè)模型在起作用。所以也堪稱暴力美學(xué)。

用技術(shù)術(shù)語(yǔ)說(shuō),Transformer的核心是自注意力機(jī)制(self-attention),它可以讓模型在處理序列數(shù)據(jù)時(shí),將不同位置的信息加權(quán)組合起來(lái),從而更好地理解輸入序列的結(jié)構(gòu)和含義。這其中的核心手段是編碼和解碼,即Encoder和Decoder。

Encoder把輸入文本編碼成一系列向量,Decoder則將這些向量逐一解碼成輸出文本。在每一個(gè)Encoder和Decoder中,都有多個(gè)自注意力層和前饋神經(jīng)網(wǎng)絡(luò)層組成。這些層通過(guò)不斷傳遞信息和調(diào)整參數(shù),最終將輸入轉(zhuǎn)化為一個(gè)意義準(zhǔn)確的輸出。

2. MLM(Masked Language Modeling)

MLM(掩碼語(yǔ)言模型)是 GPT 預(yù)訓(xùn)練中的一個(gè)關(guān)鍵技術(shù)點(diǎn),其目的是通過(guò)對(duì)輸入序列中的部分單詞進(jìn)行遮蓋,使模型在預(yù)測(cè)下一個(gè)單詞時(shí)能夠?qū)W習(xí)到上下文的信息。簡(jiǎn)單但很巧妙。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

在MLM中,模型會(huì)在輸入的文本序列中隨機(jī)選擇一些單詞,并將其替換為特殊的MASK標(biāo)記。模型的任務(wù)是預(yù)測(cè)這些MASK標(biāo)記所代表的單詞是什么。因?yàn)槟P椭荒苡^察到MASK標(biāo)記周圍的文本,因此它需要對(duì)上下文進(jìn)行建模,以便正確地預(yù)測(cè)MASK標(biāo)記所代表的單詞。Transformer、MLM等等這些架構(gòu)、算法和模型設(shè)計(jì)讓GPT問(wèn)世,而Prompt和Fine-tune可以讓我們能更好的使用他。

3. Prompt

中文語(yǔ)義:提問(wèn)、提示語(yǔ)。在與ChatGPT對(duì)話的時(shí)候,我們的輸入即為prompt,想要讓GPT更好的理解我們的意圖,那prompt的精度就決定了這個(gè)大模型能否高效理解我們的意圖。

特別是在AIGC領(lǐng)域,只要你能想到,他就可以給你反饋。如果把GPT看做一個(gè)知識(shí)的海洋、一個(gè)可以持續(xù)再生的金庫(kù),人類想要攫取,那Prompt會(huì)變得非常非常非常重要,它就是那個(gè)金鑰匙。

4. Fine-tune

中文語(yǔ)義:微調(diào)。企業(yè)在應(yīng)用AI能力時(shí),GPT可以定義為一個(gè)理解自然語(yǔ)言的初始模型,為了更好地應(yīng)用在業(yè)務(wù)場(chǎng)景中,可以在GPT的基礎(chǔ)上進(jìn)行微調(diào),理解為一個(gè)有監(jiān)督學(xué)習(xí)的過(guò)程,喂給他我們的業(yè)務(wù)數(shù)據(jù)或領(lǐng)域數(shù)據(jù)集,讓他能讀懂我們的業(yè)務(wù)數(shù)據(jù)并按需輸出。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

三、大語(yǔ)言模型對(duì)軟件產(chǎn)品的改變

1. 用戶需求被直觀暴露

目前的軟件產(chǎn)品,用戶的真實(shí)需求主要是通過(guò)在軟件產(chǎn)品內(nèi)的行為數(shù)據(jù)進(jìn)行發(fā)現(xiàn)和理解,如監(jiān)控用戶反復(fù)查看某個(gè)商品、用戶搜索了某個(gè)商品、用戶將什么商品添加到了購(gòu)物車,基于此進(jìn)行分析、預(yù)測(cè),根據(jù)用戶行為反饋再進(jìn)行調(diào)優(yōu)。

當(dāng)有了自然語(yǔ)言處理的能力,用戶會(huì)直接暴露自己的需求,如“我需要購(gòu)買從北京到三亞的往返機(jī)票,旅途5天,希望有一半時(shí)間住民宿,機(jī)票和住宿一共7000元預(yù)算,請(qǐng)給我提供一個(gè)規(guī)劃”。

這種簡(jiǎn)單粗暴的交互,會(huì)迭代目前“業(yè)務(wù)與行為數(shù)據(jù)采集、數(shù)據(jù)聚合與處理、用戶畫(huà)像建模、人/物標(biāo)簽計(jì)算、推薦算法、反饋調(diào)優(yōu)”的整套數(shù)據(jù)工程。當(dāng)下自然語(yǔ)言所暴露出來(lái)的需求會(huì)在數(shù)據(jù)集中占更大的權(quán)重。

2. 新的人機(jī)交互

ChatGPT、Midjourney+Discord、文心一言等現(xiàn)在都是通過(guò)聊天框模式提供服務(wù)。這確實(shí)也是人與機(jī)器通過(guò)自然語(yǔ)言溝通最理想的方式。但chat模式不是當(dāng)前人機(jī)交互的終極形態(tài)。

人與機(jī)器交互,想要達(dá)成期望結(jié)果,對(duì)話框、對(duì)話框+命令行、對(duì)話框+插件并不是當(dāng)前人機(jī)交互的終極形態(tài)。

所以chat不是結(jié)果,但,已成必須。

比如我們的日常學(xué)習(xí)某一軟件,特別PS、數(shù)據(jù)分析工具等,學(xué)習(xí)門(mén)檻很高,這是因?yàn)檐浖O(shè)計(jì)是自下而上的設(shè)計(jì),人機(jī)交互的連接點(diǎn)是鼠標(biāo)(或約等于鼠標(biāo)的手指)。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

想要讓軟件以及他的宿主——計(jì)算機(jī),識(shí)別你的意圖,開(kāi)發(fā)者需要完全依賴于鼠標(biāo)在計(jì)算機(jī)上的點(diǎn)擊、拖拽、滾動(dòng)等交互方式來(lái)設(shè)計(jì)軟件反饋。而現(xiàn)在,有了一種新的范式,就是自然語(yǔ)言?;贚LM這樣的大模型,機(jī)器已經(jīng)或逐步可以足夠理解人類的語(yǔ)言并做出正確的反映。如果再有鼠標(biāo)的交互加持,人類使用機(jī)器的效率會(huì)有更大程度的提升。

所以自然語(yǔ)言交互可能會(huì)成為所有軟件產(chǎn)品的必須。

3. 插件化一些軟件,再淘汰一些軟件

軟件的工具如 word、PPT、EXCEL、印象筆記、Xmind、github正在“+AI”以降低使用成本了。你可以自研AI能力,也可以讓自己被插件。當(dāng)新的用戶習(xí)慣被養(yǎng)成,那些不能AI化的軟件會(huì)顯得異常難用。

比如一個(gè)數(shù)據(jù)分析平臺(tái),

如果數(shù)據(jù)查詢只能通過(guò)自助式點(diǎn)選,而不是問(wèn)答式就會(huì)面臨用戶體驗(yàn)差評(píng),如果數(shù)據(jù)查詢報(bào)表還需要人來(lái)去總結(jié)數(shù)據(jù)基礎(chǔ)表征,而不是自動(dòng)進(jìn)行總結(jié)也會(huì)面臨用戶體驗(yàn)差評(píng)。

于是,產(chǎn)品就會(huì)有逐步被棄用的風(fēng)險(xiǎn)。

4. 想象力變得更為重要

工具本身的術(shù)變得不是那么重要,AIGC類型的工具使用門(mén)檻相對(duì)變低,但對(duì)人的大腦反而提出了更高的要求。

人的想象力是無(wú)限的,但實(shí)現(xiàn)能力是有限的,而AIGC工具,他可以讓想象具象化,甚至在你創(chuàng)作過(guò)程中給你驚喜。

過(guò)去做一張如下的圖需要在設(shè)計(jì)軟件上進(jìn)行至少數(shù)小時(shí)的操作,初級(jí)選手光設(shè)計(jì)工具就得學(xué)習(xí)很久。如果這個(gè)需求是來(lái)自于客戶,那這其中的溝通和理解成本會(huì)變?yōu)楹艽蟮脑O(shè)計(jì)成本。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

圖:在Midjourney平臺(tái)的創(chuàng)作而現(xiàn)在,你只需要描述你想要的,即使你要一個(gè)五彩斑斕的黑,AI也會(huì)實(shí)時(shí)給你一個(gè)他認(rèn)為正確的反饋,你可以基于此不斷用語(yǔ)言進(jìn)行調(diào)整或輔之以設(shè)計(jì)師的PS之術(shù)。

想象力變得越來(lái)越重要,甚至可以說(shuō)得到了釋放。

四、值得思考的地方

1. 依然存在的學(xué)習(xí)成本

機(jī)器可以理解人類的語(yǔ)言,但并不代表可以精準(zhǔn)理解人的意圖。這之間的gap需要人去不斷對(duì)機(jī)器調(diào)優(yōu),如模型迭代,同時(shí)也需要人去了解機(jī)器的語(yǔ)法,比如現(xiàn)在的Midjourney、playground,你的提問(wèn)或prompt的使用也是有語(yǔ)法的,并配合圖形界面上的一些控制功能。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

圖:Midjourney的prompt“語(yǔ)法“,來(lái)自于網(wǎng)絡(luò)視頻

2. 置信度

說(shuō)GPT一本正經(jīng)胡說(shuō)八道,不是沒(méi)有證據(jù),這是我最近的實(shí)際測(cè)試。

我:140和290之間有多少個(gè)質(zhì)數(shù)?

ChatGPT:

140到290之間的質(zhì)數(shù)包括:149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293。因此,140到290之間有28個(gè)質(zhì)數(shù)。

我:直接告訴我有多少個(gè),而不是列出來(lái)。

ChatGPT:在140和290之間,共有28個(gè)質(zhì)數(shù)。

我:確定?

ChatGPT:是的,確定。

我:重新計(jì)算一下,再給我一個(gè)答案。

ChatGPT:非常抱歉,在上一個(gè)回答中我犯了一個(gè)錯(cuò)誤,實(shí)際上在140到290之間有23個(gè)質(zhì)數(shù)。感謝您的提醒,希望這次的回答能夠滿足您的要求。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

你以為這就是正確答案?這還不算完,于是我讓他寫(xiě)了一個(gè)python腳本:

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

代碼沒(méi)問(wèn)題,我執(zhí)行了,于是:

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

沒(méi)錯(cuò),按ChatGPT給我的python執(zhí)行,答案是27。誒?換個(gè)角度想,他也會(huì)犯錯(cuò),是不是更像人類?

3. 可解釋性

可解釋是可信的前提。我們塑造了他,卻不了解他,如果他輸出了一個(gè)錯(cuò)誤的答案,但看起來(lái)是那么正確,這時(shí)候我們就得警惕了(就像文中那個(gè)求解質(zhì)數(shù)問(wèn)題,看起來(lái)是那么正確),應(yīng)用在教育、醫(yī)療、建筑設(shè)計(jì)等領(lǐng)域,他輸出了一個(gè)錯(cuò)誤的藥方、他設(shè)計(jì)了一個(gè)尺寸差了幾公分的圖紙,如果他犯的錯(cuò)誤無(wú)法及時(shí)發(fā)現(xiàn),那他產(chǎn)生危害需要人類來(lái)買單。

我們需要了解他的決策動(dòng)機(jī)是如何生成的,沒(méi)錯(cuò),就是動(dòng)機(jī)。因?yàn)槿嗽跊Q策哪怕是犯罪,都會(huì)尋求背后的動(dòng)機(jī),是利他、利己還是此人有精神疾病,最終都會(huì)試圖用動(dòng)機(jī)來(lái)解釋。

不能只推導(dǎo)到用了什么計(jì)算框架和算法,然后就給他不停地喂數(shù)據(jù),要想讓他更好的為我們服務(wù),找到合適的時(shí)機(jī)影響他,而不是任由他,最后可能站在我們的對(duì)立面。

換句話說(shuō),“知其所以然”也是我們求知的源動(dòng)力。

4. 數(shù)據(jù)安全、用戶隱私與版權(quán)

數(shù)據(jù)是GPT的養(yǎng)料,用戶的數(shù)據(jù)從此變得越來(lái)越重要,想要微調(diào),普通用戶想要使用,需要貢獻(xiàn)一方數(shù)據(jù)。GPT無(wú)國(guó)界,但數(shù)據(jù)有國(guó)界。目前國(guó)內(nèi)中大型企業(yè)對(duì)GPT的API能力也仍處于封閉狀態(tài)(所以我們國(guó)家也一定會(huì)有自己的大模型,比如百度文心一言)。

關(guān)于版權(quán),我們看ChatGPT自己如何說(shuō):

“根據(jù)國(guó)際版權(quán)法,創(chuàng)作作品的版權(quán)通常歸原作者所有。但是,當(dāng)作品是由人工智能生成時(shí),問(wèn)題就變得復(fù)雜了。因?yàn)槿斯ぶ悄鼙旧頉](méi)有創(chuàng)作權(quán),它只是根據(jù)預(yù)設(shè)的算法和數(shù)據(jù)生成內(nèi)容。所以,根據(jù)現(xiàn)有的版權(quán)法律,AIGC的版權(quán)歸誰(shuí)是一個(gè)尚未確定的問(wèn)題。

另外,AIGC的版權(quán)問(wèn)題還涉及到人工智能的產(chǎn)權(quán)和知識(shí)產(chǎn)權(quán)。在AIGC的生成過(guò)程中,通常會(huì)涉及到許多算法、數(shù)據(jù)、模型和程序等,這些都是有產(chǎn)權(quán)和知識(shí)產(chǎn)權(quán)的。因此,除了作品版權(quán)的問(wèn)題之外,還需要考慮這些產(chǎn)權(quán)和知識(shí)產(chǎn)權(quán)的歸屬問(wèn)題。

綜上所述,AIGC的版權(quán)問(wèn)題是一個(gè)復(fù)雜的問(wèn)題,需要在法律、技術(shù)和倫理等多個(gè)方面進(jìn)行探討和解決。我們需要尋求各方面的意見(jiàn)和建議,來(lái)制定適當(dāng)?shù)姆珊驼?,以促進(jìn)人工智能技術(shù)的發(fā)展和利用?!?/p>

5. 責(zé)任與義務(wù)

自動(dòng)駕駛時(shí)發(fā)生了事故,駕駛員需要承擔(dān)100%的責(zé)任。同樣的,使用AI工具工作,如果犯錯(cuò)了,無(wú)論是工具還是人為的錯(cuò)誤,那責(zé)任依然歸咎于人。

所以人類責(zé)任與義務(wù)的存在,決定了即使在AI時(shí)代,某些工作至少需要一個(gè)人來(lái)?yè)?dān)(bei)責(zé)(guo)。

6. 可持續(xù)性

這個(gè)大模型確實(shí)可以成為一個(gè)可持續(xù)再生的金庫(kù),為人類服務(wù)。不過(guò)此時(shí),他已經(jīng)站在我們身旁,一同跟我們進(jìn)化,人類長(zhǎng)高1厘米,他可能會(huì)長(zhǎng)高3厘米。

GPT、大語(yǔ)言模型入門(mén)版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識(shí)與個(gè)人思考

但如果人類停止對(duì)他的數(shù)據(jù)輸入,無(wú)論是新的知識(shí)、新的研究、還是今天的新聞,甚至對(duì)他的答案不做任何反饋。那么他也會(huì)過(guò)時(shí)或不那么好用。為了有更多的金礦可以攫取,我們會(huì)進(jìn)入一個(gè)循環(huán),不停的喂養(yǎng)他,迭代他,對(duì)他的輸出再反饋,他也不停地進(jìn)化為我們服務(wù)。

五、職業(yè)發(fā)展

什么樣的職業(yè)會(huì)被取代,不如想想什么樣的職業(yè)會(huì)變得越來(lái)越重要。我覺(jué)得可以從兩個(gè)角度思考:

1. AI建造師

AI本身也是人創(chuàng)造出來(lái)的,如果他會(huì)取代一部分人的工作,那就走到上游去成為創(chuàng)造他的人。AI算法工程師、數(shù)據(jù)采集與治理專家、AI軟硬件產(chǎn)品設(shè)計(jì)與開(kāi)發(fā)、芯片、AI領(lǐng)域新聞媒體,這些都是以AI為中心的上下游領(lǐng)域。

2. 會(huì)用AI的人

一部分會(huì)用AI工具的人已經(jīng)嘗到了甜頭,比如已經(jīng)在Youtube、B站分享AI工具使用以及做教程的up主,他們都是第一波會(huì)用AI的人,已經(jīng)賺到了AI啟蒙的紅利。

在企業(yè)內(nèi),AI可能不會(huì)完全替代某一崗位,但會(huì)替換掉一部分。如設(shè)計(jì)師、工程師,基礎(chǔ)工作可以交給AI來(lái)做,但AI輸出的結(jié)果需要有人審驗(yàn),更重要的是需要有人擔(dān)責(zé),所以也會(huì)需要部分專職。

專欄作家

一個(gè)數(shù)據(jù)人的自留地,公眾號(hào):一個(gè)數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊(cè)》作者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!