生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)
大模型發(fā)展到現(xiàn)在,在各個(gè)領(lǐng)域的應(yīng)用已經(jīng)很強(qiáng)了。人類夢(mèng)想的強(qiáng)人工智能,是不是已經(jīng)來到了?看懂現(xiàn)在,展望未來,或許可以從回顧歷史開始。
一轉(zhuǎn)眼已經(jīng)到了2024年的4月,不知道屏幕前的各位是否安好,距離大語言模型,或者說GPT,被很多人熟知已經(jīng)過了一年半。
作為互聯(lián)網(wǎng)從業(yè)者,第一次給我?guī)碚鸷巢⒎鞘莄hatGPT,而是在更早之前使用Github Copilot;
一個(gè)可以幫助開發(fā)者自動(dòng)寫代碼的工具。
一個(gè)「聰明」的代碼助手
關(guān)于自動(dòng)寫代碼的工具,也就是代碼輔助,其實(shí)開發(fā)者的編輯器一直都有;
給非開發(fā)者的小伙伴舉個(gè)例子:就像上圖,編輯器會(huì)根據(jù)你當(dāng)前的輸入給出代碼的提示,此類提示都是語法的提示,機(jī)器其實(shí)并不知道你究竟要寫什么代碼,只是在匹配在字典中提前做好映射關(guān)系的字段,就像輸入“今天”,輸入法推薦,“今天很開心”一樣,輸入法并不知道這句話什么意思。
同時(shí)是代碼提示,為什么Github Copilot可以給我一種震驚的感覺呢?
Copilot仿佛能夠看懂我的代碼,并給出他的建議,而不是語法上的提示,就像真的有一個(gè)程序員在幫我寫代碼。
這種感覺就像:你想拿掃把來掃地,結(jié)果掃把自己動(dòng)起來了,而且還知道具體怎么掃,而你需要的只是,確定一下。
這是一種非常的震撼的感覺。
而Github Copilot這個(gè)工具的背后,就是微軟與openAI公司合作開發(fā)的一款人工智能工具,這款產(chǎn)品正是基于生成式AI GPT3.0進(jìn)行實(shí)現(xiàn)。
如果AI都能“看懂”代碼,并可以編寫代碼,距離直接看懂人類的語言還遠(yuǎn)嗎?
我們?nèi)祟愐恢币詠淼膲?mèng)想強(qiáng)人工智能(AGI),是不是已經(jīng)來到了我們的身邊?人工智能正在如何改變我們的生活?它將把我們帶向何方?
看懂現(xiàn)在,展望未來,或許可以從回顧歷史開始。
古老的夢(mèng)想
人工智能的起源可以追溯到神話、哲思、想象。
早在機(jī)器人(robot)的概念被大眾所知曉之前,人類世界就有了很多關(guān)于自動(dòng)機(jī)械的想象,多被稱為“automaton”,該詞最早起源于亞里士多德的《物理學(xué)》。
大約在2500年前的古希臘神話中,人類歷史上出現(xiàn)了一個(gè)行走的機(jī)器人,據(jù)《荷馬史詩》描述,那是一個(gè)叫做塔洛斯的銅制巨人,保護(hù)克里特島免受外來入侵。
除了古希臘羅馬文化,其他文明也不乏對(duì)人工智能的探索,猶太人傳說中存在有生命的泥人,印度傳說中守護(hù)佛祖舍利子的機(jī)器人武士,雖然這些似乎都和現(xiàn)在我們理解的人工智能不相關(guān),但是總是能夠看到人類嘗試模擬、創(chuàng)造人類的夢(mèng)想。
這樣的超級(jí)智能的機(jī)器,依舊是更多的存在于想象而不是現(xiàn)實(shí),至少目前是如此。
而我們今天的主角AI,作為計(jì)算機(jī)科學(xué)的一個(gè)分支,一個(gè)短短70年的歷史的學(xué)科,似乎讓這一切有了可能性。
經(jīng)典人工智能時(shí)代
1956年,4位AI鼻祖麥卡錫(John McCarthy)、明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(nóng)(Claude Shannon)一起寫一份提案,人工智能(artificial intelligence)一詞正式亮相。
人們開始研究機(jī)器是否可以模擬人類的認(rèn)知、學(xué)習(xí)過程,用邏輯推理與現(xiàn)有信息來解決問題,并做出決定?
1957年,AI的第一個(gè)研究方向確定了:符號(hào)主義(symbolists),后來我們稱之為:經(jīng)典人工智能。
符號(hào)主義源于數(shù)理邏輯、基于邏輯表達(dá)式,用數(shù)學(xué)和物理中的邏輯符號(hào)來表達(dá)思維的形成,最終產(chǎn)生人一樣的推理與決策;
簡(jiǎn)單來說:如果我們把這個(gè)世界所有的問題都告訴AI,AI就能幫助人類解決問題了。比如:
看到紅燈 = 停下;看到綠燈 = 通過;禁止停車的標(biāo)志 = 禁止停車;
任何形式化的符號(hào)問題都可以被此程序解決,理想情況下機(jī)器將知道了所有“符號(hào)”在物理世界的含義。在這樣的原理的基礎(chǔ)上,通用問題解決器(General Problem Solver)誕生了,后面也被稱為專家系統(tǒng)。
其原理其實(shí)非常簡(jiǎn)單:內(nèi)部包含一個(gè)巨量的知識(shí)庫(kù),就像“專家的腦袋”,以及推理引擎,用戶理解人類語言的技術(shù)從知識(shí)庫(kù)中尋找最可能的問題的答案。
在接下來的20年中,專家系統(tǒng)逐漸被全世界接受,并且在知識(shí)庫(kù)、知識(shí)工程領(lǐng)域發(fā)揮了巨大的威力
但是,它能夠被稱得上是人工智能嗎?
很顯然這樣的邏輯匹配距離我們?nèi)祟惼谕娜斯ぶ悄苓€相差甚遠(yuǎn),通用問題解決器看似智能, 但實(shí)際上他們只是盲目地進(jìn)行模式匹配。
并且還存在一些難以解決的問題,專家系統(tǒng)維護(hù)費(fèi)用很高,它們難以升級(jí),難以使用,脆弱(當(dāng)輸入異常時(shí)會(huì)出現(xiàn)莫名其妙的錯(cuò)誤),專家系統(tǒng)的實(shí)用性僅僅局限于某些特定的場(chǎng)景。
1980年,美國(guó)哲學(xué)家約翰.瑟爾提出了一個(gè)思想實(shí)驗(yàn)《中文房間》:
當(dāng)有人說恭喜發(fā)財(cái)?shù)臅r(shí)候,我們就從這本書找到了對(duì)應(yīng)的答案,謝謝,再反饋給對(duì)方
一個(gè)對(duì)中文一竅不通,只說英語的人關(guān)在一間只有一個(gè)開口的封閉房間中。房間里有一本用英文寫成的手冊(cè),指示該如何處理收到的中文訊息及如何以中文相應(yīng)地回復(fù)。房外的人不斷向房間內(nèi)遞進(jìn)用中文寫成的問題。房?jī)?nèi)的人便按照手冊(cè)的說明,查找合適的指示,將相應(yīng)的中文字符組合成對(duì)問題的解答,并將答案遞出房間。
盡管房里的人可以以假亂真,讓房外的人以為他說中文,但事實(shí)上他根本不懂中文,就像通用問題解決器,他并不知道人類的語言究竟是什么意思。
雖然這似乎與”人工智能“差距還很大,但是為人工智能的發(fā)展作出重要貢獻(xiàn),專家系統(tǒng)的成功開發(fā)與應(yīng)用,為實(shí)現(xiàn)人工智能聯(lián)系實(shí)際走向應(yīng)用具有重要意義。
機(jī)器學(xué)習(xí)時(shí)代
在專家系統(tǒng)大放異彩的時(shí)候,另一個(gè)在2000年左右大放異彩的技術(shù)已經(jīng)出現(xiàn),機(jī)器學(xué)習(xí)(Machine Learming)。
1952年,阿瑟·薩繆爾在IBM公司工作時(shí)研制了一個(gè)西洋跳棋程序,這個(gè)程序具有“學(xué)習(xí)能力”,它可以通過大量棋局的對(duì)弈,越來越會(huì)下跳棋;并且程序很快就下贏了薩繆爾自己。
該程序推翻了一直以來人類的傳統(tǒng)認(rèn)知:計(jì)算機(jī)不可能超越人類。
關(guān)于機(jī)器學(xué)習(xí)后來也有了準(zhǔn)確的定義:在不直接針對(duì)問題進(jìn)行編程的情況下,賦予計(jì)算機(jī)學(xué)習(xí)能力的研究領(lǐng)域。
但是為什么在2000年之前的幾十年的時(shí)間里面,機(jī)器學(xué)習(xí)這一概念一直被專家系統(tǒng)遮掩了光明呢?
因?yàn)闄C(jī)器學(xué)習(xí)需要巨量的知識(shí)來進(jìn)行學(xué)習(xí),在互聯(lián)時(shí)代還不夠發(fā)放的時(shí)候,想獲取大量的數(shù)據(jù)并非易事,比如讓機(jī)器學(xué)習(xí)識(shí)別小狗,就需要巨量的小狗的照片。然而到了20世紀(jì)90年年代,隨著互聯(lián)網(wǎng)時(shí)代的到來了,爆炸式增加的數(shù)據(jù),讓機(jī)器學(xué)習(xí)獲得了充足的養(yǎng)料。
隨后我們迎來了AI的機(jī)器學(xué)習(xí)的發(fā)展浪潮,以及一些震驚世界的標(biāo)志性的事件
- 1997年IBM的深藍(lán)在世界象棋領(lǐng)域擊敗了冠軍卡斯帕洛夫
- 2016年AlphaGo在圍棋領(lǐng)域擊敗了排名世界第一的柯潔
在2000年以后,機(jī)器學(xué)習(xí)不斷發(fā)展,開始出現(xiàn)了很多分支、有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、集成學(xué)習(xí),機(jī)器學(xué)習(xí)伴隨移動(dòng)互聯(lián)網(wǎng)滲透到到我生活中
比如使用有監(jiān)督學(xué)習(xí)+無監(jiān)督學(xué)習(xí),可以實(shí)現(xiàn)了讓我們每個(gè)人受益的推薦系統(tǒng),比如網(wǎng)易云的每日推薦音樂、抖音的推薦、淘寶的推薦,這些都可以算作機(jī)器學(xué)習(xí)的范疇,他們?cè)诖诡愵I(lǐng)域做到了比用戶更加了解自用戶己。
既然AI已經(jīng)存在這么多年,并且對(duì)我們每個(gè)人都存在深遠(yuǎn)的影響,為什么似乎我們以前沒有學(xué)習(xí)AI的焦慮呢?
我覺得原因主要是:機(jī)器學(xué)習(xí)的人工智能,只能在垂類訓(xùn)練與發(fā)揮能力,比如做推薦、做分析,并非通用性的人工智能。
并且稍微深入了解,大家都知道一點(diǎn),就是本質(zhì)上,他并不知道人類世界,依舊是機(jī)器,我們依舊可以使用機(jī)器的運(yùn)作邏輯去解釋他。
直到大語言模型的到來。
大型語言模型
2018年,OpenAI發(fā)布了第一個(gè)代號(hào)為“ChatGPT的生成預(yù)訓(xùn)練變換器模型”,這是一種新型的深度學(xué)習(xí)模型。
深度學(xué)習(xí)起源于1943年,由美國(guó)神經(jīng)科學(xué)家麥卡洛克提出神經(jīng)元的數(shù)學(xué)模型,參數(shù)越大,代表神經(jīng)元越多,比如GPT-3的相當(dāng)于人腦中1750億的神經(jīng)元。
2019年,GPT-2發(fā)布,擁有1.5億參數(shù)(參數(shù)可以理解為知識(shí)量),已經(jīng)可以做到配流暢的生成文本、一定程度的理解上下文。
2020年,GPT-3發(fā)布,擁有1750億參數(shù),在文本生成、創(chuàng)作、代碼生成多個(gè)領(lǐng)域展現(xiàn)出驚人的實(shí)力,在巨量數(shù)據(jù)以及技術(shù)優(yōu)化下,GPT-3開始涌現(xiàn)出“智慧”,它似乎形成了智慧。
2022年11月底,OpenAI發(fā)布了GPT 3.5模型驅(qū)動(dòng)的ChatGPT。
5天之后,該網(wǎng)站注冊(cè)用戶超過100萬。
眾所周知,早些時(shí)候注冊(cè)GPT并不是簡(jiǎn)單的事情,我們使用國(guó)內(nèi)科技愛好者搭建的鏡像網(wǎng)站,和chatGPT聊了很多,只是當(dāng)時(shí)我沒有意識(shí)到,一個(gè)能聽懂人類的語言,感知人類的情緒,并能夠提出建議的AI是一種什么樣的存在。
直到2023年2月,chatGPT開始出圈,開放API接口能力,讓大家都可以基于GPT做應(yīng)用、發(fā)布更強(qiáng)的GPT4、多模態(tài)能力、文生圖能力。
那一個(gè)月我感到非常焦慮,因?yàn)槲彝蝗灰庾R(shí)到了我這身處人類歷史的一個(gè)里程碑,大語言模型讓人類一直以來追求的真正的通用型人工智能不再遙不可及,遠(yuǎn)在幾千年前的神話故事有了發(fā)生在人類世界的可能性。
《創(chuàng)造亞當(dāng)》時(shí)刻來了,上帝創(chuàng)造了亞當(dāng),人類創(chuàng)造了AI。
雖然他還存在很多限制,比如模型本身不能聯(lián)網(wǎng)、記憶是有限的、偶爾會(huì)瞎回答,但是他也表現(xiàn)出了類似人類的智能,它理解你文字的含義,滿足你的各種需求。
這樣的人工智能的想象空間實(shí)在是太大了,隨著更多資源的投入,生成式人工智能將會(huì)在未來幾年得到超快速的發(fā)展,以及逐漸在我們生活中出現(xiàn)。
我們國(guó)內(nèi)相應(yīng)也出現(xiàn)了很多生成式人工智能,比如在側(cè)重?cái)?shù)理領(lǐng)域的文心一言、多模態(tài)領(lǐng)域表現(xiàn)出色的通義千問、自然語言理解出色的云雀大模型、2000K長(zhǎng)文的KimiChat、各項(xiàng)評(píng)分不俗的智譜清言。
雖然與美國(guó)有些差距,但是在大模型這個(gè)領(lǐng)域我們依舊走在前沿,互聯(lián)網(wǎng)公司的大語言模型,將會(huì)逐漸賦能各家App,由該技術(shù)支撐的AI助手會(huì)逐漸走到每一個(gè)消費(fèi)者的面前。
大語言模型對(duì)于我們所生活的世界的改造已經(jīng)在發(fā)生,并且呈現(xiàn)不可阻擋之勢(shì)。
身處時(shí)代洪流之中的我們
每當(dāng)新的先進(jìn)技術(shù)的出現(xiàn),一些工作就會(huì)消失,就業(yè)市場(chǎng)也會(huì)發(fā)生改變。
當(dāng)鬧鈴出現(xiàn)的時(shí)候,那些專門敲門提醒人們起床的工作消失了。
當(dāng)計(jì)算器出現(xiàn)的時(shí)候,專門計(jì)算的人就會(huì)失業(yè)。
這并非壞事,我們工作中重復(fù)、骯臟、沉悶、危險(xiǎn)或者困難的某些部分,未來都很有可能自動(dòng)化;我們將更加專注我們工作的本質(zhì),例如創(chuàng)造力、解決問題、同理心、領(lǐng)導(dǎo)力。
如果說工業(yè)革命為人類創(chuàng)造了工業(yè)化的工作,那么生成式人工智能革命將使我們從這些工作中獲得解放與自由。這是對(duì)未來的范式徹底改變。
我們每個(gè)人都會(huì)變成自己的創(chuàng)意工作室,你的愿景和實(shí)現(xiàn)之間的障礙將消失,復(fù)雜的寫作、繪畫、音樂、電影和其他形式的創(chuàng)意制作工具將會(huì)被簡(jiǎn)化并觸手可及,人類將從消費(fèi)者轉(zhuǎn)換為創(chuàng)造者。
那我們現(xiàn)在應(yīng)該怎么做呢?
- 主動(dòng)學(xué)習(xí)、擁抱生成式AI,讓AI成為你的最佳助手
- 增強(qiáng)個(gè)人獨(dú)特的情感、創(chuàng)造力、交流能力,這是任何AI都無法模仿的
最后
讓更多人、更多組織可以從生成式AI中收益,是本系列文章的初衷;學(xué)會(huì)運(yùn)用AI,與AI和諧共處也是我們共同面臨的挑戰(zhàn),在接下來的系列文章中,我會(huì)使用通俗易懂的語言,與大家?guī)ьI(lǐng)大家學(xué)習(xí)與了解提示詞工程、插件、知識(shí)庫(kù)、agent,普通人也可以在很短的時(shí)間內(nèi)學(xué)習(xí)與使用AI,我們一起走到時(shí)代的前沿。
本文由 @狗阿木的產(chǎn)品日志 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
寫得太好啦!讀的津津有味
哈哈哈,謝謝夸張呀,記得關(guān)注,這是系列文章~
謝謝夸獎(jiǎng),打錯(cuò)字了