全網首發(fā),AI入門科普第一課,一張圖看懂AI關系網,刷到必看
在人工智能的浪潮中,你是否被各種專業(yè)名詞所困擾?從AI到深度學習,從監(jiān)督學習到無監(jiān)督學習,這些詞匯是否讓你感到頭皮發(fā)麻?別擔心,本文將帶你理清楚各種錯綜復雜的AI關系,讓你輕松入門AI。作為小白入門AI的第一課,這篇文章將為你揭開AI的神秘面紗,讓你對AI有更深入的了解。快來一起探索這個充滿無限可能的新世界吧!
想學習AI,但是經??吹竭@些專業(yè)名詞AI、生成式AI、AIGC、機器學習、監(jiān)督學習,無監(jiān)督學習,深度學習、強化學習等等各種AI專業(yè)詞匯的困擾!
看到這些詞匯,是不是還沒開始學,頭皮已經發(fā)麻!
還好,今天你刷到了小俠這期作品,今天我將用一張圖帶你理清楚各種錯綜復雜的AI關系。
一、什么是AI以及AI核心知識
問題1:什么是AI?
AI的定義:
AI是指機器能夠模擬人類的智能和行為,執(zhí)行復雜的任務,如理解語言、識別圖像、進行決策等。例如,自動駕駛汽車就是一種應用AI技術的典型例子,它可以通過感知環(huán)境、理解交通規(guī)則以及做出決策來實現自主駕駛。
通過定義,我們可以認識到AI就是替代人的機器,可以是軟件形式也可以是硬件形式,軟件形式比如裝在手機里的AI聊天軟件,脫離手機使用不了,硬件形式就如掃地機器人,只能解決特定問題存在。
對AI有了初步認識,接下來看看AI是如何訓練出來的。
與傳統(tǒng)軟件或者硬件不同,AI并不是制作出來的,而是通過訓練而來,因此與傳統(tǒng)軟件最大區(qū)別是AI可以自己決定做什么,回答什么,而傳統(tǒng)軟件要完成什么任務需要有人操作。
小俠前些天分享了一篇【關于AI對未來20年個人財富影響的文章】,里面就提到AI時代,為什么稱AI為新的時代,原因就在于AI的出現,打破了我們當前生活方式和工作習慣,就如剛剛提到的,傳統(tǒng)軟件需要人操作,AI時代,軟件操作并不一定由人來完成。
回到正題,提到訓練AI就得提到機器學習相關知識,機器學習是指讓機器自我學習和自我改進的一種技術,就像人類一樣,可以從失敗中成長,訓練AI也和培養(yǎng)人一樣,讓機器從現有的知識里面進行學習。
看看上面這張圖,機器學習里面包含監(jiān)督學習、無監(jiān)督學習、強化學習三種,這三種方式是讓機器學習不同知識,掌握不同能力的三種訓練方法,具體內容如下:
1)監(jiān)督學習:
是指讓機器通過已經標記好的數據或結果讓AI進行學習,并做出正確判斷,比如你教小孩子認識蘋果,你給他看一個蘋果,告訴他這是蘋果,然后再給他看另一個,問他這是什么。通過不斷的“教學”和“提問”,小孩子就能學會識別蘋果,監(jiān)督學習的原理和這個類似。
假設企業(yè)需要訓練一個客服AI,讓他準確回答客戶問題,我們就可以通過類似方法訓練AI,讓他準確識別問題并找出對應答案反饋給用戶。
2)無監(jiān)督學習:
就是讓計算機從一堆沒有標記的數據中找出規(guī)律和結構,比如讓小孩子從一堆沒有名字的玩具中,自己分類和歸納出哪些玩具是車子、哪些是動物一樣,通過多次的訓練,AI自己找出規(guī)律并做總結,從而讓AI具備掌握規(guī)律的能力。
假設你是一家電商公司的運營人員,你手頭有一大堆用戶的瀏覽、購買等相關數據,但是這些數據并沒有明確的標簽,比如哪些用戶是喜歡買時尚衣服,哪些用戶是喜歡買電子產品。 這時,你可以使用無監(jiān)督學習的方法,讓計算機自動根據用戶的行為數據,將用戶分成不同的群體,從而實現定制化營銷的目的。
3)強化學習:
是指讓計算機在不斷嘗試和錯誤中自我學習,通過相應的獎勵機制讓AI找到最佳結果的方法。 拿訓練寵物狗舉例,假設你有條小狗,你想讓它知道按鈴鐺就能獲取食物,起初寵物狗并不知道按鈴鐺與獲得食物之間存在關系,當寵物狗按到鈴鐺,你就給他食物,不管他是有意識還是無意識,時間長了,寵物狗就會發(fā)現一個規(guī)律,只要按鈴鐺,主人就會給我食物。隨后寵物狗會自我總結,驗證自己的判斷,嘗試按鈴鐺是否會獲取食物。
鈴鐺、食物一起組成了一個特定環(huán)境,在這種環(huán)境下寵物狗就能學習到獲取食物的方法。 強化學習和訓練寵物狗類似,就是給他獎勵,做錯了給與懲罰,作對了給與獎勵,多次訓練,AI就能找到規(guī)律并自我學習。
當然,有伙伴可能會問,狗獲取食物對他來說是獎勵,但是機器你總不能給他吃東西吧!
科學家也想到這個問題,方法也很簡單,就是給AI設置積分,對了給分,錯了扣分,大家平時用AI聊天工具是不是可以看到贊一下,踩一下的圖標,其實這就是大家?guī)椭髽I(yè)強化訓練他們AI的過程。
參與的越多,AI能力就越聰明。
以上三點是AI訓練較為基礎的部分,希望伙伴們看完這篇內容,面對這些專業(yè)詞匯不再陌生。
再來看看下面這張圖:
2. 什么是深度學習?
深度學習是在機器學習基礎上進一步訓練AI能力的方法,簡單來說就是讓AI模仿人類大腦,掌握學習和思考的過程,比如人類看到一張貓的照片時,我們會立刻認出這是一只貓。這是因為我們的大腦已經通過過去的經驗和學習,積累了對貓的認識。深度學習也是這樣,它會通過大量的圖片數據來學習,逐漸識別出圖片中的特征,最后就能準確地認出貓了。
生活中深度學習應用非常常見,例如刷臉支付,語音識別,自動駕駛等等場景,都是應用了AI深度學習的方法.
所以你會發(fā)現,新買的手機,掃臉解鎖偶爾會出錯,但是用的時間越長,出錯的概率越低。
AI核心圈最里面的一個圈,大語言模型,也稱之為LLM,簡單理解就是語言類的AI模型。
目前我們常說的各種AI軟件,背后就是用到大語言模型,他的主要特點是:
1)能夠理解人類自然語言。
這點在以往任何軟件中都沒出現過,傳統(tǒng)方式要識別人類語言意圖,方式是識別語句中關鍵字,比如我要洗澡,洗澡為關鍵字,軟件根據后臺有關洗澡的答案反饋一個結果給用戶。大語言模型則不同,他是通過深度學習中的 Transformer 架構來解決語義理解的問題,關于 Transformer 架構我們后面再做介紹。
2)能夠生成人類語言結果反饋給用戶。
與理解相反,就是AI能夠根據理解的語義生成人類能夠理解的語言反饋給用戶,比如讓AI寫詩,寫文章等等,都是這個能力的表現。
除大語言模型之外,還有一些垂直領域的模型,比如Stable Diffusion,擅長畫畫的繪畫模型,本草擅長中醫(yī)的中醫(yī)模型等等。
以上是有關核心圈的基礎知識,觀看到這里的伙伴,大家都理解了嗎?
如果覺得小俠分享還不錯,評論區(qū)回復“666”支持一下。
二、AIGC與AI應用層
接下來,我們看看大模型應用層相關知識,看看下面這張圖:
1. AIGC、生成式AI、Gen AI
先看看什么是AIGC?
AIGC與之相對的是UGC、PGC,AIGC指的是由AI生成的內容,包括文章,圖片,音樂,視頻等等。UGC、PGC分別指的是由用戶(普通人)生產的內容和專業(yè)人士生產的內容。
作為信息時代,任何品牌,產品想要告知用戶,都需要生產大量的內容發(fā)布到各大渠道,才能觸達用戶,比如通過直播帶貨,短視頻帶貨等等方式,因此內容生產作為當前時代是非常重要的一種手段。
剛剛提到了大語言模型和其他垂直模型,不同模型可以生產不同內容,比如繪畫的模型可以設計海報,寫文章的模型可以輸出營銷軟文,因此2023年作為AI最火熱的概念AIGC就孕育而生。
生成式AI和Gen AI與AIGC本質上并沒有什么區(qū)別,只是叫法上不一樣。
文章后面會提到AI Agent,作為時下最熱的兩個方向,小俠個人看好的是AI Agent方向,AIGC個人認為,只是超熱的概念,實際上并沒有那么高價值。
這里小俠給想深入學習AI的伙伴提個醒,AI時代想抓住AI紅利,重點研究學習方向一定要往AI Agent方向學習,AIGC只能說把AI當更高效的工具使用,并沒有發(fā)揮AI真實價值。
而AI Agent方向,能夠解決的問題實在太多,我們后面講到大模型層知識的時候再具體細聊。
2. AI應用層
AI應用層是我們絕大多數粉絲接觸最多的一個層級,伙伴們經常刷到的各種AI神器分享的視頻,都是應用層的內容,應用層主要劃分為:
1)AI效率工具。
有些是AI原生工具,比如火山寫作,Stable Diffusion,即夢,可靈等等!這些都是基于AI單獨開發(fā)出來的新型軟件,傳統(tǒng)軟件是實現不了這些功能的,因此叫AI原生工具。另外一些是AI賦能,比如飛書,釘釘,剪映等等,這些原本就有,只是融合AI,讓原本能力更加強悍。
2)聊天機器人。
英文名Chat Bot,這應該是大家接觸最廣,用的最多的AI軟件,像豆包,通義千問,文心一言,Chat GPT等等,軟件形式以自然語言交流為主,通過溝通方式解決用戶問題。
3)Prompt工具及社區(qū)。
小白可能比較陌生,Prompt指的是提示詞工程,意思就是整理能夠讓AI理解的命令,比如“假設你是一名律師”,“假設你是一名大學老師”等等,這種告訴AI的內容就是Prompt的知識。
為什么Prompt會是一門單獨的知識,主要是因為很多場景下,需要一個精準的提示詞才能夠讓AI完成目標任務你得讓AI知道它是誰,要干什么,什么能干,什么不能干等等。還有一些特定任務安排上,也需要非常明確的提示詞,AI才能真正理解你的用意,因此有對應的工具和社區(qū)。
像AI繪畫玩家口中常說的煉丹,其實也是提示詞工程的知識,只不過適用的模型是繪畫類的模型。
4)開發(fā)者社區(qū)。
與提示詞工程社區(qū)類似,都是讓大家學習交流的地方,像小俠發(fā)布的【弼小俠AI基地】,也是這個定位。
5)應用開發(fā)工具。
主要是開發(fā)AI應用的平臺,像小俠強烈推薦大家學習的Coze平臺,Dify平臺,這些平臺都是用來開發(fā)AI應用的工具平臺,里面包含了模型調用,插件調用,數據庫,知識庫等等各種開發(fā)所需要的功能。
與傳統(tǒng)軟件開發(fā)平臺不一樣,AI開發(fā)平臺都提供無代碼和低代碼兩種模式,特別適合新手學習,不用軟件開發(fā)背景,掌握相關知識都能設計出自己或者企業(yè)用的AI。
以上是有關AIGC與AI應用層相關的知識,做個總結:
應用層是普通人能抓住AI紅利的唯一機會,你可以是掌握了某些AI工具的具體使用方法,也可以是能夠熟練利用AI應用開發(fā)工具設計AI軟件,兩種方式都能讓你在AI時代找到賺錢的路徑。
小俠強烈推薦的是大家務必掌握coze或者dify等AI應用開發(fā)的知識,有了AI應用開發(fā)能力,不僅能解決自身需求,還能解決企業(yè)AI數字化升級的問題。
三、Agent與大模型層
下面我們再看看AI Agent與大模型層相關知識,看看下面這張圖:
.1. AI Agent
經常在網絡上看到Agent相關內容,那到底什么是Agent呢?
先看看AI Agent的定義:
Agent是一種具有感知、決策、行動能力的自主系統(tǒng),關注的是AI如何在復雜環(huán)境中執(zhí)行任務和達成目標,生成式AI是其組成部分之一,但AI Agent的范疇遠大于單純的生成任務。
聽起來是不是有點抽象?
簡單理解Agent就類似傳統(tǒng)意義機器人的簡配版,相比機器人就是少了手,少了腳,不能幫你疊衣服、干家務,其他都可以幫你完成!
比如讓AI幫你訂機票,打電話給老婆告訴他今天晚上回來等等。
沒有手和腳,AI到底能做什么?
前面提到軟件形式的AI和硬件形式的AI,Agent相當于軟件形式的AI。它能通過軟件方式處理你安排他的任務,像我們日常工作大多數都是用手機、電腦辦公,絕大多數場景都不需要用到硬件設備。
假設你是一個外賣小哥,給客戶送外賣途中出現了一點小意外導致外賣無法準時送達,如果你手機里安裝了Agent實現的AI助理,這個助理就能通過定位和時間等信息,幫你呼叫客戶,告訴它外賣會延遲送達信息,并且?guī)湍惬@取客戶的理解,免得平臺處罰。
這個場景下,就是應用了Agent的能力,他能讓AI具備一定業(yè)務處理能力。
想要實現這個業(yè)務場景,需要讓AI具備定位獲取,電話獲取,撥通電話,當前任務等能力和信息,我們可以借助前面提到的AI應用開發(fā)平臺開發(fā)這類AI助理,給他配置相關技能,從而實現這種能力。
目前Agent發(fā)展速度非???/strong>,相應技能和配套權限正在火速發(fā)展中,小俠去年接觸到Coze平臺,平臺更新到今天,平臺能調用的權限已經超過一萬多種,足以滿足大部分業(yè)務場景。
相比機器人,Agent會更加快到達我們日常生活和工作。小俠預計,最遲明年上半年,就有很多企業(yè)已經用上了私有AI解決公司實際業(yè)務問題。如果你的企業(yè)還沒有考慮過AI賦能,小俠提醒,可以開始了解AI相關知識了。
2. 大模型層
提到AI,經常映入眼簾的就是各種大模型, 圖中小俠羅列了一些主流的大模型,比如GPT-4,GPT-4o,豆包大模型,混元大模型,Gemin大模型還有Llama3大模型,這些可以理解為AI的大腦,主流的大模型都是大語言模型,解決語言類問題為主,適用場景廣泛。
通用大模型有個弊端,就是啥都懂,但是啥都不精!
企業(yè)如果直接用通用大模型,感受相當于你用豆包APP或文心一言這種AI聊天工具,讓他給你寫一個會議報告,生成出來的東西初看蠻好,細看不能用的感覺。
主要原因是通用大模型訓練時候主要目標是讓模型具備基礎能力,比如自然語言理解,數學推理,邏輯推理等基礎能力,而沒有針對具體業(yè)務場景單獨訓練,因此你讓通用模型具體干某個活,它是干不好的!
這個時候就要需要我們對通用模型進行微調和配置相應技能,又回到剛剛說的Agent這里了,Agent主要解決的就是通用模型沒辦法勝任具體工作的問題。
垂直大模型主要是針對特定技能訓練出來的模型,比如Stable Diffusion就是針對繪畫技能訓練出來的模型,其他能力不行,繪畫卻是一等一高手。后面我們會講到Transfomer架構知識,會談到Stable Diffusion訓練方法和大語言模型的區(qū)別,這里不做擴展,大家只需知道垂直大模型主要就是針對特定場景單獨訓練而來就行。
四、AI基礎層
這部分內容跟我們普通人關系不大,可以作為課外知識了解一下就行,具體看看下圖:
1. 基礎層
基礎層之所以稱之為基礎層,其主要解決的是AI最底層的東西,也是我們一般人接觸不到的層級,主要劃分可以分為:
1)AI芯片。
生產AI芯片的企業(yè),作為AI起源地漂亮國,AI芯片目前也是他們最強,代表公司NVIDIA,NVIDIA在AI領域有如此之高的地位一個原因是他的芯片適合訓練AI,另外一個就是他們的CUDA AI訓練平臺,可以理解為要生產一架飛機,其中發(fā)動機制造和飛機設計軟件都在他們手里,所以NVIDIA的市值持續(xù)上漲。
當然,國內企業(yè)也正在這塊發(fā)力,比如華為的昇騰,最近大家都看到有關華為手機AI能力的新聞了吧!相較于蘋果等其他品牌的手機,華為從AI芯片到模型訓練,都是自研實現,能有這么好的表現,作為中國人真的感到驕傲。
2)云計算平臺。
數據服務,開源數據集,向量數據庫,訓練框架,推理和部署平臺等等,這里就不做過多講解,畢竟跟我們不搞科研的人關系真不大,感興趣的可以私下了解,對普通人來說,更應該聚焦的是AI應用層和Agent方面的信息。
2. Transfomer、NLP、CNN
關于上面三部分知識點,我們有個大概認識就行,都屬于AI訓練相關知識。
1)Transfomer架構
Transformer架構是一種深度學習模型,專門設計用于處理序列數據,特別是在自然語言處理(NLP)任務中取得了巨大成功。
它是由Vaswani等人在2017年的論文《Attention Is All You Need》中首次提出的,并因其高效處理長距離依賴、并行計算能力和卓越性能而迅速成為NLP領域的標準模型之一。
主要組成部分包括:
自注意力機制,多頭注意力,編碼器和解碼器幾個部分組成。
簡單理解就是AI之所以能實現理解我們人類語言并輸出人類語言就是靠Transformer架構來實現。因為Transformer架構的知識相對較多,這里實在沒辦法擴展開來,感興趣的伙伴,可以評論區(qū)留言“222”,小俠后面更新Transformer架構的知識。
對了這部分的知識很有意思,學習后相信你會對AI的未來更加有信心,另外Transformer架構不僅在語言處理上得以驗證,在圖片,音頻,視頻等領域也已經被驗證可行,也就是說我們想象中的機器人已經被驗證會到來。
2)NLP
NLP也就是自然語言處理是人工智能的一個分支,它涉及到計算機理解、解釋和生成人類語言的技術。
NLP與Transfomer架構的關系就是NLP的實現通過RNN、LSTM、GRU、Transformer等模型實現,搞清楚這點就行。
3)CNN
這個也是非常常見AI名稱,這里也簡單做個介紹,CNN又稱之為卷積神經網絡是一種深度學習模型,主要用于圖像和視頻識別、分類和分割等任務??梢岳斫鉃轭愃芓ransfomer架構的一種結構,只是技術路線不一樣。
另外Stable Diffusion繪畫工具采用的是擴散模型的技術,英文叫Diffusion Models,也和Transfomer架構一樣,是不同技術路線,都是讓AI實現理解人類意圖的技術方法。
五、總結
好了,上述知識對于小白可能有點多,但是小俠真心希望大家都能理解并梳理清楚關系。我相信,看完小俠這期視頻的伙伴,最起碼對AI有個比較全面的認識,以后再遇到AI相關的知識或者課程推薦時,不至于一臉懵逼,啥都不知道,被當韭菜割了。
本文由 @弼小俠AI之路 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
感覺都是干貨,先收藏了以后要用上再回來看。
??好賊??!
干貨滿滿的
記得支持支持