【入門科普】必了解的 20 個 AI 術(shù)語解析(下)

0 評論 1823 瀏覽 5 收藏 9 分鐘

AI領(lǐng)域的基礎(chǔ)概念和相關(guān)技術(shù)有很多,這篇文章里,作者就深入淺出地介紹了相應(yīng)的內(nèi)容,感興趣的同學(xué)們,不妨來看一下。

本文專為非技術(shù)背景的AI愛好者設(shè)計,旨在深入淺出地介紹AI的基礎(chǔ)概念和關(guān)鍵技術(shù),帶您一步步解鎖AI技術(shù)的奧秘。建議先閱讀【入門科普】必了解的 20 個 AI術(shù)語解析(上)再閱讀本文。

十一、生成對抗網(wǎng)絡(luò)

想象一下有兩位藝術(shù)家:一位是偽造者,另一位是鑒賞家。偽造者試圖創(chuàng)作出看起來像真正藝術(shù)品的作品,而鑒賞家則試圖區(qū)分出哪些是真正的藝術(shù)品,哪些是偽造的。他們不斷地相互學(xué)習(xí)會使得偽造者變得越來越擅長創(chuàng)作逼真的作品,而鑒賞家則變得越來越擅長識別真?zhèn)巍?/p>

生成對抗網(wǎng)絡(luò)GAN由兩部分組成:一個是生成器(偽造者)和一個是判別器(鑒賞家)。

十二、強化學(xué)習(xí)

如果說對抗網(wǎng)絡(luò)是真假孫悟空之間的1對1的斗智斗勇,目標(biāo)是戰(zhàn)勝對方,那么強化學(xué)習(xí)就是1對多的一路斬妖除魔,設(shè)定一個去西天的目標(biāo),取經(jīng)隊伍總會去想辦法在真實環(huán)境中排除萬難,那些牛魔王、火焰山、蜘蛛精、女兒國等等都是在環(huán)境中遇到的不同的挫折,磨煉的是取經(jīng)隊伍內(nèi)在的佛性。

十三、主成分分析

假設(shè)你有一個非常雜亂的書桌,上面堆滿了各種物品。如果你想用一張照片抓住書桌的“精華”,但又不想讓照片顯得太雜亂,你可能會選擇從一個角度拍攝,這個角度能最好地展示書桌上最重要的幾樣?xùn)|西。PCA就是在做類似的事情:它試圖找到最能代表整個數(shù)據(jù)集“精華”的幾個方向(主成分),然后用這些方向來簡化和描述數(shù)據(jù)集。

十四、交叉驗證

交叉驗證是機器學(xué)習(xí)中的一種評估方法,旨在測試模型對新數(shù)據(jù)的預(yù)測準確性。它通過將數(shù)據(jù)集分成多個部分來工作。在k-折交叉驗證中,整個數(shù)據(jù)集被分成k個等大小的子集。然后,模型會進行k次訓(xùn)練和測試的循環(huán),每次循環(huán)中,選擇一個不同的子集作為測試集,而剩余的k-1個子集用作訓(xùn)練集。通過這種方式,每個數(shù)據(jù)子集都有機會作為測試集使用。完成這k次循環(huán)后,通過平均所有循環(huán)的測試結(jié)果來評估模型的整體性能。

十五、梯度下降

想象你在一座山上,目標(biāo)是找到山谷的最低點。由于山上濃霧彌漫,你看不清整座山,所以無法直接找到最低點。梯度下降就像是你決定每次都沿著當(dāng)前位置最陡峭的下坡方向走一步,期望這樣可以帶你到達山谷的最低點。在機器學(xué)習(xí)中,梯度下降幫助模型“學(xué)習(xí)”到最佳參數(shù),即找到能讓模型預(yù)測誤差最小的參數(shù)。

十六、遷移學(xué)習(xí)

假設(shè)你已經(jīng)是一個鋼琴高手,現(xiàn)在你想學(xué)習(xí)吉他。由于你已經(jīng)掌握了很多關(guān)于音樂的知識,如音階和節(jié)奏,你可以把這些知識應(yīng)用到新的學(xué)習(xí)中,這樣你學(xué)吉他的速度就會更快。在AI中,遷移學(xué)習(xí)就是這個原理,它讓一個已經(jīng)在一個任務(wù)上訓(xùn)練好的模型,用于另一個相關(guān)但不同的任務(wù)。這樣可以節(jié)省大量的訓(xùn)練時間和資源。

十七、特征工程

模型的學(xué)習(xí)能力很大程度上取決于我們給它提供的信息質(zhì)量。如果信息選得好,模型就能學(xué)得快,預(yù)測得準;如果信息選得不好,模型就可能學(xué)不會,或者學(xué)錯了。這個過程包括數(shù)據(jù)預(yù)處理、特征選擇、特征構(gòu)造、特征轉(zhuǎn)化、降緯 等等,比如訓(xùn)練一個顏值打分模型,訓(xùn)練數(shù)據(jù)是一堆照片,那么特征的工程就是提取眼睛、鼻子、嘴巴的位置、構(gòu)造出新的特征比如面部比例數(shù)據(jù)、并選擇具體哪個面部特征的顏值權(quán)重更高 等等。

十八、超參數(shù)調(diào)優(yōu)

超參數(shù)是在開始訓(xùn)練之前設(shè)置的參數(shù),它們不能通過訓(xùn)練過程本身得到。比如決定每次訓(xùn)練模型時輸入的數(shù)據(jù)量的“批大小”、決定每次權(quán)重更新幅度的學(xué)習(xí)率等等。如果把模型訓(xùn)練過程比喻成西天取經(jīng)的過程,那么超參數(shù)調(diào)優(yōu)就是在取經(jīng)出發(fā)前,唐僧從觀音或唐太宗那里獲得的 通關(guān)文牒、錦襕袈裟。

十九、增強檢索

在大語言模型通常會發(fā)生“模型幻覺”的問題,就是在處理復(fù)雜事物是產(chǎn)生與事實不符甚至完全捏造的信息,就像說人有時候也會說夢話一樣胡說八道。增強檢索可以緩解這個問題,通過引入外部知識來源來提高回答問題的準確性和豐富性。以一個法律咨詢的場景為例,如果用戶詢問關(guān)于最新稅法的問題,傳統(tǒng)的語言模型可能只能提供基于其訓(xùn)練數(shù)據(jù)的答案,而這些數(shù)據(jù)可能不包括最新的稅法變化,這是需要增強檢索的典型應(yīng)用場景。

二十、通用人工智能

馬斯克在24年4月時說:比人類更聰明的AGI將在兩年內(nèi)實現(xiàn)。通用人工智能是指不需要人為干預(yù)而可以自我學(xué)習(xí)、自我調(diào)整從而完全像人類一樣可以執(zhí)行原本只有人可以從事的任務(wù),甚至機器人可以自行進行科學(xué)理論探索。這將是地球智能發(fā)展的奇點。

本文由 @李文杰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!