深度學(xué)習(xí):一種特定類型的機(jī)器學(xué)習(xí)
本文作者將從深度學(xué)習(xí)的角度,來(lái)討論下這個(gè)火熱人工智能話題。enjoy~
近期臨近年底,工作比較忙,好久沒(méi)有去更新文章了。作為一名人工智能行業(yè)的從業(yè)者不去主動(dòng)接觸點(diǎn)人工智能方面的知識(shí)都有點(diǎn)不太好意思了,心血來(lái)潮就打算看看近期火熱的深度學(xué)習(xí)。經(jīng)研究院的同事給介紹《深度學(xué)習(xí)》這本書,看了兩天實(shí)在是頭疼,幾百頁(yè)的厚厚書籍自己能夠看懂的也就第一章的二十多頁(yè)的內(nèi)容,其他的關(guān)于數(shù)學(xué)和算法方面的內(nèi)容完全看不懂,實(shí)在是難過(guò)。
不過(guò)第一章的知識(shí)已經(jīng)能夠完全的的解釋深度學(xué)習(xí)的歷史發(fā)展和基數(shù)知識(shí)了,自己總結(jié)了一篇文章就當(dāng)是對(duì)這一章內(nèi)容的重點(diǎn)知識(shí)總結(jié)吧。
1. 人工智能發(fā)展的原因
人工智能近幾年了好像突然之間就火了,各大公司紛紛布局人工智能行業(yè)。其實(shí),我們?nèi)プ肪繗v史原因就會(huì)發(fā)現(xiàn)其實(shí)人工智能已經(jīng)有了60多年的歷史了,從達(dá)特茅斯會(huì)議上人工智能概念的提出到如今人工歷史其實(shí)經(jīng)歷了三次浪潮,現(xiàn)在的幾年應(yīng)該是第三次浪潮的爆發(fā)期。
很多人就會(huì)問(wèn),為什么第三次浪潮會(huì)在近幾年爆發(fā),其實(shí)追究其原因,不難發(fā)現(xiàn)會(huì)有三個(gè)主要的因素在這個(gè)時(shí)代出現(xiàn)了:
第一,高級(jí)算法的出現(xiàn),經(jīng)歷前幾十年人工智能的孕育期,終于有了技術(shù)的積累,在這個(gè)時(shí)代,算法的更新解決了很多技術(shù)上的難題;
第二,計(jì)算機(jī)計(jì)算能力的提升,我們都知道人工智能模型的訓(xùn)練和計(jì)算需要耗費(fèi)大量的時(shí)間和計(jì)算集群,強(qiáng)大CPU和CPU的出現(xiàn)大大加強(qiáng)了計(jì)算機(jī)的運(yùn)算能力,從而有了訓(xùn)練復(fù)雜模型的可能。
最后,互聯(lián)網(wǎng)時(shí)代大數(shù)據(jù)的產(chǎn)生,人工智能模型的訓(xùn)練都是針對(duì)于數(shù)據(jù)集,在互聯(lián)網(wǎng)時(shí)代,海量的訓(xùn)練數(shù)據(jù)是解決人工智能瓶頸的根本原因。這個(gè)數(shù)據(jù)的收集過(guò)程中我們不得不說(shuō)image net的誕生,李飛飛領(lǐng)導(dǎo)了這個(gè)項(xiàng)目的誕生,從而將計(jì)算機(jī)視覺(jué)識(shí)別提供了可標(biāo)注的海量數(shù)據(jù)庫(kù),這個(gè)項(xiàng)目的誕生可謂是人工智能行業(yè)的一個(gè)節(jié)點(diǎn)。
2. 人工智能技術(shù)的發(fā)展歷程
2.1 早期的知識(shí)庫(kù)規(guī)則
最早期的人工智能系統(tǒng)往往是通過(guò)人工的制定計(jì)算規(guī)則讓計(jì)算去執(zhí)行規(guī)則從而完成系統(tǒng)使命,其實(shí)這個(gè)制定規(guī)則的過(guò)程就是算法出現(xiàn)的過(guò)程。李飛飛在ted演講中講述了一個(gè)盒子模型的人工智能系統(tǒng),在這個(gè)系統(tǒng)中有很多顏色,形狀和高矮不同的盒子,最終系統(tǒng)執(zhí)行人工指令可以完成對(duì)于盒子的篩選和移動(dòng)。這個(gè)早期系統(tǒng)的其實(shí)就是通過(guò)人為的邏輯算法思考強(qiáng)加給計(jì)算機(jī)執(zhí)行從而完成系統(tǒng)任務(wù),在ted會(huì)議上李飛飛展示了這個(gè)邏輯算法的節(jié)點(diǎn)流程可謂是非常的復(fù)雜,而且這種算法設(shè)計(jì)還不具備通用性,換了另外的一個(gè)任務(wù)這個(gè)算法就失效了。
還有就是IBM 的(Deep Blue)國(guó)際象棋系統(tǒng)在 1997 年擊敗了世界冠軍Garry Kasparov,它的系統(tǒng)設(shè)計(jì)其實(shí)和盒子模型很相似,因?yàn)閲?guó)際象棋僅含有 64 個(gè)位置并只能以嚴(yán)格限制的方式移動(dòng),設(shè)計(jì)一種成功的國(guó)際象棋策略是巨大的成就,但向計(jì)算機(jī)描述棋子及其允許的走法并不是挑戰(zhàn)的困難。因?yàn)椋瑖?guó)際象棋完全可以由一個(gè)非常簡(jiǎn)短的、完全形式化的規(guī)則列表來(lái)描述,并可以容易地由程序員事先準(zhǔn)備好。
這兩種系統(tǒng)的實(shí)現(xiàn)其實(shí)就是被稱為硬編碼的方式,建立知識(shí)庫(kù)從而讓計(jì)算機(jī)可以使用邏輯推理規(guī)則來(lái)自動(dòng)地理解這些形式化語(yǔ)言中的申明,然而這種方式并沒(méi)有得到良好的發(fā)展。
2.2 手動(dòng)指定特征
第二個(gè)階段發(fā)展到機(jī)器學(xué)習(xí)的階段,很多先驅(qū)者從人類大腦的神經(jīng)元獲得靈感,我們今天知道的一些最早的學(xué)習(xí)算法,是旨在模擬生物學(xué)習(xí)的計(jì)算模型,即大腦怎樣學(xué)習(xí)或?yàn)槭裁茨軐W(xué)習(xí)的模型。從而出現(xiàn)很多的經(jīng)典的機(jī)器學(xué)習(xí)概念。這個(gè)階段通過(guò)人工指定特征的方式讓機(jī)器達(dá)到具有匹配和映射特征的能力,從而完成機(jī)器對(duì)外界的認(rèn)知能力。李飛飛在一次演講中她提到早期的她對(duì)于貓的識(shí)別方式。通過(guò)人工指定貓的特征例如貓肥胖的身體,尾巴,頭部的輪廓等特征告訴計(jì)算機(jī)具備這種特征的就是貓,但是在真實(shí)的識(shí)別場(chǎng)景中,貓的形態(tài)是千變?nèi)f化的話,僅僅通過(guò)人工指定特征是完全不能夠解決這個(gè)問(wèn)題的,特別是復(fù)雜物體的特征,人工進(jìn)行指定特征更是無(wú)法完成。
2.3 表示學(xué)習(xí)階段
其實(shí),簡(jiǎn)單的機(jī)器學(xué)習(xí)算法的性能在很大程度上依賴于給定數(shù)據(jù)的表示,也就是特征的數(shù)據(jù)表示方式。通用的人工智能任務(wù)都可以通過(guò)以下方式解決:先提取一個(gè)合適的特征集,然后將這些特征提供給簡(jiǎn)單的機(jī)器學(xué)習(xí)算法,也就是之前我所說(shuō)的貓的特征集的例子。 然而,對(duì)于許多任務(wù)來(lái)說(shuō),我們很難知道應(yīng)該提取哪些特征,也就是通過(guò)人工指定特征集合從而完成映射特征的方式不可取,那么我們能不能通過(guò)機(jī)器去學(xué)習(xí)特征取代人工指定呢?這個(gè)時(shí)候表示學(xué)習(xí)就隨之出現(xiàn)了,表示學(xué)習(xí)就是使用機(jī)器學(xué)習(xí)來(lái)發(fā)掘表示本身,而不僅僅把表示映射到輸出。然而在這個(gè)階段,機(jī)器去完成負(fù)責(zé)特征的學(xué)習(xí)又遇到了瓶頸,因?yàn)樽尨笄澜绲臉?gòu)成特征太復(fù)雜,機(jī)器完全實(shí)現(xiàn)不了對(duì)于復(fù)雜特征的學(xué)習(xí)和表示,如何通過(guò)簡(jiǎn)單的規(guī)則去讓機(jī)器理解復(fù)雜世界又變成了一個(gè)難題,這個(gè)時(shí)候深度學(xué)習(xí)就誕生了。
3. 深度學(xué)習(xí)概述
3.1 深度學(xué)習(xí)的定義
層次化的概念的提出讓計(jì)算機(jī)構(gòu)建較簡(jiǎn)單的概念來(lái)學(xué)習(xí)復(fù)雜概念。這種層次化的提出來(lái)自于對(duì)人類神經(jīng)大腦的研究成果,研究表明人類通過(guò)眼睛獲取外界信息傳遞給大腦的過(guò)程是大腦皮層層次信息傳遞的結(jié)果,大腦皮層的每一層的部分負(fù)責(zé)處理不同的信息,而且在處理信息是有先后順序的,并且是基于上一層信息傳遞過(guò)來(lái)的結(jié)果進(jìn)行處理的,這種研究成果導(dǎo)致了深度學(xué)習(xí)的概念產(chǎn)生。
深度學(xué)習(xí)其實(shí)就是通過(guò)其他較簡(jiǎn)單的表示來(lái)表達(dá)復(fù)雜表示,解決了表示學(xué)習(xí)中的核心問(wèn)題。讓計(jì)算機(jī)從經(jīng)驗(yàn)中學(xué)習(xí),并根據(jù)層次化的概念體系來(lái)理解世界,而每個(gè)概念則通過(guò)與某些相對(duì)簡(jiǎn)單的概念之間的關(guān)系來(lái)定義。讓計(jì)算機(jī)從經(jīng)驗(yàn)獲取知識(shí),從而可以避免由人類來(lái)給計(jì)算機(jī)形式化地指定它需要的所有知識(shí)。
總的來(lái)說(shuō),深度學(xué)習(xí)就是一種特定類型的機(jī)器學(xué)習(xí),具有強(qiáng)大的能力和靈活性,它將大千世界表示為嵌套的層次概念體系(由較簡(jiǎn)單概念間的聯(lián)系定義復(fù)雜概念、從一般抽象概括到高級(jí)抽象表示)。
3.2 一張圖來(lái)理解深度學(xué)習(xí)的概念
深度學(xué)習(xí)廣泛的應(yīng)用在圖像識(shí)別領(lǐng)域中,為了讓大家很好的理解這種通過(guò)簡(jiǎn)單層級(jí)來(lái)表示復(fù)雜概念的方式,我們用一張圖來(lái)理解深度學(xué)習(xí)從簡(jiǎn)單概念到復(fù)雜概念的表示。
從圖像識(shí)別來(lái)說(shuō),計(jì)算機(jī)難以理解原始感觀輸入數(shù)據(jù)的含義,如表示為像素值集合的圖像。將一組像素映射到對(duì)象標(biāo)識(shí)的函數(shù)非常復(fù)雜。如果直接處理,學(xué)習(xí)或評(píng)估此映射似乎是不可能的。
因此,深度學(xué)習(xí)將所需的復(fù)雜映射分解為一系列嵌套的簡(jiǎn)單映射(每個(gè)由模型的不同層描述)來(lái)解決這一難題。輸入展示在 可見(jiàn)層(visible layer),這樣命名的原因是因?yàn)樗覀兡苡^察到的變量。然后是一系列從圖像中提取越來(lái)越多抽象特征的 隱藏層(hidden layer)。因?yàn)樗鼈兊闹挡辉跀?shù)據(jù)中給出,所以將這些層稱為 ‘‘隱藏”; 模型必須確定哪些概念有利于解釋觀察數(shù)據(jù)中的關(guān)系。這里的圖像是每個(gè)隱藏單元表示的特征的可視化。給定像素,第一層可以輕易地通過(guò)比較相鄰像素的亮度來(lái)識(shí)別邊緣。有了第一隱藏層描述的邊緣,第二隱藏層可以容易地搜索可識(shí)別為角和擴(kuò)展輪廓的邊集合。給定第二隱藏層中關(guān)于角和輪廓的圖像描述,第三隱藏層可以找到輪廓和角的特定集合來(lái)檢測(cè)特定對(duì)象的整個(gè)部分。最后,根據(jù)圖像描述中包含的對(duì)象部分,可以識(shí)別圖像中存在的對(duì)象。
3.3 深度學(xué)習(xí)和機(jī)器學(xué)習(xí)有什么關(guān)系?
深度學(xué)習(xí)在定義上就是一種表示學(xué)習(xí),也是一種機(jī)器學(xué)習(xí),可以用于許多(但不是全部)AI 方法。 深度學(xué)習(xí)有著悠久而豐富的歷史,但隨著許多不同哲學(xué)觀點(diǎn)的漸漸消逝,與之對(duì)應(yīng)的名稱也漸漸塵封。 我們今天知道的一些最早的學(xué)習(xí)算法,是旨在模擬生物學(xué)習(xí)的計(jì)算模型,即大腦怎樣學(xué)習(xí)或?yàn)槭裁茨軐W(xué)習(xí)的模型,早期的人工神經(jīng)網(wǎng)絡(luò)方式其實(shí)就是深度學(xué)習(xí),其結(jié)果是深度學(xué)習(xí)以 人工神經(jīng)網(wǎng)絡(luò)(artificialneural network, ANN)之名而淡去。
4. 人工智能的未來(lái)發(fā)展會(huì)怎么樣?
機(jī)器的誕生就是為了運(yùn)算和存儲(chǔ)數(shù)據(jù)的,在數(shù)字的計(jì)算和抽象問(wèn)題的解決上,計(jì)算機(jī)已經(jīng)完全的超過(guò)了人的水平,但是往往這么厲害的機(jī)器卻不能完成對(duì)整個(gè)世界簡(jiǎn)單東西的認(rèn)知。計(jì)算機(jī)能夠完成復(fù)雜的邏輯運(yùn)算,卻不能很好的理解我們說(shuō)話的意思。能夠進(jìn)行海量的存儲(chǔ),卻不能很好的認(rèn)識(shí)一張普通的圖片,其實(shí)很某個(gè)角度來(lái)看,人工智能的發(fā)展其實(shí)是和人類成長(zhǎng)是相反的。
人類對(duì)世界的認(rèn)知其實(shí)是從0-6歲就已經(jīng)形成的,在這個(gè)階段人通過(guò)學(xué)習(xí)認(rèn)識(shí)了這個(gè)世界簡(jiǎn)單的物體,即使是一歲的孩子也知道那是一只貓,這是因?yàn)槿说难劬r(shí)時(shí)刻刻都在獲取信息,從而交給大腦進(jìn)行學(xué)習(xí),從而形成對(duì)最基本常識(shí)的認(rèn)知。最后通過(guò)小學(xué)初中大學(xué)才完成邏輯思維和計(jì)算思維的形成。然而,計(jì)算機(jī)則完全相反,在邏輯思維和計(jì)算思維上,現(xiàn)代計(jì)算機(jī)只要輸入數(shù)據(jù),計(jì)算機(jī)就能完成這些數(shù)據(jù)的運(yùn)算和存貯,但是對(duì)于大千世界的認(rèn)知卻還停留在嬰兒階段。據(jù)說(shuō),目前的計(jì)算機(jī)認(rèn)知水平也就僅僅停留在人類1歲左右的水平。有人問(wèn)人工智能未來(lái)的發(fā)展如果,我個(gè)人斷定,如果人工智能能夠使機(jī)器的認(rèn)知超過(guò)6歲孩子對(duì)于世界的認(rèn)知,那么人工智能在所有的行業(yè)領(lǐng)域都會(huì)超過(guò)人類專家水平。
我這么斷定肯定會(huì)有人指出一個(gè)問(wèn)題,即使是現(xiàn)在也有很多人來(lái)討論人機(jī)倫理方面的問(wèn)題,假如機(jī)器具有了自主學(xué)習(xí)和思考的能力,那么人存在的意思是什么?我只能說(shuō),現(xiàn)在還不是考慮這個(gè)的問(wèn)題的時(shí)候,畢竟機(jī)器想要達(dá)到人類的認(rèn)知智力水平還不知道是什么時(shí)候的事情了。
本文由 @張小明明 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
作為一名人工智能行業(yè)的從業(yè)者,都被《深度學(xué)習(xí)》這本書搞的頭昏腦漲,那想入行的人還有什么路可走?