「ChatGPT」全球爆火,百度們在做什么?
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術應用非人工智能生成內容(AIGC)莫屬。那么,AIGC行業(yè)的發(fā)展狀況如何呢?百度們在做什么呢?讓我們一起來看看作者的看法吧。
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術應用非人工智能生成內容(AIGC)莫屬。
年中,AI畫作《太空歌劇院》在科羅拉多州博覽會藝術比賽中一舉奪魁,引起了人們對AI創(chuàng)作合理性的激烈討論。
年末,ChatGPT橫空出世,技驚四座,出色地回答了人類提出的各種問題,讓許多人感嘆“這是我見過最像AI的AI”,掀起了與人工智能對話的熱潮。
而在今年的百度AI開發(fā)者大會中,百度技術委員會主席吳華介紹了文心大模型的視頻內容生成與編輯技術,讓一言化視頻成為了現(xiàn)實,賦予了每個人都能成為制片人的機會,引起了人們的廣泛關注。
在這多次爆火出圈的背后,真正讓人感嘆的其實是人工智能技術的飛速發(fā)展。那么,AIGC的發(fā)展到底經歷了哪些階段,為何集中于2022年“井噴”式爆發(fā)?我們的生活又將怎樣被AIGC改變?立足當下,AIGC行業(yè)的發(fā)展狀況又是如何呢?
一、AIGC的萬千“面孔”
歷經數(shù)十年發(fā)展,深度學習模型不斷迭代,AIGC迎來突破性發(fā)展。
在各類使用AIGC技術的應用大規(guī)?!熬畤姟敝埃珹IGC也曾經歷了幾十年的發(fā)展。結合人工智能的演進沿革,AIGC的發(fā)展歷程大致可以分為三個階段:早期萌芽階段、沉淀積累階段、快速發(fā)展階段:
在早期萌芽階段(1950s-1990s),受限于當時的科技水平,AIGC僅限于小范圍實驗。1966年,約瑟夫·魏岑鮑姆和肯尼斯·科爾比開發(fā)了世界第一款可人機對話的機器人Eliza。80年代中期,IBM創(chuàng)造了語音控制打字機Tangora。
在沉淀積累階段(1990s-2010s),AIGC從實驗性向實用性逐漸轉變。2006年,深度學習算法、圖形處理器、張量處理器等都取得了重大突破。2012年,微軟公開展示了一個全自動同聲傳譯系統(tǒng),可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。
在快速發(fā)展階段(2010s至今),深度學習模型不斷迭代,AIGC獲得快速突破性發(fā)展。2014年,對抗生產網絡GAN出現(xiàn)。2021年,CLIP模型出現(xiàn);OpenAI推出DALL-E,主要應用于文本與圖像交互生成內容。
而在2022年,深度學習模型Diffusion擴散化模型的出現(xiàn),更是直接推動了AIGC技術的突破性發(fā)展,許多基于StableDiffusion模型的應用紛紛入局,也正因如此,2022年出現(xiàn)了AIGC應用“井噴”現(xiàn)象,也被稱為AIGC元年。
國際大廠紛紛入局,諸多行業(yè)正在被重新定義。
在AIGC的落地應用中,僅有先進的算法模型遠遠不夠,還需要廠商完成場景化的應用開發(fā)。目前,谷歌、Meta、微軟等國際互聯(lián)網大廠早已入局,用AI實力及技術應用推動AIGC的風潮席卷了全球,正重新定義著諸多行業(yè)。
在世界范圍內AIGC應用如火如荼的發(fā)展之下,百度、騰訊、阿里、字節(jié)跳動、網易等國內大廠也紛紛跟進,在AIGC領域內動作頻頻。但要說起誰更能代表中國AIGC的發(fā)展,必然當百度莫屬。
百度基于在深度學習平臺、大模型上等底層技術上的積累,以及對人工智能發(fā)展趨勢的前瞻性布局,搶占先機,成為全球AIGC發(fā)展領導者之一。目前,百度研發(fā)的文心大模型已經憑借其強大的內容生成能力,極大地推動了AIGC的發(fā)展:
文心大模型中的ERNIE 3.0 Zeus,讓每個人都能成為天才編劇。想要成為天才編劇,就一定要具備強大的學習能力,而文心能從豐富多樣的無標注數(shù)據(jù)中自主學習,同時在學習的過程中融入知識圖譜,大幅提升學習效率。還可以跨越不同的形式,進行知識的儲備、融合,勝任多種語言理解和生成任務,成為了一個名副其實的“通才”。
除了作為一個優(yōu)秀的學習者、創(chuàng)作者之外,文心大模型還可以勝任美術師、插畫師的工作。文心大模型中的ERNIE-ViLG 2.0使用了擴散模型,引入了語言、視覺等多源知識,并在多個階段選擇不同網絡來進行建模,實現(xiàn)了能根據(jù)一句話或者一段描述文本生成一幅精美的畫作的要求。
在靜態(tài)的文字與畫作外,制作動態(tài)的視頻對文心來說也是小菜一碟。文心大模型可在文生圖的基礎上通過添加時序建模的方法更進一步,使得模型能根據(jù)文本或者圖像生成新的視頻,而且可根據(jù)需求,調節(jié)生成視頻片段的時長,提升視覺內容生產效果和效率,實現(xiàn)文生視頻、文剪視頻、修復視頻的功能。
二、百度的AIGC“答案”
在國外,谷歌、Meta、微軟積極布局,在AIGC領域做得風生水起,讓人們看到了人工智能生成內容的前景。而在國內AIGC領域,綜合技術水平與應用向的豐富性,行業(yè)第一非百度莫屬。
每年,百度總會在舉辦AI開發(fā)者大會的時候發(fā)布最新技術進展,而這,也是觀察國內AI產業(yè)發(fā)展狀況的最好窗口之一。
在今年百度的Create暨AI開發(fā)者大會上,介紹的各項技術讓人眼前一亮,將AI的應用提升到了一個新高度:
人工智能走向千行百業(yè),“深度學習+”已成各領域推動創(chuàng)新發(fā)展新引擎。
伴隨著算法、算力、數(shù)據(jù)的不斷發(fā)展,深度學習技術及產業(yè)應用也正在發(fā)生著巨大的變化。從深度學習技術的興起,到產業(yè)鏈的形成,再到深度跨界融合,深度學習已經進入了一個全新的發(fā)展階段——“深度學習+”。
從技術角度看,深度學習+海量知識,推動了人工智能技術創(chuàng)新突破。通過讓機器在海量數(shù)據(jù)與大規(guī)模知識中學習的方法,可以不斷提高AI學習效率,完善模型效果,實現(xiàn)創(chuàng)新突破,最終能更好地幫助人類完成工作。舉例來說,“文心一格”便是通過知識增強跨模態(tài)大模型,通過從語言、視覺等知識中不斷融合學習,最終實現(xiàn)“一言成畫”功能的。
從生態(tài)角度看,深度學習+上下游產業(yè),助力形成完整產業(yè)鏈。目前,深度學習已經在芯片、框架、模型及應用層面形成了深度學習完整的產業(yè)鏈。在芯片層面,成功推動了軟硬件一體化;在框架層面,提供便捷開發(fā)、高效訓練、全域部署的能力;在模型層面,大幅降低產業(yè)應用成本;在應用層面,催生了一批新業(yè)態(tài)模式。四大層級共同擁抱深度學習,實現(xiàn)整個產業(yè)鏈的持續(xù)迭代優(yōu)化。
從產業(yè)角度看,深度學習+千行百業(yè),有助于形成全產業(yè)良性循環(huán)。我國擁有門類齊全、體系完整且規(guī)模龐大的產業(yè)體系,深度學習驅動的創(chuàng)新,在中國擁有更加豐富的應用場景,也有助于各行業(yè)形成良性循環(huán),促進底層技術突破,加快現(xiàn)代產業(yè)化產業(yè)體系。
目前,人工智能已經進入了“深度學習+”的新階段,未來,人工智能技術引領的新一輪科技革命和產業(yè)變革浪潮,將成為未來世界經濟和高端產業(yè)的主導技術,對中國現(xiàn)代化產業(yè)體系建設發(fā)揮無可替代的作用。
用大模型驅動搜索進化的“知一”、“千流”。
搜索作為互聯(lián)網用戶的剛需,是最核心的基礎應用,隨著人們搜索需求的升級,搜索技術也在越來越快速地演進與發(fā)展,而百度將AI與搜索技術融合升級,推出了兩項殺手锏技術——跨模態(tài)大模型“知一”、新一代搜索引擎“千流”。
跨模態(tài)大模型“知一”,助用戶搜索內容更精確。
“知一”作為百度推出的跨模態(tài)大模型,具有業(yè)界領先的超大語義理解能力與全網視頻文本理解能力,可以在文本、圖片、視頻和結構化信息中持續(xù)進行海量知識資源的學習收集,打破資源形態(tài)界限,將最滿足用戶的搜索結果呈現(xiàn)出來。
其次,“知一”基于軟硬一體的定制硬件,通過百度自研的模型壓縮和預估優(yōu)化技術,實現(xiàn)了近乎無損的大模型落地;另外,“知一”還依托飛槳高性能并行訓練框架與百度昆侖芯片,構建了業(yè)績領先的大規(guī)模預訓練技術。兩者共同解決了搜索所需算力規(guī)模極大、推理能力極強的問題,為用戶提供更加快速、精確的搜索服務。
新一代搜索引擎“千流”,讓搜索更高效、更快速。
搜索所需要處理的數(shù)據(jù)規(guī)模特別大,但又需要在毫秒之間完成整個過程,在數(shù)千億的資源中最快速地找到最滿足用戶需求的內容,傳統(tǒng)搜索引擎建立了強大的分布式系統(tǒng),通過算力的堆積完成任務,但該方法性能消耗巨大,同時搜索內容不充分,某些優(yōu)質內容無法呈現(xiàn)給用戶,已不再適應當前的時代。
而新檢索系統(tǒng)“千流”,依托于大模型對的內容深度理解,將不同維度的信息進行智能有序的組織,將傳統(tǒng)索引升級為多領域多維度表達的立體柵格化索引, 同時通過模型對每一個請求進行分析,實現(xiàn)千億分領域內容深度觸達,在不消耗巨量算力的前提下,更快速地找到所需內容。
展望2023,立足于大模型產業(yè)化應用的元年,提高產業(yè)效用、跑通技術提升與經濟增長的循環(huán),或許遠比實現(xiàn)某個新技術的落地應用更加重要。
而在大會中,百度創(chuàng)始人、董事長兼CEO李彥宏便進行了名為“創(chuàng)新驅動增長,反饋驅動創(chuàng)新”的演講,講述了百度在經營發(fā)展中,客戶端與技術端如何相互促進,推出優(yōu)秀產品的實踐經驗,人工智能技術的發(fā)展,進一步打通了這個循環(huán)。
“科技創(chuàng)新驅動了大的增長,外部反饋又驅動了科技創(chuàng)新”,李彥宏如是說。
而在這一循環(huán)中,人工智能技術的發(fā)展,便是大大拉近了科技創(chuàng)新與增長之間的距離。
以百度飛槳為例,目前已經凝聚了超五百萬開發(fā)者,服務于二十余萬家企事業(yè)單位。通過百度自研的深度學習框架,讓開發(fā)者能夠像搭積木一樣構建AI應用,大大降低AI的應用門檻,讓創(chuàng)新持續(xù)發(fā)生,進而促進頂層的商業(yè)更加繁榮。
在演講末尾,李彥宏還以“危機和希望”為關鍵詞,在百度AI作畫平臺一格上,由人工智能自動生成了這樣一幅畫,以鼓勵所有的參會者。
“生機勃勃的新生命已經破冰而出,然而寒冷還沒有完全褪去所有偉大的企業(yè)、偉大的創(chuàng)造者也是一樣,沒有一帆風順,只有不斷地歷經困難再凱旋。困難會刺激創(chuàng)新,而創(chuàng)新是增長的真正動力?!?/p>
三、AIGC背后的“大學”
一個產業(yè)的發(fā)展,依靠的絕不僅是尖端技術的進步,更需要的是人才隊伍的培養(yǎng),而AI行業(yè)的發(fā)展更是如此。當前全球范圍內,AI行業(yè)酣戰(zhàn)初始,其中對人才的競爭已然激烈起來。
截至2021年,全球已經有超39個國家和地區(qū)制定了人工智能戰(zhàn)略政策,并普遍將人才培養(yǎng)作為了戰(zhàn)略重點,布局和搶占人工智能高地愈發(fā)成為各國的共識。
盡管各國在政策端、資金端提供了很大支持,但人才培養(yǎng)并非一蹴而就,仍然存在著大量的缺口。其中,我國AI行業(yè)人才培養(yǎng),就存在著人才不足、崗位錯配、質量不高的情況。
從業(yè)內人才數(shù)量來看,中國AI產業(yè)人才缺口很大。
人社部等3部門聯(lián)合發(fā)布的報告中指出,根據(jù)測算,我國人工智能人才目前缺口超過500萬,國內供求比例為1:10,如不加強人才培養(yǎng),至2025年人才缺口將突破1000萬。
從崗位類型來看,我國AI技術類崗位人才供需比遠遠不足。
從具體的技術方向來看,人工智能芯片、機器學習、自然語言處理、計算機視覺崗位的人才供需比均低于0.4,人才供應嚴重不足,特別是智能語音、計算機視覺方向,人才供需比僅為 0.08和 0.09,急需加快技術類崗位的人才培養(yǎng)。
從人才質量上來看,求職者的能力與AI雇主的要求相差較遠。
據(jù)調查發(fā)現(xiàn),近三成AI領域的求職者與雇主所要求的各項指標相距甚遠,背后原因包括學歷過低、經驗不足、缺乏實際技能等。同時,鑒于合格AI人才特別是高學歷AI人才的培養(yǎng)所需時間遠高于一般 IT 人才,這意味著人才質量導致的人才缺口可能難以在短期內得到有效解決。
面對如此大的人才缺口,諸如百度等國內AI公司主動擔當起了為社會、為產業(yè)培養(yǎng)AI人才的責任。數(shù)據(jù)顯示,在過去三年中,百度為社會培養(yǎng)、輸送超300萬AI人才,同時,還組織推進了多個人才培養(yǎng)計劃,共同助力行業(yè)發(fā)展:
百度與全國百余校所高校、十余家職業(yè)教育集團達成深度合作,投入超過千萬基金,累計免費培訓4100多名AI相關專業(yè)教師,為人才的成長提供了沃土。
除了對教師的支持外,百度還設立了專項獎學金,資助行業(yè)內優(yōu)秀的華人學生,該獎也是國內AI領域資助金額與含金量最高的學術獎學金之一,被業(yè)內譽為“人才認證書”與“行業(yè)風向標”。
在象牙塔之外,十幾年來,百度還舉辦了多屆AI行業(yè)的高端競賽,在更為廣泛的范圍內,為企業(yè)和社會選拔出大量頂尖人工智能人才。無數(shù)編程人才通過大賽脫穎而出,而其中的百度之星程序設計大賽更是被譽為國內程序員的“造星工場”,為社會選拔輸送了一批又一批頂尖人才。
AI企業(yè)們,正在承擔起AI知識界如同大學與研究院一樣的存在,源源不斷輸出著AI人才與知識體系。
四、寫在最后
AI已經從技術走向生活。
ChatGPT這樣爆火的AIGC應用,只是當前AIGC落地了眾多的應用場景中很小的一個。
作為新一代創(chuàng)作方式,AIGC是數(shù)智時代的典型應用創(chuàng)新。它的快速發(fā)展不僅革新了數(shù)字文化創(chuàng)作的生產范式,也在快速改變人類與人工智能的交互模式,并越來越多地輻射到了各行各業(yè)中。
同時,伴隨著數(shù)據(jù)、算法、算力等核心技術的突破,AIGC技術仍在持續(xù)進步中,推動著內容生產向更有自主性的方向發(fā)展。
而如此快速的AI技術革新與應用落地背后,是眾多像百度一樣的公司在培養(yǎng)和輸出萬千AI人才和知識體系。
可以預見的是,在全球數(shù)智化大勢之下,在政策的支持和鼓舞,業(yè)界如百度一樣眾多科技企業(yè)的合力推動下,未來的某一天,當技術跨越某個奇點,AI不僅能帶來生產力的革新與進化,更能帶來創(chuàng)造力與想象力的延伸與散漫。
作者:奇偶派
來源公眾號:奇偶派(ID:jioupai),講述商業(yè)故事,厘清商業(yè)邏輯,探索商業(yè)模式
本文由人人都是產品經理合作媒體 @奇偶派 授權發(fā)布,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!