AI 時(shí)代,人機(jī)交互即將消失?——機(jī)遇篇(系列 2/3)
隨著人工智能技術(shù)的飛速發(fā)展,人機(jī)交互正在經(jīng)歷深刻的變革。從早期的機(jī)械交互到圖形用戶界面的普及,再到如今語音交互和多模態(tài)交互的興起,每一次技術(shù)進(jìn)步都極大地改變了我們與機(jī)器的互動(dòng)方式。本文將回顧人機(jī)交互的發(fā)展歷程,探討在AI時(shí)代下,人機(jī)交互面臨的機(jī)遇與挑戰(zhàn),以及未來可能的發(fā)展方向。
我們真的能像與人對話那樣,與機(jī)器自然交流嗎?幾年前,大多數(shù)人可能都會(huì)認(rèn)為這只存在于科幻電影或小說,那今天呢?
正如上一篇,我們發(fā)現(xiàn) AI 的加速發(fā)展讓人機(jī)關(guān)系發(fā)生了明顯的轉(zhuǎn)折。那么接下來還會(huì)如何延展?人機(jī)交互和設(shè)計(jì)會(huì)讓這場對話迎來什么樣的新機(jī)遇?
我們將在這一次重返人機(jī)交互歷史的片場,在那些關(guān)鍵片段中發(fā)掘到其中的意義。最后,準(zhǔn)備就緒,重新想象屬于未來交互設(shè)計(jì)的每一秒種。
01 我該怎么和機(jī)器交流?
HMI:人與機(jī)械的試探期
圖左:珍妮紡紗機(jī)(Spinning Jenny, 1764)
圖右:早期打字機(jī)
轉(zhuǎn)動(dòng)曲柄工作,停下休息——和1764年珍妮紡紗機(jī)的對話就是這么簡單,但這已經(jīng)足夠奠定早期人機(jī)交互的基調(diào)了。隨后打字機(jī)的出現(xiàn)讓人機(jī)對話更有表現(xiàn)力——也就是將抽象符號引入人機(jī)交互。這種“按鍵-符號”對應(yīng)的交互方式影響至今,比如眼前的這篇文章就是這么敲出來的。
1946年的費(fèi)城,一臺(tái)龐然大物占據(jù)了賓夕法尼亞大學(xué)的一間房間。這就是 ENIAC——人類歷史上第一臺(tái)計(jì)算機(jī),它的誕生顯然非常振奮人心,雖然“對話”過程很讓人頭疼。
工程師們站在滿墻的物理開關(guān)和龐雜的跳線前,輸入一串?dāng)?shù)據(jù)需要打幾疊厚厚的卡片,再焦急地等待幾十分鐘才能知道運(yùn)行情況。一個(gè)錯(cuò)誤就白白浪費(fèi)一頓飯的時(shí)光,全部重來,這種非常復(fù)雜的交互導(dǎo)致人和計(jì)算機(jī)的交流也完全不同步。雖然整體的交互設(shè)計(jì)單一,抱怨也從未停止,但不得不承認(rèn),它以機(jī)械而生硬的方式拉開了人與機(jī)械交互(Human-Machine Interaction, HMI)時(shí)代的序幕。
當(dāng)然這時(shí)候人機(jī)交互理論還在混沌之中,遠(yuǎn)遠(yuǎn)沒有成型。這很正常,畢竟誰能想到短短幾十年后,我們只要指尖輕輕一點(diǎn)一滑,就能輕松完成當(dāng)年需要無數(shù)個(gè)房間的計(jì)算機(jī)才能做到的事情?
第一臺(tái)計(jì)算機(jī),ENIAC(1946)。用于專家領(lǐng)域,多為計(jì)算機(jī)工程化或軍事化應(yīng)用,使用打孔卡片和命令行界面。操作復(fù)雜且交互方式單一,無成型的人機(jī)交互理論
HCI 的奇點(diǎn)時(shí)刻:和計(jì)算機(jī)握手
人和計(jì)算機(jī)的交流要怎么樣才能同步?20世紀(jì)60年代開啟了一個(gè)重要的里程碑。
1963年,一名麻省理工的博士生在論文答辯時(shí)制作了一段影片。影片內(nèi)容中躍動(dòng)的各種三維圖形,伴隨著幽默風(fēng)趣的談吐,他對自己的杰作 Sketchpad 做了絲絲入扣的講解。但是在歡樂的笑聲中,大家似乎發(fā)現(xiàn)了這個(gè)東西的與眾不同之處——他將顯示屏前晦澀難懂的字符命令行幻化為了易于理解的圖形。
以前如果要用計(jì)算機(jī)畫一把椅子,95%的時(shí)間需要靠對數(shù)學(xué)以及三維空間的高度理解,再用代碼一行一行敲出來,不停調(diào)試。那 Sketchpad 呢?很簡單,只要用激光筆在屏幕上畫就是了??赡苓@位博士生當(dāng)時(shí)也沒想到,如此自然的交互方式和圖形用戶界面(GUI)的雛形,竟然衍生了后續(xù)的各種圖形界面,還有接下來一個(gè)影響至今的發(fā)明。
Sketchpad(1963),由斯凱克設(shè)計(jì)實(shí)驗(yàn)室的 Ivan Sutherland 開發(fā)標(biāo)志著圖形用戶界面的萌芽
道格拉斯·恩格爾巴特在一個(gè)計(jì)算機(jī)圖形學(xué)的會(huì)議上時(shí),一直在思考一個(gè)問題:“應(yīng)該要怎么提高交互效率?”
他和他的團(tuán)隊(duì)試了各種輸入設(shè)備,包括激光筆、操縱桿、用腳、用膝蓋、用頭操作的設(shè)備,無所不用其極。最后發(fā)現(xiàn)還是放在桌子上的那個(gè)木頭小方塊最好用:這個(gè)小方塊有兩個(gè)輪子,一個(gè)橫向旋轉(zhuǎn),一個(gè)縱向旋轉(zhuǎn)。
計(jì)算機(jī)通過追蹤這兩個(gè)輪子的橫豎位置和旋轉(zhuǎn)角度,精準(zhǔn)地同步移動(dòng)屏幕上的光標(biāo)。這個(gè)連著一條電線的小方塊就以半開玩笑的方式命名為了“鼠標(biāo)”,不過為什么叫鼠標(biāo)?好像沒人記得,大家只知道它離未來似乎近了一點(diǎn)點(diǎn)。
我們不再需要通過輸入一連串的晦澀命令行完成任務(wù),只用通過鼠標(biāo)移一下,點(diǎn)一點(diǎn),復(fù)雜的操作被簡化為直觀的點(diǎn)擊,這種飛躍式的人機(jī)交互方式直接甩開過去幾條街。
“最有效的解決方案往往是最簡單的。”
—— 來源:道格拉斯·恩格爾巴特
鼠標(biāo)的原型(1965),美國斯坦福研究所的Douglas Engelbart發(fā)明
此時(shí),時(shí)代的浪潮也快速地從以機(jī)械中心的交互設(shè)計(jì),轉(zhuǎn)向?yàn)橐杂?jì)算機(jī)為中心的人機(jī)界面研究,也就是人與計(jì)算機(jī)的交互(Human-Computer Interaction, HCI)。
但是圖形用戶界面的故事還沒有結(jié)束。1973年,施樂帕克研究中心進(jìn)一步孵化出了圖形界面的“完全體”。圖標(biāo)、桌面、菜單等等概念雨后春筍般涌現(xiàn),某種程度上是圖形界面歷史上最成功的隱喻之一。我們不用學(xué)習(xí)新概念,依靠已有的經(jīng)驗(yàn)就能立刻識別出來。這種顯而易見的對應(yīng)關(guān)系,讓人與技術(shù)之間的距離更加靠近了。
當(dāng)然,研究員們在這時(shí)候可能并沒有意識到,這一發(fā)明的威力直接引領(lǐng)了范式轉(zhuǎn)換。這些發(fā)明連實(shí)驗(yàn)室都沒走出去,憑什么發(fā)生天翻地覆的改變?別急,很快就會(huì)來了。
“變革性的創(chuàng)新需要時(shí)間和耐心,創(chuàng)新只有在技術(shù)、消費(fèi)者和商業(yè)模式都準(zhǔn)備就緒時(shí)才會(huì)發(fā)生。”
—— 來源:《情境交互設(shè)計(jì)》(2018)
施樂帕克研究中心(Xerox PARC)在計(jì)算機(jī) Alto 展示了最早的圖形用戶界面(Graphical User Interface, GUI)
個(gè)人計(jì)算的黃金時(shí)代,少不了人機(jī)交互
1979年,史蒂夫·喬布斯在施樂帕克研究中心看到了圖形用戶界面后,視野完全被打開。生動(dòng)形象的圖標(biāo)井然有序地排列,文件夾、菜單……這一切都仿佛充滿了生命力。喬布斯意識到,這不僅是技術(shù)的突破,更是一場關(guān)于人與機(jī)器互動(dòng)方式的革命?;氐教O果公司后,他和工程師團(tuán)隊(duì)拼命規(guī)劃如何將這些魔法融入蘋果電腦中:
“那是一個(gè)具有劃時(shí)代意義的時(shí)刻。我記得在看到圖形用戶界面后的十分鐘內(nèi),就知道總有一天所有電腦都會(huì)以這種方式運(yùn)行。一旦你看到它,就會(huì)發(fā)現(xiàn)它是如此顯而易見,不用什么智慧就能理解,它太清晰明了了。”
—— 來源:史蒂夫·喬布斯
20世紀(jì)80年代,蘋果公司橫空出世,圖形用戶界面和鼠標(biāo)整合入 Lisa 和 Macintosh,開啟了個(gè)人計(jì)算機(jī)的黃金時(shí)代。
想刪除一個(gè)文件?輕輕移動(dòng)鼠標(biāo),把文件優(yōu)雅地拖到“垃圾桶”圖標(biāo)處即可。復(fù)雜的鍵盤命令和專用鍵被點(diǎn)擊操作、下拉菜單、復(fù)制粘貼取代,這種符合人類自然認(rèn)知的交互方式不需要解釋。用戶體驗(yàn)成為設(shè)計(jì)的核心,復(fù)雜的操作變得簡單直觀,基于圖形用戶界面的交互設(shè)計(jì)迅速風(fēng)靡全球。而此時(shí),HCI 也恰好在學(xué)術(shù)界作為一門正式的獨(dú)立學(xué)科有了自己的一畝三分地,成為理解和優(yōu)化人類與計(jì)算機(jī)互動(dòng)的關(guān)鍵。
圖左:蘋果公司的 Lisa 和 Macintosh(1983, 1984)。引入圖形用戶界面和鼠標(biāo),基于 GUI 的交互設(shè)計(jì)廣泛普及
圖右:ACM 成立了專門特別興趣小組 SIGCHI,HCI 作為一門獨(dú)立學(xué)科正式確立
交互設(shè)計(jì)的北極星在哪?
但是事情遠(yuǎn)遠(yuǎn)沒有那么順利。20世紀(jì)90年代開始,相比于命令行時(shí)代,圖形界面的元素?cái)?shù)量和種類大量增加,圖形、聲音和文本等多媒體結(jié)合的多模態(tài)交互,讓交互設(shè)計(jì)也隨之陷入了混沌之中。
每個(gè)人理解的垃圾桶、桌面、文件夾都不一樣,每個(gè)人都有心中最喜歡的交互方式,交互設(shè)計(jì)的標(biāo)準(zhǔn)在哪里?用戶體驗(yàn)誰又能說了算? 認(rèn)知科學(xué)家唐納德·諾曼在90年代初加入蘋果公司時(shí),擔(dān)任用戶體驗(yàn)架構(gòu)師,提出了“用戶體驗(yàn)”。他也是第一個(gè)將用戶體驗(yàn) (User Experience, UX)納入職稱的人,諾曼出版的《The Design of Everyday Things》,至今仍然是用戶體驗(yàn)設(shè)計(jì)的主要參考資料。
“我發(fā)明這個(gè)詞是因?yàn)槲艺J(rèn)為人機(jī)界面和可用性太狹隘了:我想涵蓋關(guān)于人們體驗(yàn)的所有方面,包括工業(yè)設(shè)計(jì)、界面、物理交互和手工產(chǎn)品?!?/p>
—— 來源:唐納德·諾曼
Donald Norman 在接受采訪時(shí)對于用戶體驗(yàn)概念的解釋
在時(shí)空的另一端,1989年,雅各布·尼爾森在丹麥技術(shù)大學(xué)教授第一門用戶界面課程。顯然,面對學(xué)生練習(xí),第一門課程并沒有成熟的評分標(biāo)準(zhǔn),那要用什么方式才能有效評估學(xué)生的可用性問題呢?尼爾森和另一位教授絞盡腦汁總結(jié)各自的經(jīng)驗(yàn),提出一種由10種啟發(fā)式方法組成的評分標(biāo)準(zhǔn),順利對付了這門課程,還順手整理成論文發(fā)表了。
意外的是引用的人非常多。他們意識到大家對于標(biāo)準(zhǔn)的需求很強(qiáng)烈,但很明顯現(xiàn)在這種方法并沒有那么科學(xué)。
5年后,尼爾森發(fā)現(xiàn)這個(gè)評估方式的受歡迎程度仍然高居第二,僅次于用戶測試。如果繼續(xù)這么發(fā)展下去可能會(huì)害了真正的用戶體驗(yàn),于是他基于11個(gè)專業(yè)UX設(shè)計(jì)師在價(jià)值數(shù)百萬美元的重大項(xiàng)目中產(chǎn)生的設(shè)計(jì)缺陷,分析了包含249個(gè)可用性問題的數(shù)據(jù)庫,再翻遍各種 HCI 文獻(xiàn)后,精心提煉出了我們所熟知的“十大通用可用性原則”。
Jakob Nielsen 分析了兩百多個(gè)可用性問題后,1993年提煉出十項(xiàng)通用性原則,進(jìn)一步完善了 HCI 理論體系
從基礎(chǔ)的認(rèn)知心理學(xué),到具體的交互設(shè)計(jì)模式;從用戶研究方法論,到可用性測試的標(biāo)準(zhǔn)流程。逐漸完善的 HCI 理論體系正在讓我們用更科學(xué)的方式,來思考”為什么用戶覺得麻煩”等等每天都在面臨的交互問題,人與機(jī)器之間的交互也正在以科學(xué)的方式打磨得更加順滑。
當(dāng)然,解決方式或評估標(biāo)準(zhǔn)常常是基于當(dāng)下的技術(shù)或設(shè)計(jì)范式來制定的,但是計(jì)劃遠(yuǎn)遠(yuǎn)趕不上變化。這些理論是否能持續(xù)適應(yīng)時(shí)代的進(jìn)步和動(dòng)蕩,又應(yīng)該怎么做才能及時(shí)調(diào)整和改善?比如即將面臨的大考驗(yàn):互聯(lián)網(wǎng)時(shí)代。
02 人與計(jì)算機(jī)的自然連接
互聯(lián)網(wǎng)時(shí)代:一場信息聯(lián)結(jié)的狂歡
當(dāng)1989年互聯(lián)網(wǎng)誕生后,七大洲八大洋之間的距離瞬間被拉近,這種全球化的感受使我們前所未有地開始同時(shí)生活在物理和虛擬空間中。信息一窩蜂地從一條條網(wǎng)線中亂竄出來,我們獲取和傳播信息的方式被重新改寫了。
簡單來說,一切事情都在互聯(lián)網(wǎng)中重新出生了一次。
1995年,斯坦福大學(xué)的一位研究生拉里·佩奇陷入了一個(gè)問題:如何衡量一個(gè)網(wǎng)頁的價(jià)值?傳統(tǒng)的搜索引擎只能依靠關(guān)鍵詞頻率來判斷信息的相關(guān)性。但佩奇意識到,鏈接,才是獲取關(guān)聯(lián)知識的關(guān)鍵。
互聯(lián)網(wǎng)是一個(gè)巨大的有機(jī)生命體,每個(gè)網(wǎng)頁都是細(xì)胞,而鏈接就是細(xì)胞間傳遞信息的神經(jīng)網(wǎng)絡(luò)。佩奇的 PageRank 算法就是這個(gè)復(fù)雜生態(tài)中的指南針——被更多高質(zhì)量網(wǎng)頁鏈接的頁面,權(quán)重和可信度就越高,如此高效的方法也由此演化為了谷歌搜索的雛形。
一個(gè)白色背景的瀏覽器窗口,一個(gè)搜索框,輸入想要的內(nèi)容,輕輕點(diǎn)擊鼠標(biāo),全球知識瞬間鋪開在你的眼前。我們不妨想象一下,在互聯(lián)網(wǎng)之前,查找一個(gè)信息可能需要耗費(fèi)數(shù)小時(shí)在圖書館翻閱書籍。這一時(shí)刻,人類獲取知識的半徑在瞬間被無限放大,而這種人機(jī)交互的革命,本質(zhì)上重構(gòu)了人類思考、學(xué)習(xí)和信息獲取的方式。
谷歌搜索的第一個(gè)網(wǎng)站(1997)
Facebook、Twitter、Youtube……利用了互聯(lián)網(wǎng)優(yōu)勢重新連接世界的例子還有很多很多。人們在電腦前不厭其煩地點(diǎn)擊內(nèi)容,敲打鍵盤分享自己今天的奇聞趣事,簡單直觀的交互方式讓分享和創(chuàng)作越來越方便,不同地區(qū)的文化在網(wǎng)線間來回穿梭時(shí),煩惱和不便也由此產(chǎn)生:“為什么沒有一個(gè)能移動(dòng)的電腦,能讓我隨時(shí)隨地上網(wǎng)分享?”
是的,你也許猜到了,手機(jī)。
電腦濃縮成了一個(gè)小長方盒子,精致小巧的屏幕和九宮格鍵盤比以前方便太多了。我可以隨時(shí)隨地登錄社交軟件分享剛才遇到的奇葩事,通過網(wǎng)絡(luò)搜索眼前的疑惑,還能簡單打打游戲。當(dāng)然,這些功能機(jī)一次只能運(yùn)行一個(gè)簡單任務(wù),迷你的物理鍵盤也經(jīng)常讓大拇指互相打架,有限的屏幕和處理速度讓每個(gè)手機(jī)應(yīng)用都被強(qiáng)制”減肥”到只有最基礎(chǔ)的功能。但是因?yàn)樗啾戎伦銐蚍奖?,也?xí)慣了。
圖左:諾基亞N95(2006),采用九宮格的鍵盤布局
圖右:黑莓8700(2006),采用完整的 QWERTY 鍵盤布局
雖然后面手機(jī)屏幕越來越大,也推出了全鍵盤的手機(jī),但上面的問題仍然難以避免。習(xí)慣不代表永遠(yuǎn)滿足,我們都清楚,欲望和追求是永遠(yuǎn)不會(huì)停止的,我們不僅希望得到想要的東西,還希望想要的東西越來越多,越來越好。更大的屏幕,更沉浸的體驗(yàn),更方便的手機(jī)尺寸,能有電腦端大部分功能的手機(jī)應(yīng)用……這些欲望,如何才能轉(zhuǎn)化為觸動(dòng)心靈的最佳實(shí)踐?
真正的主角:以用戶為中心的交互設(shè)計(jì)
2007年,在舊金山的舞臺(tái)上,喬布斯從牛仔褲口袋里掏出了一塊看似普通的黑色玻璃,一個(gè)改變世界的瞬間來臨。
密密麻麻的按鍵消失了,但又無處不在?iPhone 將大量的按鍵進(jìn)化成了一塊光滑的玻璃觸控屏。鍵盤需要的時(shí)候出現(xiàn),不需要的時(shí)候消失,讓你專注沉浸地瀏覽。
“我們生來就擁有終極的指點(diǎn)設(shè)備——我們的手指,iPhone 利用它們創(chuàng)造了自鼠標(biāo)問世以來最具革命性的用戶界面?!?/p>
—— 來源:史蒂夫·喬布斯(2007)
谷歌地圖在 iPhone 上通過捏合手勢縮放世界的比例,輕快流暢的感覺比在電腦使用時(shí)更直觀順手。點(diǎn)擊打開應(yīng)用,滑動(dòng)切換、拖拽移動(dòng)文件……神奇的手勢交互取代了呆板的物理按鈕,物理空間的動(dòng)畫反饋產(chǎn)生了真實(shí)的“重量感”,復(fù)雜的指令幻化成指尖的舞動(dòng),自然到仿佛與生俱來的動(dòng)作,讓人不禁感嘆:“交互就應(yīng)該是這樣!”。
第一代 iPhone 發(fā)布會(huì)(2007) 蘋果公司在將多點(diǎn)觸控技術(shù)帶到了第一代 iPhone
觸摸時(shí)代重塑了人機(jī)交互方式,直到現(xiàn)在仍然令人驚嘆。實(shí)際上,iPhone 并沒有發(fā)明觸摸這個(gè)動(dòng)作,它只是讓這個(gè)行為找到了最恰當(dāng)?shù)膽?yīng)用場景,技術(shù)也本應(yīng)該是人類行為的自然延伸。眼鏡也并不是為了炫耀工藝,而是為了將世界的每一絲細(xì)節(jié)還給視力模糊的人。它所反映的的設(shè)計(jì)哲學(xué),恰好是以用戶為中心的交互設(shè)計(jì)迅速發(fā)展的時(shí)期。
這遠(yuǎn)不僅是技術(shù)的堆疊,而是一次對人類行為和需求的深刻理解和回應(yīng)。
“我們必須根據(jù)人類的行為設(shè)計(jì),而不是我們自以為的人類行為。”
—— 來源:唐納德·諾曼
移動(dòng)互聯(lián)網(wǎng)爆發(fā):HCI 的躍進(jìn)潮
移動(dòng)互聯(lián)網(wǎng)時(shí)代的爆發(fā)將“用戶體驗(yàn)”推上神壇,基于現(xiàn)實(shí)的隱喻巧妙地融合到界面交互中,人們驚訝地發(fā)現(xiàn)原來手指可以如此萬能。但是理論和意識很多時(shí)候會(huì)先于實(shí)踐,在發(fā)展初期,移動(dòng)端應(yīng)用的交互方式基本是電腦端的精簡移植,大家知道要考慮這些與生俱來的特性,但還不知道怎么做,除了一位設(shè)計(jì)師。
阿薩·拉斯金在用谷歌搜索內(nèi)容時(shí),對谷歌的分頁設(shè)計(jì)感到各種麻煩。僅僅為了找到一條信息而不停地點(diǎn)擊下一頁,再瀏覽大量頁面,交互效率太低了。要怎么樣才能讓用戶獲取信息更加流暢?
在各種嘗試中,拉斯金想到了一個(gè)方法:越往下滾動(dòng)加載越多內(nèi)容會(huì)怎么樣?這個(gè)看似簡單的“無限下滑”交互就像一份標(biāo)準(zhǔn)答案,各大社交應(yīng)用爭相采用,微博、抖音、小紅書……這種交互方式靈活運(yùn)用了觸摸的特性,只要輕輕往下滾動(dòng),內(nèi)容就像瀑布流一樣無止盡地出現(xiàn),意外地重塑了人們獲取信息的心理預(yù)期。
“好的設(shè)計(jì)是讓用戶無需思考如何使用產(chǎn)品?!?/p>
—— 來源:唐納德·諾曼
當(dāng)然,這只是冰山一角,下拉刷新、掃一掃等等交互方式都在移動(dòng)互聯(lián)網(wǎng)時(shí)代嶄露頭角,HCI 在為了滿足各種各樣用戶的需求和愿望,隨之迅速成長。人們在互聯(lián)網(wǎng)這片虛擬田野中進(jìn)行著一個(gè)個(gè)社會(huì)學(xué)實(shí)驗(yàn),界面的易用性、信息的可視化及互動(dòng)的即時(shí)反饋?zhàn)兊脧奈慈绱吮恍枰?/p>
但是僅僅是視覺和觸覺,又怎么能滿足人們無窮盡的場景和需求呢?2010 年,蘋果應(yīng)用商店上架了一款神奇的應(yīng)用——Siri。 它有一個(gè)與眾不同的點(diǎn),能通過自然語言處理和機(jī)器學(xué)習(xí)算法,像個(gè)人助手一樣通過對話的交互方式理解其中的上下文,完成安排約會(huì)、發(fā)送短信等基礎(chǔ)任務(wù)。
短短兩個(gè)月后,蘋果公司就捕捉到了它的潛力,Siri 公司被隨之收購。2011年 iPhone 4S 的發(fā)布會(huì)上,Siri 出現(xiàn)了。但這次不再是作為推薦應(yīng)用榜單中的一員,而是直接集成到系統(tǒng)中,極大程度進(jìn)化了我們與設(shè)備交互的方式。
盡管當(dāng)時(shí)推出時(shí)面臨著識別率低下,對語義的理解和真人大相徑庭等各種挑戰(zhàn),但是這種直觀、多模態(tài)的交互方式融入到生活之中,標(biāo)志著 HCI 發(fā)展的一個(gè)重要里程碑。
Siri:蘋果的智能語音助手,將對話的交互方式融入日常生活,標(biāo)志著 HCI 發(fā)展的一個(gè)重要里程碑
以簡馭繁:交互設(shè)計(jì)之道
每段歷史都有自己的高光時(shí)刻,但沒有一段是獨(dú)立存在的。從最早的物理開關(guān)、到如今的觸摸和語音交互……人機(jī)交互的歷史追求,本質(zhì)就是在不斷讓機(jī)器更易于使用、更高效、更人性化,也就是說:
人與機(jī)器的交互門檻不斷降低,交互場景不斷泛化,交互層級不斷升級。
HCI 帶來的益處不言而喻。但隨著應(yīng)用快速增長、功能指數(shù)型增加、信息龐雜,而且在可見的未來,這個(gè)趨勢只增不減。面對這樣的挑戰(zhàn),還能像從前一樣游刃有余嗎?
人機(jī)交互變革的樂章悄然響起
手機(jī)系統(tǒng)和應(yīng)用帶來了很多很方便快捷的功能,滿足各種用戶的需求。你能同時(shí)在一個(gè)屏幕展示兩個(gè)窗口,也能長按圖片隨意拖拽到別的應(yīng)用中。但是當(dāng)功能堆疊越來越多,大量增加的信息和功能讓設(shè)計(jì)越來越復(fù)雜和臃腫,每次想找個(gè)具體的快捷功能時(shí),都得在這個(gè)”儲(chǔ)物間”里不停翻找,試半天還不一定成功,人們明顯比以前感受到更多的困惑和迷失。
圖形用戶界面為主交互方式對我們來說更直觀易用,但如果我們要從20個(gè)又臭又長的文檔中復(fù)制粘貼想要的段落,你需要打開第一個(gè)文件,滾動(dòng)查找,選中文字,復(fù)制,打開目標(biāo)文檔,粘貼,打開第二個(gè)文件,然后繼續(xù)重復(fù)剛才的行為19次。即便讓 AI 來完成這個(gè)任務(wù),它也是實(shí)時(shí)讀取屏幕的同時(shí)重復(fù)剛才的操作,圖形界面的存在反而限制了操作效率。
但是不用圖形用戶界面就能解決嗎?也會(huì)有問題?,F(xiàn)在的智能語音助手支持語音、觸摸、鍵盤等等多種輸入方式,聽著很美好。但當(dāng)我們在各種公共的喧囂環(huán)境時(shí),語音識別的準(zhǔn)確度有限,也不會(huì)自動(dòng)根據(jù)情境切換到更適合的交互方式,往往難以自動(dòng)根據(jù)用戶情境的變化而改變。
高復(fù)雜度、有限的適應(yīng)性、過度依賴圖形界面……生成式 AI 與人形機(jī)器人等技術(shù)的井噴式發(fā)展,讓人與機(jī)器的關(guān)系發(fā)生了翻天覆地的變化。
HCI 圍繞的是與計(jì)算機(jī)(Computer)之間的交互,面對這些日益智能的機(jī)器顯得越來越無力,對多感官的輸入和更復(fù)雜的場景也變得捉襟見肘,HCI 面臨著空前的挑戰(zhàn)。
當(dāng)然,挑戰(zhàn)也代表著機(jī)遇的開始。無論時(shí)代怎么變化,一些核心的使命也不曾改變。
“我們處理這些問題的集體能力并沒有像復(fù)雜性增加那樣迅速提高。我能想到的最好的事情,就是努力幫助提高人類處理復(fù)雜問題的能力。”
—— 來源:《關(guān)鍵設(shè)計(jì)報(bào)告》
在后 HCI 時(shí)代應(yīng)該怎么做?我們是時(shí)候該重新調(diào)整步伐,進(jìn)行“人機(jī)共舞”的下一個(gè)樂章了。
預(yù)告
當(dāng)機(jī)器擁有了智能,它成為了什么,又有什么特性?未來我們還是和純計(jì)算機(jī)交互嗎?如果不是,那意味著什么……
下一篇迎來了本系列的最后一段樂章。我們將從多個(gè)維度剖析交互的發(fā)展趨勢,將這些星點(diǎn)連接起來。面對深度整合了智能的“智能體(Agent)”,我們將如何與之交互,在這其中的思考又是什么,這些挑戰(zhàn)和機(jī)遇,能更加完整地幫助我們描繪出未來交互設(shè)計(jì)可能的“新生”。
參考文獻(xiàn)
Moggridge, Bill. “Designing interactions.” (2007).
Mourtzis, Dimitris, John Angelopoulos, and Nikos Panopoulos. “The future of the human–machine interface (HMI) in society 5.0.” Future Internet 15.5 (2023): 162.
圖源:來自 Unsplash 與網(wǎng)絡(luò)公開資料,若涉及版權(quán)請聯(lián)系修改
本文由 @HAI Design 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
這篇文章把人機(jī)交互的發(fā)展講得很清楚,從最早的機(jī)械交互到現(xiàn)在的多模態(tài)交互,每次技術(shù)進(jìn)步都改變了我們和機(jī)器的互動(dòng)方式。現(xiàn)在AI發(fā)展這么快,感覺未來人機(jī)交互會(huì)更加自然和智能,但也面臨一些挑戰(zhàn),比如怎么讓人機(jī)交互更高效、更貼合人類的需求。