AI如何支棱起來?
在人工智能的浪潮中,我們?nèi)绾巫孉I真正成為我們的得力助手,而不僅僅是一個冰冷的工具?本文以一種輕松幽默的方式,探討了AI在信息接收與輸出、不確定性降低、交互效率提升等方面的最新進(jìn)展和應(yīng)用實踐。
本來這篇文章想用《最近有關(guān)AI的感悟和總結(jié)》來做標(biāo)題的,但寫上的時候,就感覺沒有意思,很無聊,也不夠酷。那怎么樣才能讓這篇寫AI感悟的文章變得有趣呢?
1、得用梗圖,有了,各個領(lǐng)域的AI小助理來幫我,這可不就是專業(yè)團隊嘛~
2、標(biāo)題得通俗易懂,其實分享的感悟都是AI怎么樣才能變得更好來幫助我們,也就是AI怎么樣才能支棱起來?
ok,那這就是今天的文章,我們一塊往下看!
1. 人會通過AI接收信息以及通過AI輸出信息
之前是人類自己接收信息和輸出信息,現(xiàn)在的一個發(fā)展趨勢是人還在中間,但是我們會通過AI來接收總結(jié)的信息以及通過AI來更好、更快的輸出。
怎么形容呢?就有點像是之前是單層肉漢堡,現(xiàn)在還是一片肉,但是在肉的周圍加了兩片蔬菜,變成多層蔬菜肉漢堡,就像下面這張圖一樣。
來個接收信息的案例吧:谷歌的NotebookLM可以把上傳的PDF通過播客的形式對外輸出,舉個例子,這在之前是一本書在網(wǎng)上,人直接看大部頭的書,現(xiàn)在AI在里面加了一道轉(zhuǎn)換,把它轉(zhuǎn)變?yōu)橛懻摃牟タ停叭藗冞€從來沒見過能把書自動轉(zhuǎn)為播客的軟件,那這個就很驚喜。
其實帶著這個思路我們可以想象有哪些可以做的嘗試,比如說把難啃的大部頭教科書、無聊的研報或者項目白皮書,換成一種另外一種人們有興趣的信息接收方式。
那什么形式更讓人能接受呢?視頻、音頻、圖文的信息相比于文字都更讓人可以接受,如果再考慮到適用的場景,那可視化圖文就是最好的方式了,因為它適用于幾乎所有場景,又一目了然,napkin就在做這件事。
例如下面我想介紹napkin,然后把上面這段文字給復(fù)制進(jìn)去讓它理解,它就可以從里面找到我想對比的一個是大部頭書本的無趣,另外一個是視覺內(nèi)容的吸引力,總之,用napkin就是很搭。
輸出信息的案例:這個就比較多了,比如說我最近在做的一個項目——AI報告,很多分析師需要寫行業(yè)深度報告,這在之前可能需要分析師寫上個好幾天來從行業(yè)簡介、競爭格局、行業(yè)政策這些方面輸出,但是現(xiàn)在可能AI能夠自動收集信息來幫你實現(xiàn)這一部分的輸出總結(jié),你可以在這個基礎(chǔ)上加以人工的校驗和修改就行了。
2. AI給出的答案是不確定的,但我們通過(prompt、流程、交互)可以把不確定性降低。
這個可以鏈接到我之前的文章:涉過真實的AI浪潮,在做AI會議助理這款產(chǎn)品的時候,就是通過類似于建房子的方式一步步達(dá)到客戶想要的會議總結(jié)效果。
只不過對于大模型來說,提示詞寫的好是最簡單也是最有效的步驟,也是建房子的第一步,先做好地基。
第二步,往往就是微調(diào)了,微調(diào)就是在這座房子打好地基,然后砌上磚瓦后,再鋪上一層水泥,這時候就有大致的形狀了。微調(diào)會讓文本總結(jié)/生成這種更趨向于客戶想要的標(biāo)準(zhǔn),但還是存在一定的波動和不確定。
第三步,有些房子的形狀我就是想這樣或者是那樣!比如我就想要中式建筑的屋頂,或者西式建筑的穹頂,這樣才好看,才是我的style。ok,滿足你,這里就是固定的流程,可能就是結(jié)合了簡單的程序,比如固定取數(shù)和固定生成某段文字(例如財報會議中的數(shù)據(jù)整理)。
3. 單從效率來看,文字對話的反饋還是太慢了
就說一個體驗上的問題,你吭哧吭哧打字半天,然后點擊發(fā)送,再接著等AI的反饋,如果再碰到慢AI,一來一回都5秒有了吧,而語音交互這一塊反饋就及時多了。
人類之間的對話也更傾向于語音對話,就像在工作中,我們遇到緊急問題還是會用電話甚至線下見面說。
很多AI情感陪伴類的app都有打語音視頻這個功能,而且沒準(zhǔn)還是收費的。這也側(cè)面驗證了語音對話這個功能,相比聊天打字還是體驗更好的,不然誰會付費啊。
近期一些大廠AI app在語音對話上也開始有動作了,例如豆包的語音對話,現(xiàn)在就可以聯(lián)網(wǎng)搜索一些話題,阿里的通義現(xiàn)在可以在語音聊天的同時上傳文件對話,而最早的場景英語口語助教更是每家必有。
那有沒有一種更快的交互方式呢?有的,一種就是我們每天都在用的觸摸和點擊這種(其實互聯(lián)網(wǎng)時代的觸摸點擊給出反饋是快于語音交互的);另外一種可能就是腦機交互了,等待馬斯克這些大佬去突破了。
4. AI時代最有想象力的產(chǎn)品——畫布
畫布可以容納和承載幾乎所有內(nèi)容形式:文字、表格、圖片、音頻甚至是視頻,而AI又可以全部生成以上內(nèi)容形式,所以理論上AI+畫布的上限是無窮高的(max)。
鋼鐵俠和賈維斯對話也是在一個畫布/面板上(咳…鋼鐵俠的頭盔面板),上面可以實時反饋出任何信息。我還有一個臆想,我想讓AI在畫布上復(fù)刻一個二維地球,上面會無限平鋪所有地球上的三維物體。對!那這個畫布就是《三體》里面的二向箔。
百度文庫也在近期宣布將上線“自由畫布”這一款軟件,但一直處于內(nèi)測中,也沒有人體驗到。其實AI畫布這種產(chǎn)品技術(shù)上實現(xiàn)可能難度為3顆星,但是算力消耗應(yīng)該是最高的5顆星;多模態(tài)對于算力消耗巨大,估計目前也只有大廠能燒得起了。
5. AI也得揣摩人類甲方的意圖
又懶又不想多打字的人類,你不多揣測一下它想問的是什么意思,怎么可能答的好?肯定會給你差評的!
這個我調(diào)研過chat類問答的用戶數(shù)據(jù),你會發(fā)現(xiàn),能夠問問題超過10個字的已經(jīng)很牛了,因為有一半的人問問題都不超過10個字的,我稱之為“打字要錢型用戶”,當(dāng)然我也是其中一員,10個字符以內(nèi)一般能問啥問題呢?我舉個例子:
- 你今天吃了沒?(7個字)
- 總結(jié)這個報告(6個字)
- 寫一份小紅書營銷文案(10個字)
這3個例子,大家就應(yīng)該明白,我們大部分人讓AI辦事都是妥妥的大甲方。AI需要根據(jù)這些僅有的只言片語,來完成你給它布置的模棱兩可的任務(wù),如果AI不能滿足你的期待,你就會像上面一樣給它來個差評——點踩。
所以,AI還是需要會一點讀心術(shù)的,通過簡簡單單的幾個字就能讀懂你我的心,知道我們想干嘛,這才是支棱起來(終于扣題了)的AI,也是我們最喜歡的乙方和員工。
寫這一點也是因為在市面上我已經(jīng)看到有比較好的產(chǎn)品案例了,螞蟻的支小助就是這樣一個能懂你心的AI助理。
因為工作原因,我可能用的投研支小助會比較多(還有其他類型,例如保險、營銷、理財?shù)模?,比如我問它:A股最近怎么樣?(8個字)
其實這問題要是別人問我,我肯定會回答:什么怎么樣?你說大盤走勢嗎,上周的,還是最近一個月的?很模糊的問題,我都搞不懂你想問的啥?
支小助這個會懂你心的AI助手,就會把“A股最近怎么樣?”這個問題再“揣摩”一下,解讀出6個相關(guān)的問題,如果你覺得它揣摩的不對,你還可以幫它改,相當(dāng)于跟員工說:不是你想的這樣,你得先這樣,然后再那樣…
之后再根據(jù)“揣摩”出來的6個解讀,集中回答你的問題,所以就會比較全面,因為這6個解讀總有一款適合你。
當(dāng)然,一個硬幣有正反兩面——回答也就比較長,不夠簡短,你問它“1+1等于幾”,支小助可能會給你扯出“1+1的哲學(xué)意義、1+1=2的數(shù)學(xué)原理”,所以也就有了快速解讀這樣一個功能。
按照支小助官方的解釋就是,支小助內(nèi)部嵌有很多的專家框架。它會根據(jù)你提問的問題去匹配對應(yīng)的框架,例如剛才問的A股的問題,就會匹配股票分析、市場分析下面很多對應(yīng)的框架。
這些框架你可以把它們理解為一個個專業(yè)的老師,當(dāng)你帶著同樣一個問題比如:我該怎樣好好學(xué)習(xí),天天向上呢?
去問各科老師,那英語老師就會說:你肯定要學(xué)好英語啊,學(xué)好英語才能看到更大的世界!數(shù)學(xué)、物理、化學(xué)老師齊刷刷的說:學(xué)好數(shù)理化,走遍天下都不怕!
所以支小助內(nèi)部其實是有一個專業(yè)團隊在做事情,怎么能不強大呢?
如果你喜歡這種有趣又帶有干貨的文章,不要忘了點贊加關(guān)注,我們下一篇再見!
本文由 @雨辰的夢語 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)
AI如何支棱起來?不斷學(xué)習(xí),深度訓(xùn)練,創(chuàng)新應(yīng)用,AI的潛力無窮無盡!
通過具體的案例來展示AI的實際應(yīng)用,比如你提到的谷歌NotebookLM,可以更詳細(xì)地描述這個案例,讓讀者感受到AI的實際價值。