AI搜索,一鍵直達答案
AI技術的介入,為搜索領域帶來了革命性的變革。本文通過深入分析“天工AI搜索”、“夸克”和“元寶搜索”等AI搜索功能,探討了它們如何利用先進的算法和大數(shù)據(jù)分析,為用戶提供更精準、更直觀的搜索結果。
時間,是怎樣被無情吞噬?
輸入關鍵詞、在一長串網(wǎng)頁結果中點擊瀏覽、規(guī)避隱藏的廣告,甚至有時還得看個視頻才能找到想要的結果。這是傳統(tǒng)的搜索引擎,為了找到自己想要的答案,不得不耗費大量時間和精力大海撈針,是讓人著急的體驗。
搜索的下半場,是AI。
昆侖萬維發(fā)布國內第一款AI搜索引擎“天工AI搜索”;夸克推出以AI搜索為中心的一站式AI服務;騰訊元寶上線深度搜索模式……大模型廠商們不約而同押注此方寶地,騰訊、百度、360等眾多大廠均發(fā)布AI搜索產(chǎn)品或功能。
數(shù)據(jù)顯示,當前在大模型相關產(chǎn)品的使用中,超過65%的用戶需求集中于提升工作與學習效率,其中“搜索問答”需求占比高達45%??梢哉f,AI搜索顛覆了幾十年來一成不變的搜索格局,一切變得簡潔、高效,真是“懶人必備”。
一、搜常識,形式內容,缺一不可
醫(yī)學、地理、歷史、文學、物理……一搜索,無數(shù)紛繁復雜的信息撲面而來,需要自己甄別。當搜索融入了AI基因,能幫助用戶選出最佳答案嗎?
“紅細胞和白細胞有什么區(qū)別”,這是天工、夸克和元寶得到的第一個問題。
天工參考了全網(wǎng)的12個信源,畫出了一張表格,從大小、形狀、顏色、主要功能等進行比較,比如白細胞直徑10~15微米,可以進行免疫防御和炎癥反應,紅細胞直徑7~8微米,主要運輸氧氣和二氧化碳。表格的形式讓“小白”用戶一目了然,并且還有簡單的總結。如果覺得表格中的信息過于簡單,想要了解更多,天工直接從一些醫(yī)學網(wǎng)站上“拿來”相關內容,讓用戶自選。
夸克雖然沒有給出表格,在形式上略遜于天工,參考資料也只有一篇,但從生理功能、臨床意義、形態(tài)、數(shù)量等方面給出了兩者的區(qū)別。像“臨床意義”是天工沒有提到的,白細胞計數(shù)偏低,可能是再生障礙性貧血、脾功能亢進癥等引起,紅細胞偏低可能是長期處于缺氧環(huán)境、真性紅細胞增多癥等引起。和天工一樣,在給出答案后,又給出了不少其他平臺上的信息。
元寶參考了11篇資料,同樣從形態(tài)、數(shù)量、功能等方面替用戶總結好了,甚至還有一些衍生問題,引導用戶繼續(xù)提問,比如“紅細胞減少的常見原因是什么”“白細胞減少癥的癥狀有哪些”等。雖然元寶也沒有表格,但它給出了更多帶有圖片的鏈接,像微信公眾號病理柳葉刀的《一圖讀懂紅細胞VS白細胞》等。
從這個問題看,三大AI搜索平臺的表現(xiàn)各有千秋,從形式上看,天工最為出新,從信息量上看,夸克略勝一籌,從問題衍生性看,元寶稍占上風。
回答完了醫(yī)學問題,再回答一個地理問題:世界上最長的河流是哪一條,主要流經(jīng)哪些國家?相較于上一道題,這道題的答案指向性比較單一。世界上最長的河流是尼羅河,天工除了給出這個答案,還告訴用戶尼羅河的長度、發(fā)源地、對途經(jīng)國家的作用等;元寶也抓住了問題的關鍵點,并且提出了不少延伸問題。但夸克卻“拉垮”了,沒能理解這道題,給出的答案是“埃及”,它把題目理解成了“世界上最長的河流在哪個國家”。
二、搜新聞,深層搜索,“卷”出天際
在信息爆炸的時代,搜索是獲取新聞的重要窗口,但通常搜索一條新聞,會出現(xiàn)各種五花八門的消息,甚至還有“舊聞”摻雜其中,降低了搜索效率。
最近,關于“蘿卜快跑”的新聞非常多,讓這些AI搜索梳理一下吧。
天工綜合了騰訊、百度等平臺上4篇信源,總結出蘿卜快跑近期有技術故障和識別能力不足等新聞,比較簡單,也并不全面。
夸克同樣也引用了4篇報道,相較于天工信息,其梳理得更為詳細,比如把蘿卜快跑和行人發(fā)生輕微接觸的過程都寫了出來,也總結了這起事故帶來的后果。對于用戶體驗不佳的事,夸克蜻蜓點水般提了一下,并沒有詳細說明。
在這條新聞的梳理方面,元寶的表現(xiàn)明顯占優(yōu),不僅參考的資料多,達到了10篇,還總結出了6件事情,分別是武漢街頭無人駕駛汽車引發(fā)熱議、日均訂單量趕上出租車、與行人相撞、網(wǎng)絡水軍事件、面臨安全挑戰(zhàn)以及和真人司機“搶飯碗”,每一個事件都可以跳轉到相關網(wǎng)站查看詳細報道。
對于蘿卜快跑的消息,這三個平臺在梳理完后,都給出了一些延伸問題,比如蘿卜快跑的技術故障是什么原因引起的、蘿卜快跑何時將覆蓋更多的城市、蘿卜快跑的訂單量增長對傳統(tǒng)出租車行業(yè)有何影響等……
大模型是需要“教導”的,天工第一次給出的答案是三個平臺中最簡單的,被要求“重答”后,它認真了一點,不僅梳理的信息更加多元,包括交通故障、服務問題投訴、公眾對蘿卜快跑的態(tài)度等,還進行了分類,看上去更加清晰。
在此輪中表現(xiàn)不錯的元寶非?!熬怼保溆小吧疃妊芯吭搯栴}”功能,就這個問題,元寶參考了53篇資料,相較于一開始的10篇增加了43篇。深度回答在內容方面也更加詳細,以蘿卜快跑在武漢發(fā)生的交通事故為例,不僅有事故概況,還分析了責任問題和回應措施。值得一提的是,元寶用一張腦圖展現(xiàn)了深度梳理出的信息,看起來更為直觀。
三、搜觀點,思想火花,各抒己見
想法不碰撞,就像花兒不斗艷,少了那份活力和色彩。大多數(shù)事件都會產(chǎn)生各種不同的觀點和看法,在信息時代,搜索觀點變得尤為重要,這些AI搜索能挖掘出深藏于網(wǎng)絡的思想寶藏嗎?
“大模型如雨后春筍般涌現(xiàn),現(xiàn)在的大模型好用嗎?”這是一個仁者見仁智者見智的問題。
面對這個問題,天工給自己做起了廣告,說“天工大模型”的設計和優(yōu)化都是基于最新的技術進展和用戶反饋,通過不斷的學習和迭代,可以成為用戶信賴的伙伴。
這顯然不是記者想要的答案,雖然在“相關資訊”中,天工提供了不少和大模型相關的報告和觀點,但這些信息都比較零散,需要自己梳理。
元寶依然參考了最多的資料,總結了各類評測結果,但給出的答案主要側重于大模型的優(yōu)點。比如根據(jù)浙江大學、香港中文大學的一些評測結果顯示,大型語言模型在專業(yè)領域知識測試中表現(xiàn)優(yōu)秀,多個大模型的中文能力超過了GPT—3.5。
在用戶反饋方面,元寶得出的結論是大語言模型在意圖識別和內容結果呈現(xiàn)方面表現(xiàn)良好,能夠提供全面深入的信息。
雖然這樣的結論有其合理性,但大模型畢竟還處于發(fā)展上升階段,有許多不足之處。
在這個問題上,夸克提煉出的觀點更為中立,除了肯定大模型在能力、易用性、效率等方面的優(yōu)勢,也直言不諱地表示,目前大模型在安全性、隱私保護、能力提升等方面依然有進步的空間,比如“用戶擔心個人數(shù)據(jù)可能被濫用,或者模型可能被用于不道德或非法目的,目前,大模型仍處于發(fā)展初期,還面臨諸多挑戰(zhàn)和限制”等。
總之,這些AI搜索應用在接受“拷問”時展現(xiàn)了不同的優(yōu)勢,但也會有“迷糊”的時候。當然,每一次“迷糊”可能是它們邁向更智能、更完善的一步。
作者/ IT時報記者 潘少穎
編輯/ 潘少穎 孫妍
本文由人人都是產(chǎn)品經(jīng)理作者【IT時報】,微信公眾號:【IT時報】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!