實測四款頭部AI高考志愿助手:一個能打的都沒有

0 評論 1850 瀏覽 0 收藏 21 分鐘

隨著人工智能技術(shù)的飛速發(fā)展,AI填報高考志愿已成為現(xiàn)實。今年,大模型的加入讓這一服務(wù)備受矚目。然而,這些AI助手的表現(xiàn)究竟如何?是否真正能夠幫助考生做出最合適的選擇?本文通過實際測試市面上四款頭部AI高考志愿助手,深入分析了它們在志愿推薦能力、復(fù)雜需求解決能力、推薦解釋能力等方面的表現(xiàn)。結(jié)果可能出人意料,讓我們一起揭開AI高考志愿助手的神秘面紗。

雖然AI填報高考志愿,已經(jīng)不是什么新鮮事,但今年有大模型的加持,讓市場變得看點十足。

因為填報志愿,本質(zhì)上是一套篩選并匹配數(shù)據(jù)的邏輯:大多數(shù)情況下,是根據(jù)高考成績從全國眾多大學高校中篩選出不低于門檻的部分,再從這部分中根據(jù)考生需求匹配最合適的一項或者幾項作為首選和備選。

這項涉及數(shù)據(jù)、系統(tǒng)和決策的繁雜工作,正好撞在了人工智能大模型的“槍口”上。百度、夸克、QQ瀏覽器、天工AI等等,一眾新老玩家都把“AI報志愿”幾個大字放到應(yīng)用最顯眼的位置,成了季度主打。

但有大模型加持的AI志愿填報到底水平如何,是否可靠,也是一直爭論不休的話題。尤其是今年,七個省份迎來了首屆“新高考”。

新高考采用分類考試、綜合評價、多元錄取的考試招生制度,與以往相比,在考試、命題、招生、錄取等方面都出現(xiàn)了很大變化。新高考賦予了考生更多的選擇空間,但也意味著過去的報考經(jīng)驗將不再適用。不過人工智能的幫助是否會讓報考變得簡單呢?

為了找到答案,我們試用了上述4款市面最火的應(yīng)用,并且在相同環(huán)境、相同條件下對平臺進行志愿推薦能力、復(fù)雜需求解決能力、推薦解釋能力等多方面進行評測,看看最終的結(jié)果如何。另外,為了確保測試的公平性,我們所使用的都是各個AI的非付費公開版本,看看在“0收費”的情況下,AI能給出怎樣的建議。

Part.1 沖、穩(wěn)、保,AI三把斧

首先,這四個平臺都需要先完善自己的省份以及專業(yè)、分數(shù),我們假設(shè)自己是來自河南的理科考生,此次高考分數(shù)586。

在完善了基本信息后,各個平臺會根據(jù)高考成績給到一個具體高考排名,而這個高考排名則是由省招生辦提供。

根據(jù)這些基礎(chǔ)信息,百度、夸克以及QQ瀏覽器都給到了“可沖擊、較穩(wěn)妥、可保底”三個方向的參考院校,并且在數(shù)據(jù)層面做得非常全面且詳細,從歷年分數(shù)到招生計劃,甚至連學費和細分科目都給了參考。相反天工AI遜色許多,僅給到十余家推薦學院,以及往年的最低錄取分數(shù)以及排名作為參考。

從學校推薦數(shù)量來看,百度給到了92所,夸克給到48所,QQ瀏覽器為55所。

但有意思的是,百度提供的92所院校均為可沖擊院校,穩(wěn)妥以及保底院校并未給出推薦。

值得一提的是,這4個平臺給到的院校推薦也有一定差別,百度和QQ瀏覽器以及天工AI給到的院校推薦覆蓋全國,且在數(shù)據(jù)更新上也比較及時,夸克多半為省內(nèi)院校,對想去省外的考生來說參考價值不大。

圖源:科技新知(夸克AI志愿助手)

另外,各個平臺給到的院校錄取預(yù)測概率也有較大差別。

拿浙江農(nóng)林大學舉例,在相同條件下,QQ瀏覽器給到的錄取概率為42%,百度給到的概率為20%,夸克則直接不將該學校作為沖刺目標。

還有安陽師范學院,夸克和百度均將其列為沖刺目標,且概率為50%左右,而在QQ瀏覽器上卻為穩(wěn)妥院校。

當然,在百度、夸克以及QQ瀏覽器中,高考生均可以根據(jù)地理位置、院校性質(zhì)(如985、211或雙一流等)、專業(yè)偏好等進一步篩選和排序院校,整理志愿信息等,使推薦更加貼合個人需求。

天工AI則是以智能體的問答形式所呈現(xiàn)。

圖源:科技新知(夸克AI志愿助手)

只是在錄取概率這一最重要的功能上,各家差異巨大的分析結(jié)果,還有眼花繚亂的大數(shù)據(jù),家長看了都很迷惑,更別說剛高中畢業(yè)的學生。

而據(jù)科技新知結(jié)合各家平臺給到的信息推測,這些內(nèi)容均來自權(quán)威官網(wǎng)、招生簡章、專業(yè)書籍以及名師視頻等渠道,最后由AI綜合全網(wǎng)信息后進行整理總結(jié),靠各家算法進行輸出。基本可以理解為靠數(shù)據(jù)進行簡單篩選,給到建議。

如果想要更加精準的借助AI來輔助填報志愿,可以盡可能地將自己的想法與喜好詳細告訴AI,以此來獲得更準確的答復(fù)。

這也是體現(xiàn)各家AI水準的重要檢測標準。

Part.2 選專業(yè),誰更專業(yè)?

從學校推薦數(shù)量來看,百度給到了92所,夸克給到48所,QQ瀏覽器為55所。但有意思的是,百度提供的92所院校均為可沖擊院校,穩(wěn)妥以及保底院校并未給出推薦。在更多需求下,基礎(chǔ)的過濾篩選模式變得無力,AI智能體更能理解考生的擇校標準,所以各家背后的王牌大模型也成了比較對象。所以我們測試了百度的文心一言、騰訊的元寶、阿里的通義千問以及天工AI四家大模型應(yīng)用,在面對更詳細的志愿填報需求時的表現(xiàn)。

同樣,我們需要給自己一個身份設(shè)定,假設(shè)自己是一位來自河南的理科考生,喜歡踢球、唱歌、動手能力強,對各種實驗以及電子產(chǎn)品十分感興趣,高考分數(shù)為520分。雖然描述并不算詳細,但也足夠讓AI建立一個對我們的初步印象,給出專業(yè)推薦。

根據(jù)這一身份設(shè)定,在第一輪回答中,各家給到的結(jié)果區(qū)別十分明顯。

騰訊元寶以及天工AI的推薦十分相似,均是一些理工科主流專業(yè),但兩家大模型給到的信息都十分有限,給出的推薦理由也十分勉強,幾乎都是圍繞“動手動力”這一關(guān)鍵詞展開。

值得一提的是,這4個平臺給到的院校推薦也有一定差別,百度和QQ瀏覽器以及天工AI給到的院校推薦覆蓋全國,且在數(shù)據(jù)更新上也比較及時,夸克多半為省內(nèi)院校,對想去省外的考生來說參考價值不大。

圖源:科技新知(騰訊元寶推薦)

圖源:科技新知(天工AI推薦)

相比之下,通義千問以及文心一言除了考慮到專業(yè)選擇的實際性,也根據(jù)興趣興趣提供了相關(guān)活動或輔修專業(yè)。

比如在踢球這個愛好下,提供了體育科學這一輔修專業(yè)。

圖源:科技新知(通義千問推薦)

圖源:科技新知(文心一言推薦)

值得一提的是,相較于其他平臺的籠統(tǒng)回答,文心一言更進一步的提供了就業(yè)前景、專業(yè)細分、跨學科特性等更多參考信息。

圖源:科技新知(文心一言推薦)

不過這里需要注意的是,在AI推薦的專業(yè)中,并非都是理科統(tǒng)招可以報考的,其中一些需要通過藝考后才能選擇,此外不同的學校還會有其他的申請要求,而AI對此并沒有太多的說明,這是一個明顯的漏洞,需要你繼續(xù)追問對應(yīng)專業(yè)和學校的相關(guān)細節(jié),AI才會給出更詳細的回答。

整體看下來,各家AI還是基本完成了初步的專業(yè)篩選要求,只是除文心一言和通義千問外,其余兩家AI的表現(xiàn)都比較一般,沒有帶來太多驚喜。通義千問和文心一言的回答更具參考價值,可以讓你快速了解自己興趣愛好所對應(yīng)的專業(yè)情況,節(jié)省許多的時間和精力。

不過,選專業(yè)的測試并非到此為止,很多考生在選擇專業(yè)時也會十分關(guān)注未來就業(yè)形勢,然而作為剛結(jié)束高考的學生來說,對某個專業(yè)了解有限的情況下,AI或許可以根據(jù)現(xiàn)有的市場需求、未來的市場發(fā)展方向、相關(guān)政策等方面給予我們一些建議。那么站在這個角度,AI會提供什么更專業(yè)的看法呢?

再向AI輸入“4年后,你認為哪個專業(yè)會有最好的就業(yè)環(huán)境?”后,AI的回答也在意料之外。

騰訊元寶、天工AI、通義千問3家平臺,都給出了包括新能源、生物科技、人工智能等前沿性專業(yè)推薦,文心一言回答的邏輯與其他3家完全不同,給到的是電子信息、計算機等更偏向傳統(tǒng)專業(yè)。不過4家平臺都針對各個專業(yè)做了就業(yè)方向和行業(yè)趨勢等分析,給出了更加詳細的解釋。

圖源:科技新知(通義千問回答)

有意思的是,騰訊元寶、天工AI、通義千問3家平臺雖然給出了比較專業(yè)且更前沿的專業(yè)的推薦,但是在沒有提供關(guān)鍵詞的情況下,都與上一個問題中提到的專業(yè)關(guān)聯(lián)性不大,有許多專業(yè)都是第一次出現(xiàn)在回答中,而且與提供的興趣愛好關(guān)聯(lián)性并不大。

文心一言提供的專業(yè)則與上個回答相似。

圖源:科技新知(文心一言回答)

不過這里需要注意的是,在AI推薦的專業(yè)中,并非都是理科統(tǒng)招可以報考的,其中一些需要通過藝考后才能選擇,此外不同的學校還會有其他的申請要求,而AI對此并沒有太多的說明,這是一個明顯的漏洞,需要你繼續(xù)追問對應(yīng)專業(yè)和學校的相關(guān)細節(jié),AI才會給出更詳細的回答。

整體看下來,各家AI還是基本完成了初步的專業(yè)篩選要求,只是除文心一言和通義千問外,其余兩家AI的表現(xiàn)都比較一般,沒有帶來太多驚喜。通義千問和文心一言的回答更具參考價值,可以讓你快速了解自己興趣愛好所對應(yīng)的專業(yè)情況,節(jié)省許多的時間和精力。

不過,選專業(yè)的測試并非到此為止,很多考生在選擇專業(yè)時也會十分關(guān)注未來就業(yè)形勢,然而作為剛結(jié)束高考的學生來說,對某個專業(yè)了解有限的情況下,AI或許可以根據(jù)現(xiàn)有的市場需求、未來的市場發(fā)展方向、相關(guān)政策等方面給予我們一些建議。那么站在這個角度,AI會提供什么更專業(yè)的看法呢?

再向AI輸入“4年后,你認為哪個專業(yè)會有最好的就業(yè)環(huán)境?”后,AI的回答也在意料之外。

騰訊元寶、天工AI、通義千問3家平臺,都給出了包括新能源、生物科技、人工智能等前沿性專業(yè)推薦,文心一言回答的邏輯與其他3家完全不同,給到的是電子信息、計算機等更偏向傳統(tǒng)專業(yè)。不過4家平臺都針對各個專業(yè)做了就業(yè)方向和行業(yè)趨勢等分析,給出了更加詳細的解釋。

這一步,基本可以篩選出一部分合適自己,且是前景較好的專業(yè),那么根據(jù)專業(yè)以及分數(shù)倒推,通過AI志愿助手是否可以幫助考生選出合適的學校呢?

Part.3 真實志愿填報,AI只能當輔助

在選好專業(yè)后,我們回到百度、夸克、QQ瀏覽器的AI志愿助手上,看看能否幫助我們選擇一個靠譜的院校,畢竟真實的志愿填報除了院校,專業(yè)的選擇也至關(guān)重要。這里我們將各個平臺的篩選模型改為專業(yè)優(yōu)先,并且專業(yè)選擇為計算機類。

首先是百度,在選擇想要報考的專業(yè)后,并沒有篩選出合適的院校,甚至排位順序都沒有改變。點開默認排序的第一個院校,雖然顯示有20%的沖擊概率,但僅有一個專業(yè)有20%概率,而我們想要選擇的計算機類專業(yè),則只有9%的沖擊概率。

圖源:科技新知(百度AI志愿助手)

如果將選擇改為錄取概率從高到底也是如此,雖然不少院校的外顯概率很高,但點開后均非我們所選的計算機專業(yè)。

在整個篩選過程,百度的AI志愿助手幾乎沒有體現(xiàn)出任何智能,連基礎(chǔ)的篩選排序都未能如意。

不過,“老師傅”夸克也沒有給到我們太大驚喜??淇穗m然篩選出了符合條件的院校,但與百度相似,外顯概率顯示的也是本校最高概率的其他專業(yè),而非我們想要報考的計算機專業(yè)。我們點開一個外顯為60%的穩(wěn)妥院校,但計算機類專業(yè)的錄取概率為19%。

圖源:科技新知(夸克AI志愿助手)

相比之下,QQ瀏覽器的篩選能力更直觀,在選擇計算類專業(yè)后,過濾掉了45所,僅剩下10所院校,雖然與前兩者一致,外顯的并非是我們所選專業(yè)的錄取概率,不過逐一點開后發(fā)現(xiàn)也還算貼切。

圖源:科技新知(QQ瀏覽器AI志愿助手)

縱觀這三個平臺,其實可以發(fā)現(xiàn)一個共同點,就是各家均以院校為重,錄取概率也是按照院校中要求最低專業(yè)的概率來計算,但如今家長、學生對于志愿填報早已不是單純只看學校,專業(yè)選擇也十分重要,但顯然AI志愿助手還不能給到好的建議,甚至連打輔助都難。

坦白講,讓看似“聰明”的AI來填志愿,似乎不太靠譜。浙江大學計算機科學與技術(shù)學院教授陳華鈞看了AI的回答后,也是連連搖頭,“它不是專門為填志愿訓練的,算法的訓練很大程度依賴于訓練數(shù)據(jù)的選擇,這包括了建模方式,對考生、學校和專業(yè)到底怎么評估,這個過程每個AI工具都不會一樣,所以給到的結(jié)果也不盡人意”。

不過夸克相關(guān)人員也向科技新知表示,AI志愿助手作為信息參考工具,跟市面上的收費咨詢服務(wù)是有本質(zhì)的不同,最終的志愿填報策略和選題的決定權(quán)還是在用戶手里,需考量自身興趣、家庭背景、成長規(guī)劃等。

對于多數(shù)考生來說,只要利用好AI的能力,在填報志愿時確實可以起到事半功倍的效果。而且以上的AI功能,大多是免費提供的,并不需要支付會員費用或是繳納高昂的輔導費,這一定程度上也讓可以拉近與其他考生的差距。但高考志愿填報除了復(fù)雜的分析、計算外更看重考生本身的意愿,很多時候,無論怎么選,都不會完美,都會有遺憾,不過請不要忘了,命運永遠是掌握在自己手中的。

作者丨王思原??編輯丨賽柯

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】,微信公眾號:【科技新知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!