體驗(yàn)完文心一言,我的一些思考

0 評(píng)論 6924 瀏覽 8 收藏 9 分鐘

近期,文心一言的發(fā)布,讓許多人都忍不住想要去一探究竟,并將其與ChatCPT做對(duì)比。作者體驗(yàn)完文心一言后,分析其在各個(gè)方面上的使用體驗(yàn),總結(jié)了自己一些思考,一起來(lái)看看吧。

本文一共分為三個(gè)部分,文心一言的使用測(cè)評(píng)、關(guān)于文心一言的一些思考以及能夠更快的拿到邀請(qǐng)碼的小技巧(彩蛋在最后,不要走開~),我在17號(hào)就拿到了文心一言的邀請(qǐng)碼,拿到之后立刻開始了我的體驗(yàn),不過在展示測(cè)評(píng)開始前,還是想寫一些文心一言的邊界:文心一言的回答最多支持5次重新回答。

  • 單次輸入prompt最多為1024個(gè)字
  • 在界面停留5分鐘沒有操作后會(huì)自動(dòng)刷新進(jìn)入新的對(duì)話
  • 目前暫不支持視頻和語(yǔ)音

一、文心一言使用評(píng)測(cè)

百度 CEO 李彥宏在這次發(fā)布會(huì)展示了文心一言的五大能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成,我們就根據(jù)它的能力展開測(cè)評(píng)。

文學(xué)創(chuàng)作:

文學(xué)創(chuàng)作上它能理解我的意思,文章內(nèi)容來(lái)看豐富度和故事性還是缺失一些,初中到高中的水平吧。據(jù)稱,文心一言的對(duì)語(yǔ)義的數(shù)據(jù)量訓(xùn)練已達(dá)萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù)和數(shù)十億的搜索數(shù)據(jù)。

商業(yè)文案創(chuàng)作:

商業(yè)文案的創(chuàng)作表現(xiàn)挺優(yōu)秀的,經(jīng)常用于商業(yè)文案創(chuàng)作的博主又多了一個(gè)好用的工具,再也不用苦苦想文案了。沒有靈感的時(shí)候可以來(lái)一言生成內(nèi)容,再結(jié)合自己的特質(zhì)加工,大幅提升了要經(jīng)常寫文案的人效率。

數(shù)學(xué)邏輯推理:

這是一道人大附中的考題,答案是“騎士”,測(cè)試了幾道題這里就不都放了??偟膩?lái)說文心一言的數(shù)據(jù)邏輯推理能力還是偏弱的,不過推理能力本就是AI界的難題。

多模態(tài)測(cè)試(僅圖像):

目前文心一言還不支持視頻和語(yǔ)音,在圖片的生成方面我覺得還是不錯(cuò)的,特別是中國(guó)風(fēng)的圖(有邀請(qǐng)碼的強(qiáng)烈推薦體驗(yàn)一下)。還有就是目前的謠言也很多,目前生成的圖形都是1:1的,有些甚至用長(zhǎng)圖去造謠,所以還請(qǐng)各位看官,理性看待,對(duì)我們自己的產(chǎn)品還是多加一些信任。

目前網(wǎng)上已經(jīng)傳出了文心一言很多段子了,有些確實(shí)很幽默,例如“夫妻肺片”“展示的是一對(duì)夫妻的肺,“車水馬龍”展示的則是一輛車在馬路上載著一條龍。對(duì)中文的理解并沒有我們期待中的深刻,仍停留在表面意思。當(dāng)然也有傳聞?wù)f是“漢譯英”再傳給Stable Diffusion,這一點(diǎn)我們不得而知。

中文理解:

中文理解來(lái)說,總體還算不錯(cuò)。它能回答你的問題,但是并不是那么的智能。水平的話對(duì)標(biāo)的話大概就是GPT3的水平,不過有一些文章還存在未標(biāo)注的情況,看來(lái)百度這一次上產(chǎn)品是有點(diǎn)趕了。

二、怎么看待文心一言?

  • 從技術(shù)上看,文心一言和GPT都用了有監(jiān)督精調(diào)、人類反饋強(qiáng)化模型(RLHF)和提示(prompt),并且也是基于Transformer預(yù)訓(xùn)練模型,并且使用自適應(yīng)學(xué)習(xí)率調(diào)整策略,這種模型可以通過大量數(shù)據(jù)進(jìn)行訓(xùn)練,從而提高模型的泛化能力。
  • 從數(shù)據(jù)上看,文心一言的訓(xùn)練數(shù)據(jù)包括萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等,在語(yǔ)言方面,百度表示文心一言使用了1000億條中英雙語(yǔ)數(shù)據(jù)進(jìn)行訓(xùn)練。
  • 從產(chǎn)品上看,文心一言目前的水平大概是chat-GPT3的水平,現(xiàn)在對(duì)標(biāo)chat-GPT確實(shí)有一定的差距。特別是在數(shù)學(xué)推理、語(yǔ)義理解、角色扮演這些方向來(lái)說。目前文心一言場(chǎng)景主要是用于智能客服、智能寫作、智能推薦等領(lǐng)域。
  • 從體驗(yàn)上看,響應(yīng)速度上是很不錯(cuò)的,對(duì)一些文本能力也有認(rèn)知水平,在對(duì)語(yǔ)言的理解力和回答的準(zhǔn)確性表現(xiàn)都很好。

總的來(lái)說,雖然仍有不足的地方,但是從它的回答上還是能看出百度沉淀下來(lái)的技術(shù)能力和創(chuàng)新實(shí)力,這也是為什么這篇文章我沒有和chatGPT對(duì)比的原因。對(duì)比國(guó)外的產(chǎn)品我們還有很長(zhǎng)的路要走,但是我依然對(duì)國(guó)內(nèi)AI產(chǎn)品抱有信心。畢竟由于XX原因open AI并沒有對(duì)中國(guó)開放,在研究語(yǔ)言模型的路上,也只有這些大廠具有研發(fā)“類GPT”的實(shí)力,也只有他們研發(fā)出來(lái)了,我們?cè)谑褂眠@些產(chǎn)品才能更加便捷和普惠。

在在文心一言的發(fā)布會(huì)上,李彥宏也承認(rèn),測(cè)試文心一言時(shí),還是有很多不完美的地方,但因?yàn)槭袌?chǎng)有需求,大家都希望早一點(diǎn)用上最新最先進(jìn)的大語(yǔ)言模型,所以在此時(shí)就推出。我覺得在這個(gè)時(shí)候能推出也能自證中國(guó)有研發(fā)語(yǔ)言模型的能力和實(shí)力,只是發(fā)展速度會(huì)慢一些。這兩個(gè)月國(guó)外的AI產(chǎn)品推出都很驚艷,能這個(gè)時(shí)候推出已經(jīng)很有勇氣了,我們應(yīng)該給國(guó)內(nèi)的產(chǎn)品更多的鼓勵(lì)和支持!

三、彩蛋

看到很多人都在排隊(duì)等文心一言的邀請(qǐng)碼,這里有個(gè)方法或許能幫助你更快的拿到。通過企業(yè)端去申請(qǐng)API接口,百度會(huì)發(fā)一個(gè)郵件回答你現(xiàn)在企業(yè)版暫時(shí)沒開放,再給你發(fā)一個(gè)個(gè)人版的邀請(qǐng)碼體驗(yàn)(我也是通過這個(gè)方法拿到的,但是現(xiàn)在不知百度有沒有改規(guī)則),下面附上文心一言企業(yè)版申請(qǐng)鏈接:https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

本文由 @榕意 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!