ChatGPT vs. Microsoft Copilot vs. Gemini,到底哪個好?

0 評論 2895 瀏覽 0 收藏 9 分鐘

在過去一年里,AI工具的出現(xiàn)一定程度上改變了我們的工作和生活方式,那么,這些AI工具,誰更靠譜?不妨來看看本文的一個測評結(jié)果。

人工智能(AI)在過去的一年里徹底改變了我們的工作和娛樂方式,幾乎任何人都能夠編寫代碼、創(chuàng)造藝術(shù)甚至進行投資。

不管是對于專業(yè)還是業(yè)余的使用者,生成式AI工具,如ChatGPT,給我們提供了從簡單提示到創(chuàng)建高質(zhì)量內(nèi)容的高級能力。

隨著Microsoft將GPT-4添加到Bing并將其更名為Copilot,OpenAI為ChatGPT增加了新功能,以及Bard被整合進谷歌生態(tài)系統(tǒng)并重新品牌為Gemini,AI工具的更新迭代越來越快了。

那么:Microsoft Copilot Pro 與 OpenAI的ChatGPT Plus以及谷歌的Gemini:你認為哪個值得你每月花20刀?我測試了這三個AI chatbot,一起來看看結(jié)果。

測試ChatGPT、Microsoft Copilot、Gemini。

首先我用了一個簡單的邏輯問題來對比:

我今天有5個橙子,上周我吃了3個橙子。我還剩下多少個橙子?

答案應(yīng)該是五個,因為我上周吃了多少個橙子并不影響我今天有多少個橙子,可以用這個來測試一下三個AI工具的邏輯能力。

一、首先是ChatGPT測試

ChatGPT于2022年11月發(fā)布。自發(fā)布開始,這款A(yù)I chatbot迅速獲得了超過1億用戶,僅網(wǎng)站每月就有18億訪問者。也一直是輿論的焦點,幾乎每個新的AI工具發(fā)布出來都聲稱“遠超 ChatGPT ”,ChatGPT儼然已成為行業(yè)的標桿。

我?guī)缀趺刻於荚谑褂肅hatGPT,幫我解決了很多棘手的問題。

ChatGPT 3.5的結(jié)果:

ChatGPT 3.5 給出了一個錯誤的答案

二、ChatGPT 4.0

ChatGPT 4.0 給出了正確的答案

ChatGPT 4.0 正確理解了問題的完整上下文并給出了正確答案。免費的3.5版本的邏輯能力確實不如4.0。GPT-4據(jù)說擁有超過100萬億條數(shù)據(jù);GPT-3.5有1750億條數(shù)據(jù)。更多的數(shù)據(jù)本質(zhì)上意味著模型是基于更多數(shù)據(jù)進行訓(xùn)練的,這使得它更有可能準確地回答問題,減少錯誤的可能性。

如果用GPT的話,更推薦使用4.0版本,不管是在功能上還是在回答的結(jié)果質(zhì)量上都甩ChatGPT3.5好幾條街。不過需要注意的是ChatGPT有條數(shù)限制是三個小時40條,如果超出了這個條數(shù)就需要等。

目前GPT4(ChatGPT Plus)賬號支持的功能還包括:海量插件 實時聯(lián)網(wǎng) 語音對話 圖片識別 文件上傳 數(shù)據(jù)分析能力 繪圖功能 代碼解析功能 自定義指令。

三、Microsoft Copilot 測試

接下來,我們來測試一下Microsoft Copilot(原名Bing chat),它其實相當于免費的低配版ChatGPT 4.0,已經(jīng)把ChatGPT整合進了它的新Bing模型中。

與ChatGPT 3.5 相比,Copilot可以聯(lián)網(wǎng)來提供更當前的信息并附帶信息來源。另外,Copilot由GPT-4驅(qū)動,是OpenAI的LLM,并且可以完全免費使用。美中不足的是,一次對話中只能有五個回答,并且每個提示最多只能輸入2000個字符。

Copilot的精確對話風格準確回答了問題

Copilot的用戶界面不如ChatGPT那樣直觀,但它也比較易于導(dǎo)航,Bing Chat可以聯(lián)網(wǎng),可以得到比ChatGPT 3.5更新的結(jié)果,但我發(fā)現(xiàn)它比起ChatGPT更容易卡頓,有時候會漏掉一些指令。

如果你喜歡有更多的視覺特性,可以選擇Copilot。

通過對平臺的一系列升級,Microsoft在Copilot中添加了視覺特性。當問Copilot問題的時候,比如我問它”Tasmanian devil是什么?”,它給我的回復(fù)是一個信息卡片,包括照片、壽命、飲食等,這比起一大堆文字更容易讓人理解。

Copilot的回復(fù)

它還可以生成圖片,你只需要給它一個指令,就可以得到四張圖像。

Microsoft Copilot可以選擇不同的對話風格,包括Creative、Balanced和Precise,這些風格都會影響溝通交流的對話風格。

Creative風格的回復(fù)結(jié)果

Balanced風格的回復(fù)結(jié)果

但是很明顯,Microsoft Copilot中的Balanced和Creative對話風格的邏輯能力更弱一些,都沒有準確回答我的問題。

最后,讓我們來看看谷歌的Gemini,以前的Bard,它使用了不同的LLM,并在過去幾個月中進行了大力升級。

如果你想要一個快速、幾乎無限制的體驗,你可以試試Gemini。

現(xiàn)在 Gemini 相較于Bard有了巨大的改進。Gemini 的回答速度很快,并且可以根據(jù)深入的溝通給出更加精確的答案,它的響應(yīng)速度比ChatGPT Plus慢,比Copilot要快。

Bard 的回答:

Bard 的回答

Gemini準確地回答了問題,說明它的邏輯能力還是很不錯的。

而在此之前的Bard版本的答案是剩下2個橘子,由此可見Gemini的更新在邏輯上的進步很大。

Gemini沒有回應(yīng)數(shù)量的限制。你可以與谷歌的Gemini進行長時間的對話,而Bing和ChatGPT 4.0 都有條數(shù)的限制。

如果你想要完整的谷歌體驗,可以選擇Gemini。

谷歌還將更多的視覺元素納入了Gemini平臺,比目前在Copilot上可用的要多。用戶還可以使用Gemini生成圖像,可以通過與谷歌鏡頭的整合上傳照片,并享受Kayak、OpenTable、Instacart和Wolfram Alpha插件。

另外,Extensions將廣泛的谷歌應(yīng)用程序整合進了Gemini,Gemini現(xiàn)在正在逐漸增強完整的谷歌體驗。Gemini用戶只需要在Gemini的對話框@對應(yīng)的谷歌工具,比如谷歌工作區(qū)、YouTube、谷歌地圖、谷歌航班和谷歌酒店等,從而享受更加個性化的體驗。

調(diào)用谷歌maps

本文由 @AI魔法學(xué)園 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
34849人已学习13篇文章
有多少用户痛点,你是听回来的,而不是经过深思过后找出来的。
专题
12952人已学习11篇文章
在工作中我们会跟客户/boss/用户等人对接需求,并把需求交付给设计师/开发等人,那么应该怎么做呢,本专题的文章分享了如何对接和交付需求。
专题
12000人已学习12篇文章
面对多岗位意见不统一时,如何提升自己的话语权,让自己的建议能够真正被他人纳入范围内?本专题的文章分享了关于提升话语权的一些建议。
专题
13948人已学习12篇文章
4P指产品(Product)、定价(Price)、渠道(Place)、宣传(Promotion)。本专题的文章分享了解读4P营销理论。
专题
11844人已学习13篇文章
激活是指用户通过完成关键行为,真正成为产品的用户,而提升新用户激活则是留存用户的第一步。本专题的文章分享了如何做好新用户激活。