GPT-4o手寫板書以假亂真驚呆網(wǎng)友!殺死谷歌翻譯,代碼建模無所不能

新智元
0 評論 1121 瀏覽 1 收藏 13 分鐘

GPT-4o到底有多強?只有用過才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開始意識到,這標志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時代。

隨著越來越多人開始試用GPT-4o,大家發(fā)現(xiàn)發(fā)布會上的demo真的只是冰山一角,官方后續(xù)發(fā)出的用例以及網(wǎng)友們的整活才是更精彩的部分。

生成手寫體文字

OpenAI聯(lián)創(chuàng)Greg Brockman今天po出一張GPT-4o生成的圖片,他興奮地宣布:

「僅用GPT-4o的圖像生成功能就可以探索很多東西。團隊正在努力將這些內(nèi)容推向世界」

可以看到,這張圖片中,黑板上的手寫體達到了以假亂真的程度!

網(wǎng)友表示,看到這張圖片的一瞬間還以為是Greg講座現(xiàn)場的板書呢。

不知道筆跡專家看到了會作何感想,是否能讀解出這面黑板上「機器書寫」背后的人格特征呢?

看來GPT-4o不僅能模仿人類的語音語調(diào),連字體也開始向人類手寫體接近了。

1分鐘從屏幕截圖生成視頻游戲

推特網(wǎng)友從網(wǎng)上找了一張Breakout游戲的截圖,丟給ChatGPT并問它「你能把這個用Python編碼出來嗎?」

一分鐘之后,ChatGPT就生成了一份沒有bug、可以直接執(zhí)行的Python文件,完全復刻了截圖的效果。

而且Breakout這個游戲也是大有來頭,是一款1976年雅達利公司發(fā)行的街機視頻游戲,Steve Jobs和Steve Wozniak曾經(jīng)參與設(shè)計和開發(fā)工作。

用文字提示進行3D建模

前幾天,有人曾經(jīng)放出用GPT-4o將平面圖片進行3D重建的之后的效果,已經(jīng)十分驚艷。

但沒想到,GPT-4o生成3D效果甚至都不需要給它平面圖片,一段文字提示就夠了,比如下面這個用戶讓ChatGPT創(chuàng)建一個STL文件,建模一個有四條腿的桌子,并添加一些隨機特征。

ChatGPT不僅能給你渲染出的3D效果圖,還能馬上出一份原始的STL文件,就不用自己費力從頭開始建模了。

這一版ChatGPT的更新就是瞄準了個人AI助手的方向,工作狂Sam Altman最近在接受采訪時,也分享了自己使用ChatGPT提高工作效率的方法。

他說,在電腦上工作時,想搜索一些東西就不得不在頁面之間不斷切換。有了ChatGPT在旁邊,就可以「隨叫隨到」直接問它,讓自己能始終保持在專注的狀態(tài)。

一、GPT-4o vs. 谷歌翻譯

OpenAI的發(fā)布會展示了GPT-4o的實時翻譯能力,實現(xiàn)了英語和意大利語之間的無縫轉(zhuǎn)換,幾乎沒有響應(yīng)延遲,讓網(wǎng)友再次驚呼「翻譯要失業(yè)了」,這次連同聲傳譯行業(yè)也要一鍋端了。

與此同時,也掀起了一場和谷歌翻譯之間的較量。

有網(wǎng)友表示「谷歌和三星在手機上開發(fā)過類似的功能,但是做得很爛。你必須要說得很慢,而且確保吐字清晰,不然識別出的文本就會一團糟,也得不到正確的翻譯?!?/p>

谷歌翻譯到了要和大家說再見的時候了嗎?隨著OpenAI的語言能力不斷擴展,這并非完全沒有可能。

GPT-4o使用了新的分詞器,不僅英語的效率更高(token減少了1.1倍),而且還提高了許多其他語言的使用效率。

Greg Brockman發(fā)文稱「我們還顯著提高了非英語語言的性能,包括改進分詞器以更好地壓縮其中的許多語言」。

OpenAI現(xiàn)在支持50多種語言,從Greg Brockman放出的圖片中可以看出,包括阿拉伯語、俄語、印地語在內(nèi)的多種語言的token數(shù)量都得到了壓縮。

但是,OpenAI的翻譯功能也并非無懈可擊,有很多網(wǎng)友質(zhì)疑發(fā)布會上ChatGPT生成的意大利語聽起來有點奇怪。

于是有意大利用戶在線答疑,「其實這不是一種口音,只不過是AI語音在單詞之間插入了間隙。說英語時還好,但在意大利語中,這聽起來非常奇怪和呆板,因為它擾亂了節(jié)奏?!?/p>

更要命的是,GPT-4o分詞器語料庫中,中文數(shù)據(jù)污染非常嚴重。

有老哥寫了個腳本篩選ChatGPT新詞表中最長的100個中文字符,結(jié)果發(fā)現(xiàn)里面大部分賭博網(wǎng)站廣告,剩下一小部分是色情網(wǎng)站廣告。

面對這種景象,網(wǎng)友不禁感嘆「為什么GPT-4o如此horny?」

既然這樣,還是多用GPT-4o「練習練習英語」吧。

二、「后瀏覽器世界」:ChatGPT后再無谷歌搜索

OpenAI同時發(fā)布了兩項成果:GPT-4o及其新的ChatGPT桌面應(yīng)用程序。有專家預測,雖然 GPT-4o因其多模態(tài)而大放異彩,賺足了眼球,但桌面應(yīng)用程序才有可能真正挑戰(zhàn)谷歌主導地位,改變當今互聯(lián)網(wǎng)的形態(tài)。

GPT-4o的主要特點是多模態(tài)和低成本的低延遲,實現(xiàn)了人機之間更自然的對話和交互,而且與GPT-4Turbo相比似乎有了模型能力和智能的增長。

但當我們回顧幾年后的2024年5月13日時,最重要的消息可能是ChatGPT桌面應(yīng)用程序。

ChatGPT桌面應(yīng)用程序?qū)⑾葘acOS適用,隨后推出Windows版本,目前官網(wǎng)已發(fā)布了移動端iOS和安卓系統(tǒng)的下載鏈接。

該應(yīng)用程序可以快速訪問ChatGPT,并且你可以選擇讓它「透視」你的屏幕,實現(xiàn)「看你所看」,還可以像使用ChatGPT一樣,和它實時語音交互。

這完全超出了傳統(tǒng)瀏覽器的功能想象,從瀏覽器進入桌面,OpenAI邁出的這一小步,有可能是人機交互方式向前發(fā)展的一大步,OpenAI希望的,是完成一場「搜索革命」。

OpenAI希望擺脫瀏覽器并進入桌面

瀏覽器是舊的互聯(lián)網(wǎng),萬維網(wǎng)的世界是谷歌的主場。

但OpenAI對這種舊的方式say no,它帶來是一種使用計算機和網(wǎng)絡(luò)的新方式——一個可以為用戶完成一切的助手,用戶需要什么,只需大聲說出來。

Sam Altman在他關(guān)于GPT-4o的博客文章中明確表示「對我來說,與計算機對話從來沒有感覺很自然,但現(xiàn)在情況發(fā)生了改變。隨著我們增加(可選的)個性化功能、訪問你的信息、協(xié)助你采取行動,我真的看到了一個令人興奮的未來,我們能夠利用計算機做比以往更多的事情?!?/p>

ChatGPT桌面應(yīng)用程序可以獲取訪問麥克風、攝像頭、文件、登錄信息以及用戶屏幕的權(quán)限,是「個人助手」的最佳位置。

有了這個「助手」,即使是智能手機用戶,也很難被谷歌和網(wǎng)絡(luò)所吸引。

在這種與計算機交互的新方式中,萬維網(wǎng)幾乎沒有立足之地。充其量,它充當?shù)氖切畔⒌奶峁┱摺?/p>

事實上,OpenAI將自己定位為聊天機器人生態(tài)系統(tǒng)的看門人,它推出了「出版商優(yōu)選計劃」,正在把選定的媒體機構(gòu)發(fā)展成為合作伙伴,美聯(lián)社、Axel Springer、金融時報、世界報等媒體已加入該計劃。

如果OpenAI 成功(目前還無法確定),那么它對我們信息生態(tài)系統(tǒng)的市場影響力將遠遠超過今天的谷歌。

參考資料:

https://x.com/gdb/status/1790869434174746805

https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/

https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/

https://x.com/rowancheung/status/1790783202639978593

https://x.com/tianle_cai/status/1790109646205890723

https://x.com/sherwinwu/status/1790854473260388814

https://x.com/op7418/status/1790292330156863964

https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/

https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/

編輯:喬楊 庸庸

來源公眾號:新智元(ID:AI_era),“智能+”中國主平臺,致力于推動中國從“互聯(lián)網(wǎng)+”邁向“智能+”。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @新智元 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
16932人已学习12篇文章
如何搞懂财务和业务之间的关系,并推进业务系统财务模块的建设呢?本专题的文章分享了财务系统的设计指南。
专题
101653人已学习23篇文章
做产品难,做运营更难,做APP运营推广难上加难。
专题
11934人已学习12篇文章
随着市场竞争的加剧,越来越多的企业为了提高内部管控的效率,开始自建或引入内部管理系统来提升公司的效率。本专题的文章分享了企业管理系统设计指南。
专题
62964人已学习14篇文章
你说你会写产品需求文档,我信!但是肯定写的不好,不服看看别人的。
专题
16881人已学习12篇文章
每年一到年底,各家APP平台就会陆续推出年度报告。本专题的文章分享了年度报告的设计思路。
专题
14478人已学习12篇文章
在职场中,跨部门沟通是一个非常重要的软技能,不管是要完成日常项目,还是接手新的业务,都需要有良好的跨部门沟通能力。本专题的文章分享了如何做好跨部门沟通。