GPT-4o手寫板書以假亂真驚呆網(wǎng)友!殺死谷歌翻譯,代碼建模無所不能
GPT-4o到底有多強?只有用過才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開始意識到,這標志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時代。
隨著越來越多人開始試用GPT-4o,大家發(fā)現(xiàn)發(fā)布會上的demo真的只是冰山一角,官方后續(xù)發(fā)出的用例以及網(wǎng)友們的整活才是更精彩的部分。
生成手寫體文字
OpenAI聯(lián)創(chuàng)Greg Brockman今天po出一張GPT-4o生成的圖片,他興奮地宣布:
「僅用GPT-4o的圖像生成功能就可以探索很多東西。團隊正在努力將這些內(nèi)容推向世界」
可以看到,這張圖片中,黑板上的手寫體達到了以假亂真的程度!
網(wǎng)友表示,看到這張圖片的一瞬間還以為是Greg講座現(xiàn)場的板書呢。
不知道筆跡專家看到了會作何感想,是否能讀解出這面黑板上「機器書寫」背后的人格特征呢?
看來GPT-4o不僅能模仿人類的語音語調(diào),連字體也開始向人類手寫體接近了。
1分鐘從屏幕截圖生成視頻游戲
推特網(wǎng)友從網(wǎng)上找了一張Breakout游戲的截圖,丟給ChatGPT并問它「你能把這個用Python編碼出來嗎?」
一分鐘之后,ChatGPT就生成了一份沒有bug、可以直接執(zhí)行的Python文件,完全復刻了截圖的效果。
而且Breakout這個游戲也是大有來頭,是一款1976年雅達利公司發(fā)行的街機視頻游戲,Steve Jobs和Steve Wozniak曾經(jīng)參與設(shè)計和開發(fā)工作。
用文字提示進行3D建模
前幾天,有人曾經(jīng)放出用GPT-4o將平面圖片進行3D重建的之后的效果,已經(jīng)十分驚艷。
但沒想到,GPT-4o生成3D效果甚至都不需要給它平面圖片,一段文字提示就夠了,比如下面這個用戶讓ChatGPT創(chuàng)建一個STL文件,建模一個有四條腿的桌子,并添加一些隨機特征。
ChatGPT不僅能給你渲染出的3D效果圖,還能馬上出一份原始的STL文件,就不用自己費力從頭開始建模了。
這一版ChatGPT的更新就是瞄準了個人AI助手的方向,工作狂Sam Altman最近在接受采訪時,也分享了自己使用ChatGPT提高工作效率的方法。
他說,在電腦上工作時,想搜索一些東西就不得不在頁面之間不斷切換。有了ChatGPT在旁邊,就可以「隨叫隨到」直接問它,讓自己能始終保持在專注的狀態(tài)。
一、GPT-4o vs. 谷歌翻譯
OpenAI的發(fā)布會展示了GPT-4o的實時翻譯能力,實現(xiàn)了英語和意大利語之間的無縫轉(zhuǎn)換,幾乎沒有響應(yīng)延遲,讓網(wǎng)友再次驚呼「翻譯要失業(yè)了」,這次連同聲傳譯行業(yè)也要一鍋端了。
與此同時,也掀起了一場和谷歌翻譯之間的較量。
有網(wǎng)友表示「谷歌和三星在手機上開發(fā)過類似的功能,但是做得很爛。你必須要說得很慢,而且確保吐字清晰,不然識別出的文本就會一團糟,也得不到正確的翻譯?!?/p>
谷歌翻譯到了要和大家說再見的時候了嗎?隨著OpenAI的語言能力不斷擴展,這并非完全沒有可能。
GPT-4o使用了新的分詞器,不僅英語的效率更高(token減少了1.1倍),而且還提高了許多其他語言的使用效率。
Greg Brockman發(fā)文稱「我們還顯著提高了非英語語言的性能,包括改進分詞器以更好地壓縮其中的許多語言」。
OpenAI現(xiàn)在支持50多種語言,從Greg Brockman放出的圖片中可以看出,包括阿拉伯語、俄語、印地語在內(nèi)的多種語言的token數(shù)量都得到了壓縮。
但是,OpenAI的翻譯功能也并非無懈可擊,有很多網(wǎng)友質(zhì)疑發(fā)布會上ChatGPT生成的意大利語聽起來有點奇怪。
于是有意大利用戶在線答疑,「其實這不是一種口音,只不過是AI語音在單詞之間插入了間隙。說英語時還好,但在意大利語中,這聽起來非常奇怪和呆板,因為它擾亂了節(jié)奏?!?/p>
更要命的是,GPT-4o分詞器語料庫中,中文數(shù)據(jù)污染非常嚴重。
有老哥寫了個腳本篩選ChatGPT新詞表中最長的100個中文字符,結(jié)果發(fā)現(xiàn)里面大部分賭博網(wǎng)站廣告,剩下一小部分是色情網(wǎng)站廣告。
面對這種景象,網(wǎng)友不禁感嘆「為什么GPT-4o如此horny?」
既然這樣,還是多用GPT-4o「練習練習英語」吧。
二、「后瀏覽器世界」:ChatGPT后再無谷歌搜索
OpenAI同時發(fā)布了兩項成果:GPT-4o及其新的ChatGPT桌面應(yīng)用程序。有專家預測,雖然 GPT-4o因其多模態(tài)而大放異彩,賺足了眼球,但桌面應(yīng)用程序才有可能真正挑戰(zhàn)谷歌主導地位,改變當今互聯(lián)網(wǎng)的形態(tài)。
GPT-4o的主要特點是多模態(tài)和低成本的低延遲,實現(xiàn)了人機之間更自然的對話和交互,而且與GPT-4Turbo相比似乎有了模型能力和智能的增長。
但當我們回顧幾年后的2024年5月13日時,最重要的消息可能是ChatGPT桌面應(yīng)用程序。
ChatGPT桌面應(yīng)用程序?qū)⑾葘acOS適用,隨后推出Windows版本,目前官網(wǎng)已發(fā)布了移動端iOS和安卓系統(tǒng)的下載鏈接。
該應(yīng)用程序可以快速訪問ChatGPT,并且你可以選擇讓它「透視」你的屏幕,實現(xiàn)「看你所看」,還可以像使用ChatGPT一樣,和它實時語音交互。
這完全超出了傳統(tǒng)瀏覽器的功能想象,從瀏覽器進入桌面,OpenAI邁出的這一小步,有可能是人機交互方式向前發(fā)展的一大步,OpenAI希望的,是完成一場「搜索革命」。
OpenAI希望擺脫瀏覽器并進入桌面
瀏覽器是舊的互聯(lián)網(wǎng),萬維網(wǎng)的世界是谷歌的主場。
但OpenAI對這種舊的方式say no,它帶來是一種使用計算機和網(wǎng)絡(luò)的新方式——一個可以為用戶完成一切的助手,用戶需要什么,只需大聲說出來。
Sam Altman在他關(guān)于GPT-4o的博客文章中明確表示「對我來說,與計算機對話從來沒有感覺很自然,但現(xiàn)在情況發(fā)生了改變。隨著我們增加(可選的)個性化功能、訪問你的信息、協(xié)助你采取行動,我真的看到了一個令人興奮的未來,我們能夠利用計算機做比以往更多的事情?!?/p>
ChatGPT桌面應(yīng)用程序可以獲取訪問麥克風、攝像頭、文件、登錄信息以及用戶屏幕的權(quán)限,是「個人助手」的最佳位置。
有了這個「助手」,即使是智能手機用戶,也很難被谷歌和網(wǎng)絡(luò)所吸引。
在這種與計算機交互的新方式中,萬維網(wǎng)幾乎沒有立足之地。充其量,它充當?shù)氖切畔⒌奶峁┱摺?/p>
事實上,OpenAI將自己定位為聊天機器人生態(tài)系統(tǒng)的看門人,它推出了「出版商優(yōu)選計劃」,正在把選定的媒體機構(gòu)發(fā)展成為合作伙伴,美聯(lián)社、Axel Springer、金融時報、世界報等媒體已加入該計劃。
如果OpenAI 成功(目前還無法確定),那么它對我們信息生態(tài)系統(tǒng)的市場影響力將遠遠超過今天的谷歌。
參考資料:
https://x.com/gdb/status/1790869434174746805
https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/
https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/
https://x.com/rowancheung/status/1790783202639978593
https://x.com/tianle_cai/status/1790109646205890723
https://x.com/sherwinwu/status/1790854473260388814
https://x.com/op7418/status/1790292330156863964
https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/
https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/
編輯:喬楊 庸庸
來源公眾號:新智元(ID:AI_era),“智能+”中國主平臺,致力于推動中國從“互聯(lián)網(wǎng)+”邁向“智能+”。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @新智元 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!