KIMI視覺思考模型到底強(qiáng)不強(qiáng)?公開3輪真實(shí)體驗(yàn)和分析
在人工智能技術(shù)的不斷進(jìn)步中,Kimi的視覺思考模型K1以其獨(dú)特的能力吸引了眾多關(guān)注。本文將帶您深入了解K1模型的實(shí)際體驗(yàn),通過三輪真實(shí)的測試視頻和細(xì)致的分析,我們將探索K1在解決復(fù)雜問題、解讀圖表和識別圖片內(nèi)容等方面的強(qiáng)大功能。
Kimi的視覺思考模型 K1已經(jīng)發(fā)布有幾天了,有很多的測評和贊美。到底強(qiáng)不強(qiáng),需要自己去體驗(yàn)一下才行。
今天就體驗(yàn)和測評一下Kimi的這款新能力。
一、入口
進(jìn)入KimiPC官網(wǎng),在首頁 – 搜索框下,有一個快捷入口。
【Kimi k1 視覺思考模型搶先體驗(yàn)】
二、對話體驗(yàn)界面
中間是對話區(qū)域和3個提示問題,如下;
- 接下來我會發(fā)你截圖,幫我解答圖中的題目好嗎?
- 接下來我會發(fā)你一張復(fù)雜圖表,請你幫我逐步解讀?
- 接下來我會發(fā)你食物照片,收到后幫我逐步計(jì)算卡路里?
看似默認(rèn)的預(yù)設(shè)問題,分別暗示了Kimi的K1思考模型的3個能力層面。
- 解答數(shù)學(xué)題,很難很難的那種。
- 解讀復(fù)雜的圖表,類似于財(cái)報(bào),包含了柱狀圖、餅圖、曲線圖、還有表格等各種復(fù)雜內(nèi)容、數(shù)字、符號的圖表文檔等。
- 圖片實(shí)體內(nèi)容識別,并解讀實(shí)體背后的核心邏輯,展現(xiàn)驚人的圖片識別和分析能力。
三、Kimi+的名片體驗(yàn)
還有右邊的Kimi+的名片,作為產(chǎn)品經(jīng)理,也是要好好研究一下的,值得玩味。
Kimi 視覺思考版
每個像素,都值得深入思考?;?k1 視覺思考模型 | 來自 Kimi
文檔解讀很強(qiáng)大。
支持的文件格式:PDF、Word 文檔(DOC、DOCX)、Excel 表格(XLSX)、PPT(PPT、PPTX)、TXT、CSV、MD。
四、測試素材準(zhǔn)備
為了順利測試Kimi的這幾個方面的能力,我準(zhǔn)備了3張不同的圖片,如下:
第一張:超高難度奧數(shù)題
第二張:電動汽車充電市場展望分析圖
第三張:用AI生成的一盤實(shí)物圖片
五、Kimi視覺思考模型解奧數(shù)題
體驗(yàn)過程,我已經(jīng)把體驗(yàn)的過程錄制成了視頻,請觀看,可獲得更直觀的感受。
體驗(yàn)過程中的幾點(diǎn)感受:
優(yōu)點(diǎn):
- 預(yù)設(shè)好的問題,埋好了prompt,上傳并發(fā)送相關(guān)圖片,即可得到想要的答復(fù),體驗(yàn)很好。
- 響應(yīng)速度很快,很好,基本不用等待。
- 輸出的過程非常詳細(xì),這道題很難,我?guī)缀跏强床欢琄imi思考了完整的詳細(xì)的過程,并連續(xù)輸出了4分鐘,1共59行推理過程,包含文字、數(shù)字、和公式。
如果哪位數(shù)學(xué)大牛懂這道題,可以詳細(xì)看看Kimi的解答過程是否合理。從多個其他大模型做這道題的過程借結(jié)果來看,我感覺Kimi的功底還是挺深的。
缺點(diǎn):
1、不管是PC端還是APP端,都存在前端公式渲染效果的問題,如下圖:
六、Kimi視覺思考模型解讀圖表
體驗(yàn)過程:
數(shù)據(jù)錯誤:
ABB:從6.6下降到0.9,下降幅度非常顯著。
結(jié)論也稍有問題:
這一部分的下降幅度更為顯著,尤其是ABB,其市銷率從6.6驟降至0.9。這可能表明這些公司在盈利能力和市場預(yù)期方面面臨更大的挑戰(zhàn)。
七、Kimi視覺思考模型計(jì)算圖中食物卡路里
體驗(yàn)過程,我已經(jīng)把體驗(yàn)的過程錄制成了視頻,請觀看,可獲得更直觀的感受。
Kimi的回答,第一步:
識別圖片中的食物,按照主次、大小的一般邏輯描述圖中的食物。
第二步:按照識別到的食物,逐一計(jì)算卡路里。
計(jì)算方式:
1、設(shè)定食物類型
2、該種食物單位熱量計(jì)算
3、估算圖中該種食物的分量
4、計(jì)算圖中該種食物的熱量值
第三步:所有食物熱量相加,得出總熱量值
第四步:自我反思,重新評估,反復(fù)確認(rèn)
以上就是體驗(yàn)的基本情況。
當(dāng)然還有更多場景沒有覆蓋,有興趣的伙伴也可以自己去試試。
還可以給一些潦草的筆記,讓Kimi識別后進(jìn)行思考輸出,很有意思。
利用這幾點(diǎn)能力,可以幫解決工作和生活中的一些問題。
本文由人人都是產(chǎn)品經(jīng)理作者【Echo 產(chǎn)品論】,微信公眾號:【產(chǎn)品經(jīng)理的邏輯與審美】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Kimi官網(wǎng)截圖
- 目前還沒評論,等你發(fā)揮!