大模型集體失智!9.11和9.9哪個(gè)大,幾乎全翻車(chē)了
最近,一個(gè)看似不言自明的問(wèn)題——"9.11和9.9哪個(gè)大"——竟然讓眾多主流大模型紛紛"失智",給出了令人啼笑皆非的答案。從GPT-4o到谷歌Gemini,再到Claude 3.5 Sonnet,這些先進(jìn)的AI模型在這個(gè)問(wèn)題上的表現(xiàn),不禁讓我們思考:在追求技術(shù)進(jìn)步的同時(shí),我們是否忽略了AI的"常識(shí)"教育?