新智元报道编辑:编辑部【新智元导读】视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发展出真正的视觉能力?最新一轮的语言模型,如GPT-4...
2024-08-17 957 集体「失明」?视力测试惨败全都不及格
新智元报道编辑:编辑部【新智元导读】视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发展出真正的视觉能力?最新一轮的语言模型,如GPT-4...
2024-08-17 957 集体「失明」?视力测试惨败全都不及格
最新评论