这届出题太难了！新基准让多模态模型集体自闭，GPT—4o都是零分

机器之心 2025-02-18

多模态AI

ZeroBench是一个针对多模态模型的高难度视觉基准测试，包含100个复杂问题，涉及多步骤推理和广泛的知识领域。20多个知名AI模型在首次测试中全部得零分，显示当前多模态模型的能力与ZeroBench的难度之间存在显著差距。研究团队通过多轮筛选和调整，确保了问题的挑战性。

舆情等级

重要

舆情评分

负面舆情

舆情解析

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表123彩票app稳定版下载官方立场，不构成投资建议。如需详细阅读有关请点击此处