高级人工智能能否解决视觉难题并进行抽象推理？

AIGC动态2年前 (2024)发布人工智能学家

AIGC动态欢迎阅读

原标题：高级人工智能能否解决视觉难题并进行抽象推理？
关键字：人工智能,模型,语言,视觉,研究人员
文章来源：人工智能学家
内容字数：0字

内容摘要：

人工智能已经学会了掌握语言、创作艺术，甚至在国际象棋比赛中击败了大师。但它能抽象推理的密码吗？这些让人类困惑的棘手视觉谜题？研究人员正在测试人工智能的认知能力，推动多模态大型语言模型 (MLLM) 解决曾经只用于人类智商测试的视觉问题。结果如何？让我们一窥人工智能已经走了多远——以及它仍然在哪些方面遇到困难。
人工智能已经学会了掌握语言、创作艺术，甚至在国际象棋比赛中击败了大师。但它能抽象推理的密码吗？这些棘手的视觉谜题让人类摸不着头脑。南加州大学维特比工程学院信息科学研究所 (ISI) 的研究人员正在测试人工智能的认知能力，推动多模态大型语言模型 (MLLM) 解决曾经只用于人类智商测试的视觉问题。结果如何？让我们一窥人工智能已经走了多远——以及它仍然在哪些方面遇到困难。
南加州大学维特比 ISI 研究助理 Kian Ahrabian 和 Zhivar Sourati 最近研究了 MLLM 是否可以执行非语言抽象推理（需要视觉感知和逻辑推理的任务），并在 2024 年 10 月 7 日至 9 日在宾夕法尼亚州费城举行的语言建模会议 (COLM 2024) 上展示了他们的研究结

原文链接：高级人工智能能否解决视觉难题并进行抽象推理？