AIGC动态欢迎阅读
原标题:高级人工智能能否解决视觉难题并进行抽象推理?
关键字:人工智能,模型,语言,视觉,研究人员
文章来源:人工智能学家
内容字数:0字
内容摘要:
人工智能已经学会了掌握语言、创作艺术,甚至在国际象棋比赛中击败了大师。但它能破解抽象推理的密码吗?这些让人类困惑的棘手视觉谜题?研究人员正在测试人工智能的认知能力,推动多模态大型语言模型 (MLLM) 解决曾经只用于人类智商测试的视觉问题。结果如何?让我们一窥人工智能已经走了多远——以及它仍然在哪些方面遇到困难。
人工智能已经学会了掌握语言、创作艺术,甚至在国际象棋比赛中击败了大师。但它能破解抽象推理的密码吗?这些棘手的视觉谜题让人类摸不着头脑。南加州大学维特比工程学院信息科学研究所 (ISI) 的研究人员正在测试人工智能的认知能力,推动多模态大型语言模型 (MLLM) 解决曾经只用于人类智商测试的视觉问题。结果如何?让我们一窥人工智能已经走了多远——以及它仍然在哪些方面遇到困难。
南加州大学维特比 ISI 研究助理 Kian Ahrabian 和 Zhivar Sourati 最近研究了 MLLM 是否可以执行非语言抽象推理(需要视觉感知和逻辑推理的任务),并在 2024 年 10 月 7 日至 9 日在宾夕法尼亚州费城举行的语言建模会议 (COLM 2024) 上展示了他们的研究结
联系作者
文章来源:人工智能学家
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...