全面测试 OpenAI o1：逻辑推理天衣无缝，空间推理一碰就碎？

AIGC动态2年前 (2024)发布人工智能学家

AIGC动态欢迎阅读

原标题：全面测试 OpenAI o1：逻辑推理天衣无缝，空间推理一碰就碎？
关键字：模型,问题,人工智能,桌子,国际象棋
文章来源：人工智能学家
内容字数：0字

内容摘要：

来源：AI 科技大本营（ID：rgznai100）
作者：Timothy B Lee
编译：Eric Harrington
GPT-4o 对象棋策略没有深刻的见解，但训练数据中却有足够多的国际象棋对局，所以至少可以猜测出一个看似合理的走法。
相比之下，o1 试图扮演人类，真正地去分析棋盘状态。而它做得如此糟糕，以至于最终吐出了完全无意义的内容。去年 11 月的时候，外媒报道 OpenAI 前首席科学家 Ilya Sutskever（当时他还没离职）领导的团队取得了技术突破，有关 OpenAI 的 Q* 项目的消息也因此传出，该项目旨在构建能解决复杂数学问题的模型。
从此，全世界“妖魔化”了 Q* 的存在，有许多专家声称这就是 OpenAI 的 AGI（通用人工智能）项目，甚至还有一些 OpenAI 研究人员向董事会写了一封信，警告“一项强大的人工智能发现可能会威胁人类”。
这件事的结果就是，Ilya Sutskever 从此多了一个在爆火的梗：“Ilya 到底看到了什么？”（What did Ilya see?）
全球网友就像这样反复刷着表情包，每天都要在 OpenAI 官推底下质

原文链接：全面测试 OpenAI o1：逻辑推理天衣无缝，空间推理一碰就碎？