全面测试 OpenAI o1:逻辑推理天衣无缝,空间推理一碰就碎?

全面测试 OpenAI o1:逻辑推理天衣无缝,空间推理一碰就碎?

AIGC动态欢迎阅读

原标题:全面测试 OpenAI o1:逻辑推理天衣无缝,空间推理一碰就碎?
关键字:模型,问题,人工智能,桌子,国际象棋
文章来源:人工智能学家
内容字数:0字

内容摘要:


来源:AI 科技大本营(ID:rgznai100)
作者:Timothy B Lee
编译:Eric Harrington
GPT-4o 对象棋策略没有深刻的见解,但训练数据中却有足够多的国际象棋对局,所以至少可以猜测出一个看似合理的走法。
相比之下,o1 试图扮演人类,真正地去分析棋盘状态。而它做得如此糟糕,以至于最终吐出了完全无意义的内容。去年 11 月的时候,外媒报道 OpenAI 前首席科学家 Ilya Sutskever(当时他还没离职)领导的团队取得了技术突破,有关 OpenAI 的 Q* 项目的消息也因此传出,该项目旨在构建能解决复杂数学问题的模型。
从此,全世界“妖魔化”了 Q* 的存在,有许多专家声称这就是 OpenAI 的 AGI(通用人工智能)项目,甚至还有一些 OpenAI 研究人员向董事会写了一封信,警告“一项强大的人工智能发现可能会威胁人类”。
这件事的结果就是,Ilya Sutskever 从此多了一个在外网爆火的梗:“Ilya 到底看到了什么?”(What did Ilya see?)
全球网友就像这样反复刷着表情包,每天都要在 OpenAI 官推底下质


原文链接:全面测试 OpenAI o1:逻辑推理天衣无缝,空间推理一碰就碎?

联系作者

文章来源:人工智能学家
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...