标签:AI模型评测公平性

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

原标题:o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜 文章来源:新智元 内容字数:3057字AIME 2025 I 数学竞赛:大模型成绩引发的质疑 ...
阅读原文