标签:测试

GPT-4和DALL·E 3彻底懵逼,这到底是「牛」还是「鲨」

夕小瑶科技说 原创作者 | 付奶茶、王二狗大离谱!我用GPT-4(V)和DALL·E 3 「混合双打」之下,生成了一张张 牛鲨🐂🦈图,那么问题来了,这到底是牛还是鲨?起因...
阅读原文

ChatGPT多模态解禁,网友玩疯!拍图即生代码,古卷手稿一眼识别,图表总结超6

新智元报道编辑:桃子【新智元导读】ChatGPT多模态能力终于可以尝鲜了!这周三,OpenAI刚刚宣布解禁ChatGPT多模态能力。如今,一上线,网友们瞬间玩疯了。接...
阅读原文

对 GPT-4V(ision) 的第一印象

图文|James Gallagher, Piotr Skalski翻译|匡萃彪在这个指南中,我们将分享我们对GPT-4V图像输入功能的第一印象。我们将进行一系列实验,测试GPT-4V的功能...
阅读原文

英伟达新王者登场!GH200超级芯片碾压H100,性能飙升17%!

夕小瑶科技说 分享来源 | 新智元继4月份加入LLM训练测试后,MLPerf再次迎来重磅更新!刚刚,MLCommons发布了MLPerf v3.1版本更新,并加入了两个全新基准:LLM...
阅读原文

ICCV 2023 Oral | 如何在开放世界进行测试段训练?基于动态原型扩展的自训练方法

机器之心报道机器之心编辑部本文首次提出一种针对开放世界的测试段训练方法。提高模型泛化能力是推动基于视觉的感知方法落地的重要基础,测试段训练和适应(T...
阅读原文

碾压H100!英伟达GH200超级芯片首秀MLPerf v3.1,性能跃升17%

新智元报道编辑:编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相,性能直接碾压H100,领先了17%。继4月份加入LLM训练测试后,MLPerf再次迎...
阅读原文

OpenAI:LLM能感知自己在被测试,为了通过会隐藏信息欺骗人类|附应对措施

新智元报道编辑:润【新智元导读】OpenAI,纽大,牛津大学等研究人员发现,LLM能够感知自身所处的情景。研究人员通过实验可以提前预知和观察这种感知能力。AI...
阅读原文

图灵测试已死!ChatGPT通过人类考试也不算,超强AI评估新秀「逻辑谜题」

新智元报道编辑:桃子【新智元导读】如何给大模型一个真正公平评价标准呢?世界最强AI——ChatGPT可以通过各种考试,甚至输出回答让人难以辨别真假。然而,它也...
阅读原文
1111213