标签:测试

英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生

新智元报道编辑:乔杨 好困 【新智元导读】MLPerf Inference发布了最新测试结果,英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技,展现出明显的性能...
阅读原文

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合

机器之心报道 机器之心编辑部「当一家人工智能公司的首席执行官更像是计算机科学家而不是推销员时,我感觉更舒服」。对于 DeepMind 来说,2023 是充满变化的...
阅读原文

faiss向量数据库测试《三体》全集,这家国产AI加速卡,把性能提了7倍!

引言在人工智能和机器学习技术的飞速发展中,向量数据库在处理高维数据方面扮演着日益重要的角色。近年来,随着大型模型的流行,向量数据库技术也得到了进一...
阅读原文

ChatGPT后,人工智能的终极里程碑却倒了

机器之心报道 编辑:泽南、亚鹂大模型的拟人行为,在让我们产生恐怖谷效应。「图灵测试是一个糟糕的测试标准,因为对话能力和推理完全是两码事。」最近几天,...
阅读原文

谷歌「Her」来啦!发布Gemini Live语音模式,现场演示两次翻车

夕小瑶科技说 原创作者 | 海野重磅惊喜! 今天,在MadeByGoogle发布会上,谷歌公布了 AI语音助手 Gemini Live,对标的正是GPT-4o,而且是两周前开放测试的语...
阅读原文

OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

机器之心报道 编辑:张倩、小舟有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能...
阅读原文

刚刚,OpenAI又双叒叕鸽了!没等来“草莓”发布,只敷衍发了评测集,网友:拿这来抢谷歌发布会风头?

整理 | 李冬梅 褚杏娟 大家期待中的 OpenAI 与谷歌“大战”并未如约而至,双方都打出了“毫无杀伤力”的棉花拳。以为能等到“草莓”,没想到来了个“羽衣甘蓝”尽管...
阅读原文

奥特曼秀5颗草莓疯狂暗示GPT-5?匿名新模型神秘现身,数学超强!

新智元报道编辑:桃子 好困 【新智元导读】奥特曼又来搞事情了!一张5颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘Strawberry项目真实存在。难道...
阅读原文

跨平台多模态智能体基准测试来了!但全班第一只考了35.26分

新智元报道编辑:alan 好困 【新智元导读】近日,来自CAMEL AI、KAUST、CMU、斯坦福、清华等高校和机构的研究人员推出了一个跨平台的多模态智能体基准测试,...
阅读原文

Gemini 1.5 Pro发布,赢了榜单第一,却被网友泼冷水

夕小瑶科技说 原创作者 | 海野在被OpenAI背刺这么多次后,谷歌终于长记性了。 没有进行任何预告,谷歌直接端上来了它的大杀器:Gemini 1.5 Pro。 并在Google ...
阅读原文

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气

一水 发自 凹非寺量子位 | 公众号 QbitAI起猛了,GPT-4o被谷歌新模型超越了! 历时一周,超1,2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys...
阅读原文

谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o

机器之心报道 编辑:陈陈、小舟这么强的模型,谷歌给大家免费试用。近两日,谷歌在‍不断发布最新研究。继昨日放出最强端侧 Gemma 2 2B 小模型后,刚刚,Gemin...
阅读原文

重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!

夕小瑶科技说 原创作者 | 海野在最近的大模型战争中,OpenAI似乎很难维持霸主地位。虽然没有具体的数据统计,但Claude3.5出现后,只是看网友们的评论,就能感...
阅读原文

Apple intelligence 正式开启测试!第一波文本工具测试体验来啦!

夕小瑶科技说 原创作者 | 海野Apple Intelligence 开启测试了!苹果带着它的人工智能走进现实了! 但是,坏消息是,目前Apple Intelligence仅支持美国地区使...
阅读原文
12345613