标签:样本

OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

机器之心报道 编辑:张倩、小舟有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能...
阅读原文

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

基于强化学习的智能空战模型研究

来源:专知 人工智能的进步深刻改变了各行各业,智能空战就是其中的典型代表之一。根据空战游戏的特点,构建了智能空战模型,主要包括样本集合的获取以及适用于...
阅读原文

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

新智元报道编辑:LRST 好困 【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比...
阅读原文

防不胜防!AI几米外隔空窥屏,HDMI线把信号泄露到空气里了

一水 发自 凹非寺量子位 | 公众号 QbitAI防不胜防!黑客通过显示器数据线泄露的信号,就能偷窥你的屏幕内容。 具体来说,是HDMI数据线的电磁辐射,会把一些显...
阅读原文

AI数据训AI,引发模型大崩溃!牛津剑桥最新研究,登上Nature发警告

夕小瑶科技说 原创作者 | 谷雨龙泽我们都知道,AI大模型是需要现成的数据来训练,只有喂给AI大量的数据,AI才能“学富五车”。为此,不少AI模型在研发的时候,...
阅读原文

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

在车祸中越大的车越安全吗?双因素方差分析方法

人们普遍认为在车祸中越大的车会越安全。 表12-1列出了在汽车碰撞测试中不同车型对头部损伤测量的结果(数据来自数据集35“汽车碰撞数据”)。 头部损伤是车祸...
阅读原文

科普之旅 :大语言模型的思维链

大数据文摘受权转载数据派THU 作者:胡赟豪 ‍‍‍在这个信息爆炸的时代,你是否曾幻想过与机器流畅交谈,或是让AI助你笔下生花,创作出惊艳的文章?这一切,都...
阅读原文

老外整了个领先的幻觉检测模型Lynx

夕小瑶科技说 原创作者 | 谷雨龙泽 大家想必都知道,AI用着用着就容易“胡言乱语”,我们把这种现象叫做“AI幻觉”。 简单来说,幻觉就是当AI模型在生成内容或回...
阅读原文

OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服

机器之心报道 编辑:Panda WLilian Weng 出品,必是精品。人会有幻觉,大型语言模型也会有幻觉。近日,OpenAI 安全系统团队负责人 Lilian Weng 更新了博客,...
阅读原文
12347