标签:样本

13B模型全方位碾压GPT-4?这背后有什么猫腻

机器之心报道编辑:陈萍你的测试集信息在训练集中泄漏了吗?一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图所展示的,并且为了确保结果的有效性,这...
阅读原文

「对齐」太强是坏事?人大最新研究:完美正样本反而会损害「图对比学习」

新智元报道编辑:LRS【新智元导读】人民大学最新研究指出,更好的数据增强虽然可以提升其在下游任务的泛化能力,但也会减弱对比学习的上游性能。近年来,由于...
阅读原文

当数据成为「生产资料」,三篇论文总结如何用水印技术保护AI训练数据版权

机器之心原创作者:Jiying编辑:H4O1、引言 -- 为什么要在 AI 训练数据中添加水印?深度神经网络(DNN)以其高效率和高效益被广泛应用于许多关键任务应用和设...
阅读原文

用AI评估AI,上交大新款大模型部分任务超越GPT-4,模型数据都开源

Pengfei Liu 投稿自 凹非寺量子位 | 公众号 QbitAI评估大模型对齐表现最高效的方式是?在生成式AI趋势里,让大模型回答和人类价值(意图)一致非常重要,也就...
阅读原文

美国阿贡国家实验室发布快速自动扫描套件 FAST,助力显微技术「快速阅读」成为可能

By 超神经「我高兴地在北京市的天安门广场上看红色的国旗升起」快速阅读一下这个句子,大家可能会发现,只需「我在天安门广场看升旗」几个字,就能概述我们需...
阅读原文

再见了,提示~ 谷歌发布自适应提示方法,从此告别提示工程!

夕小瑶科技说 原创作者 | 谢年年、ZenMoore大模型虽好,但却存在着一个恼人的问题:大模型回答得好不好,取决于我们问题问得怎么样。一个好的、详细的问题往...
阅读原文

从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型

新智元报道编辑:好困【新智元导读】最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!...
阅读原文

评论能力强于GPT-4,上交开源13B评估大模型Auto-J

机器之心专栏机器之心编辑部随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关...
阅读原文

让大模型真正学会1+1=2!谷歌教会模型自动学习推理规则,大模型的幻觉有救了

夕小瑶科技说 原创作者 | 谢年年在初学算术加法或乘法时,我们通过数小棍的方式逐步从1+1=2,1+2=3等例子中得出1+3=4,这是一种依赖记忆中的数学表格进行演绎...
阅读原文

清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?

机器之心专栏机器之心编辑部GPT-4 近日开放了视觉模态(GPT-4V)。以 GPT-4V、谷歌 Bard 为代表的多模态大语言模型 (Multimodal Large Language Models, MLLM...
阅读原文

7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023

新智元报道编辑:LRS【新智元导读】LLM不实用,小模型蒸馏才是「现实」的大模型应用路线,全面领先微调技术!土豪请无视。。。大型语言模型虽然性能优异,可...
阅读原文

ICCV 2023 Oral | 如何在开放世界进行测试段训练?基于动态原型扩展的自训练方法

机器之心报道机器之心编辑部本文首次提出一种针对开放世界的测试段训练方法。提高模型泛化能力是推动基于视觉的感知方法落地的重要基础,测试段训练和适应(T...
阅读原文

几行代码,几秒钟就能生成令人惊叹的音频样本!HuggingFace推出音频生成Pipeline

夕小瑶科技说 原创编辑 | 谢年年音频是我们日常生活中不可或缺的一部分,而如今,AI+音频带来了前所未有的体验。通过AI技术,只需简单地输入一些文本提示就可...
阅读原文

GPT-4:我写的代码你敢用吗?研究表明其API误用率超过62%

机器之心报道编辑:Panda W现在,已经有不少软件开发者在开发软件时让大型语言模型当助手了,但最新的一项研究发出了警示:使用 LLM 反馈的代码时一定要慎重...
阅读原文

复旦大学团队发布中文医疗健康个人助手,同时开源47万高质量数据集

机器之心发布机器之心编辑部随着远程医疗的兴起,在线问诊、咨询越发成为患者寻求便捷高效的医疗支持的首选项。近来大语言模型(LLM)展示出强大的自然语言交...
阅读原文
1567