标签:研究者

年龄两岁,教龄一年半:婴儿AI训练师登上Science

机器之心报道 编辑:娄佳琪、张倩只用 61 个小时的数据:人们终于证明了,利用当代 AI 工具,实现「真正的语言学习」是可行的。 在公开采访中,图灵奖得主 Ya...
阅读原文

万字长文,大语言模型如何宣告心理学的死亡?| 追问观察

▷本文为追问特约长文,信息密度高,阅读需40min。建议收藏或转发朋友圈,分多次阅读,愿有所收获。本文已开快捷转载,如需另外开白,还请留言。本文标题为编...
阅读原文

OpenAI新模型用的嵌入技术被网友扒出来了

机器之心报道 编辑:蛋酱学起来吧。前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。 我们知道,嵌入是表示自...
阅读原文

CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门

新智元报道编辑:Aeneas 桃子 【新智元导读】斯坦福炒菜机器人的大火,开启了2024年机器人元年。最近,CMU研究团队推出了一款能在开放世界完成任务的机器人,...
阅读原文

重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型

机器之心专栏 机器之心编辑部AI 生成 3D 模型最难的一关,终于被搞定了。无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」:或是「一只...
阅读原文

审稿 CVPR 有感:没落的顶会、空虚的文章和失败open review

夕小瑶科技说 分享来源 | 知乎@Minogame本文经授权转载自知乎作者 Minogame,以下是Minogame审稿CVPR后的自述。 事实上,我已经拒绝审稿很多年了。投稿/审稿...
阅读原文

「think step by step」还不够,让模型「think more steps」更有用

机器之心报道 机器之心编辑部本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的...
阅读原文

大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

机器之心报道 编辑:杜伟、小舟去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,...
阅读原文

无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用

机器之心专栏 机器之心编辑部随着人工智能技术的发展,以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时,大模型本身的安全...
阅读原文

英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大

机器之心报道 编辑:大盘鸡、杜伟昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越...
阅读原文

模型越大,性能越好?苹果自回归视觉模型AIM:没错

机器之心报道 编辑:蛋酱、杜伟视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。 过去几年,大规模预训练模型...
阅读原文

ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了

机器之心报道 编辑:杜伟你被拒了吗?ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。 在机器学习...
阅读原文

2024属于小模型时代?TinyLlama 等小模型爆火

直播预告 | 明晚(周三)7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
阅读原文

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

机器之心专栏 机器之心编辑部图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时...
阅读原文

Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光

机器之心报道 作者:陈萍、大盘鸡Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间,那个爆火整个开源社区的 Mixtral 8x7B MoE 模型...
阅读原文
167891013