标签:研究者
AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征
一直以来 AI 都是一个黑盒子(black box),其内部运作机制是不可见的。人们输入数据并得到结果,但无法检查输出结果的逻辑或者系统的代码。 而就在刚刚,Ant...
用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域
机器之心报道 编辑:杜伟第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!对于想要获取两张图像之间的细粒度视觉对应关系而言,局部图像特征匹配...
从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐
机器之心报道 编辑:小舟、陈萍在 AI 领域,扩展定律(Scaling laws)是理解 LM 扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的...
从Claude 3中提取数百万特征,首次详细理解大模型的「思维」
机器之心报道 编辑:陈萍、小舟刚刚,Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。Anthropic 已经确定了如何在 Claude Sonnet 中表征数...
一键“搬空”你未来的新家,AI让买房装修变简单了?
大数据文摘授权转载自夕小瑶科技说作者:Richard 大家肯定都幻想过,要是能按自己的想法随心所欲布置新家该多好啊。租房或买房时看中一处房子,如果能在看房...
AI一键"搬空"你未来的新家,买房装修变得简单了?
夕小瑶科技说 原创作者 | Richard大家肯定都幻想过,要是能按自己的想法随心所欲布置新家该多好啊。租房或买房时看中一处房子,如果能在看房前先把家具'搬空'...
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
新智元报道编辑:桃子庸庸 【新智元导读】GPT-4通过图灵测试了!UCSD研究团队通过实证研究,人类无法将GPT-4与人类进行区分。而且,有54%的情况下,它被判定...
清华团队研发脑启发AI模型,为感知信息处理提供全新范例
来源:脑机接口社区 运营/排版:何晨龙 人类天生具有分离各种音频信号的能力,比如区分不同的说话者的声音、或将声音与背景噪音区分开来。这种天生的能力被称...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
机器之心报道 编辑:杜伟、大盘鸡基于 Diffusion Transformer(DiT)又迎来一大力作「Flag-DiT」,这次要将图像、视频、音频和 3D「一网打尽」。今年 2 月初...
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
机器之心报道 机器之心编辑部Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。众所周知,大语言模型的训练常常需要数月的时间,...
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
新智元报道编辑:Aeneas 好困 【新智元导读】刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物...
最详细人脑3D地图登Science!GPT-4参数只相当于人类0.2%
克雷西 发自 凹非寺量子位 | 公众号 QbitAI芝麻粒大小的人脑组织,突触规模就相当于一个GPT-4! 谷歌与哈佛联手,对局部人脑进行了纳米级建模,论文已登Scien...
原作者带队,LSTM真杀回来了!
机器之心报道 编辑:蛋酱LSTM:这次重生,我要夺回 Transformer 拿走的一切。20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思...
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
机器之心报道 编辑:佳琪、蛋酱当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。提高大型语言模型的...
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...