标签:研究者
微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了
机器之心报道机器之心编辑部大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「...
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
机器之心报道编辑:杜伟、蛋酱有了上海交大和华为提出的 SAGA,辐射场中的交互式 3D 分割任务实现起来会更快、效果更好。今年 4 月,Meta 发布AI 模型,这项...
五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈
机器之心报道编辑:张倩、蛋酱屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的...
任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2
机器之心报道编辑:杜伟、大盘鸡研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。今年 5 月,北卡罗来纳大学教堂山分校、微软提出...
全网都在模仿的「科目三」,梅西、钢铁侠、二次元小姐姐马上拿下
机器之心报道机器之心编辑部来自阿里的研究团队提出了一种名为 Animate Anyone 的方法,只需一张人物照片,再配合骨骼动画引导,就能生成动画视频。最近一段...
微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源
机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远,而通过让大规模语言模型来「教」较小规模的语言模型进行推理,也会是事半功倍的效果。如你我所...
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
机器之心报道机器之心编辑部风险有点大。如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么?它会直接口吐训练数据出来,有时候还带点个人信息,...
SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快
机器之心报道机器之心编辑部使用一块 A100,出图的延迟只有 200 毫秒。本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一...
Transformer变革3D建模,MeshGPT生成效果惊动专业建模师,网友:革命性idea
机器之心报道机器之心编辑部连续「预测下一个 token」能生成句子,同理,连续「预测下一个三角形网格」也能生成 3D 模型。在计算机图形学中,「三角形网格」...
简化版Transformer来了,网友:年度论文
机器之心报道机器之心编辑部从大模型的根源开始优化。Transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 Transformer 架构的一种...
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
机器之心报道编辑:杜伟、佳琪3D 生成是 AI 视觉领域的研究热点之一。本文中,来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型...
比「让我们一步一步思考」这句咒语还管用,提示工程正在被改进
机器之心报道编辑:rome rome大语言模型可以通过元提示执行自动提示工程,但由于缺乏足够的指导以引导大语言模型中的复杂推理能力,它们的潜力可能没有完全发...
GPT-4不会图形推理?“放水”后准确率依然只有33%
克雷西 发自 凹非寺量子位 | 公众号 QbitAIGPT-4的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有3...
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
机器之心报道编辑:Panda、陈萍差不多已经掌握语言能力的大模型正在进军视觉领域,但具有里程碑意义的 GPT-4V 也仍有诸多不足之处,参阅《》。近日,微软 Azu...
全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%
机器之心报道编辑:大盘鸡本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,使 ChatGLM2 在 32k 上下文长度上的推理...