标签:方法
一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE
新智元报道编辑:LRS 好困【新智元导读】由厦门大学等机构提出的全新视觉感知基础模型APE,只需一个模型外加一套参数,就能在160个测试集上取得当前SOTA或极...
0微调搞定160个测试集!最强多模态分割一切大模型来了,架构参数全开源
Brady 投稿量子位 | 公众号 QbitAI用多模态大模型来做语义分割,效果有多好?一张图+文字输入想分割的物体,大模型几秒钟就能识别并搞定!只需输入想分割的对...
弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 |紫罗化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反...
一张照片,TikTok姐就都能跳舞了
机器之心报道编辑:杜伟、小舟动画视频生成这几天火了,这次 NUS、字节的新框架不仅效果自然流畅,还在视频保真度方面比其他方法强了一大截。前几日,阿里研...
NeurIPS 2023|北京大学提出类别级6D物姿估计新范式,取得新SOTA
机器之心专栏作者:张继耀类别级 6D 物体位姿估计是一个基础且重要的问题,在机器人、虚拟现实和增强现实等领域应用广泛。本文中,来自北京大学的研究者提出...
全网都在模仿的「科目三」,梅西、钢铁侠、二次元姐马上拿下
机器之心报道机器之心编辑部来自阿里的研究团队提出了一种名为 Animate Anyone 的方法,只需一张人物照片,再配合骨骼动画引导,就能生成动画视频。最近一段...
SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快
机器之心报道机器之心编辑部使用一块 A100,出图的延迟只有 200 毫秒。本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一...
UW+MIT最新研究:让机器人在不断变化的环境中学习新技能
大数据文摘授权转载自机器人大讲堂作者:李鑫为了在现实世界中最好地帮助人类,机器人应具备在动态且快速变化的环境中持续获取实用新技能的能力。然而,当前...
DeepMind最新研究:这个AI Agent,几分钟学会人类专家行为,登上Nature子刊
只需要几分钟,就可以成功模仿专家行为,并记住所有学过的知识,Google DeepMind 研发的 AI Agent,登上了 Nature 子刊。据介绍,在 3D 模拟中,该智能体能够...
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
一个北大投稿 发送至 凹非寺量子位 | 公众号 QbitAI训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了...
研究没思路的看过来,这是可信机器学习的1000个创新idea
机器之心专栏作者:UIUC 汪浩瀚I. 前言1. 先讲一个故事大概在 4-5 年前的时候,我还是卡内基梅隆大学(CMU)的 phd。身处在名校光环的照耀下,再加上顶级导师...
又一千亿级大模型问世,全面开源!
夕小瑶科技说 分享11月27日,浪潮信息发布“源2.0”基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理...
仅靠合成数据无法实现 AGI
点击上方蓝字关注我们“ OpenAI最新的模型Q*引发了关注,它能解决数学问题并展现出卓越的推理能力。然而,是否应该依赖合成数据引发了科技社区的讨论,有人认...
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
机器之心报道编辑:杜伟、佳琪3D 生成是 AI 视觉领域的研究热点之一。本文中,来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型...
谷歌:LLM找不到推理错误,但能纠正它
机器之心报道编辑:PandaLLM 找不到推理错误,但却能纠正错误!今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得...