标签:动作
CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作
机器之心专栏 机器之心编辑部AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节,可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。 ...
今日arXiv最热NLP大模型论文:微软重磅:AgentAI,下一代人工智能的关键
夕小瑶科技说 原创作者 | Tscom 引言:AI的全面智能之路人工智能的发展已从简单算法进化到复杂的大型基础模型,尤其在理解开放世界环境中的感官信息方面取得...
升级!Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作
夕小瑶科技说 原创作者 | 付奶茶Sora为我们展开了一个充满惊喜的新篇章,同时,Viggle这一模型也吸引了公众的目光,并在推特上迅速走红! 想象一个场景,你仅...
长时舞蹈生成:数秒钟可生成极长的3D舞蹈
大数据文摘受权转载自将门创投 针对目前音乐生成3D舞蹈动作中存在的长序列生成动作质量差,生成效率低的问题,本文提出了Lodge,可以高效地根据输入音乐生成...
谷歌发布“Vlogger”模型:单张图片生成10秒视频
丰色 发自 凹非寺量子位 | 公众号 QbitAI谷歌发布了一个新的视频框架: 只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。视频时长可...
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
机器之心报道 编辑:杜伟、陈萍去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比...
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
3 月 13 日,Figure 发布了和 OpenAI 合作后的首个机器人 Figure 01 的演示:视频中,Figure 的人形机器人,可以完全与人类流畅对话,理解人类的意图,同时还...
开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技
新智元报道编辑:编辑部 【新智元导读】「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能...
OpenAI机器人活了!说话做事太像人,2分半视频震撼世界
OpenAI机器人来了,说话竟然会“结巴”,AI负责人深度拆解背后技术。 作者|云鹏 编辑|李水青 OpenAI大模型加持,Figure机器人再次颠覆了我们的想象! ▲测试员说...
OpenAI大模型上身机器人,原速演示炸场!
编辑部 发自 凹非寺量子位 | 公众号 QbitAIOpenAI大模型加持的机器人,深夜来袭! 名曰Figure 01,它能听会说,动作灵活。 能和人类描述眼前看到的一切: 我...
用Vision Pro实时训练机器狗!MIT博士生开源项目火了
鱼羊 发自 凹非寺量子位 | 公众号 QbitAIVision Pro又现火爆新玩法,这回还和具身智能联动了~ 就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对...
马斯克人形机器人2年4迭代的秘密找到了
大数据文摘授权转载自机器人大讲堂 作者:Jack 2024年,机器人已经朝着更像人迈出了一大步,斯坦福大学团队与谷歌DeepMind团队合作研发的能炒菜、能做家务的...
今日arXiv最热大模型论文:北京大学发布,将试错引入大模型代理学习!
夕小瑶科技说 原创编辑 | 松果引言:探索语言智能的新边界在人工智能的发展历程中,语言智能始终是一个核心的研究领域。随着大语言模型(LLM)的兴起,我们对...
外媒实测Sora,10秒视频大翻车!阿里AI新作让“高启强变罗翔”
大数据文摘受权转载自头部科技 文丨Congerry Sora 离正式开放应该还有一段时间,但是外媒已经提前体验上了! 近日,彭博社记者 Rachel Metz 亲自体验了还在开...
大一统视频编辑框架:浙大&微软推出UniEdit,无须训练、支持多种编辑场景
机器之心专栏 机器之心编辑部随着 Sora 的爆火,人们看到了 AI 视频生成的巨大潜力,对这一领域的关注度也越来越高。 除了视频生成,在现实生活中,如何对视...