标签:轨迹
3倍生成速度还降内存成本,超越Medusa2的高效解码框架终于来了
机器之心报道 编辑:亚鹂高效解码n -token序列,CLLMs+Jacobi解码框架。 传统上,大型语言模型(LLMs)被认为是顺序解码器,逐个解码每个token。 来自...
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了
机器之心发布 机器之心编辑部最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管...
AI重建粒子轨迹,发现新物理学
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑| 绿萝 电子学在核物理领域从来都不是一帆风顺的。大型强子对撞机作为全球最强大的加速器...
AI 重建粒子轨迹,发现新物理学
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑| 绿萝 电子学在核物理领域从来都不是一帆风顺的。大型强子对撞机作为全球最强大的加速器...
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
LLMLight团队 投稿量子位 | 公众号 QbitAI大模型“上路”,干起了交通信号控制(TSC)的活~ 模型名为LightGPT,以排队及不同区段快要接近信号灯的车辆对路口交...
伯克利团队发布最新论文!用训练GPT的方法训练人形机器人|甲子光年
Scaling law“统一”人形机器人?作者|刘杨楠 编辑|赵健 一台人形机器人在人行道、混凝土、沥青、广场和沙路上“散步”,这不是科幻电影的场景,而是已经发生在...
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接
机器之心专栏 机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-b...
GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大
于恩 投稿量子位 | 公众号 QbitAI多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当...
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
丰色 发自 凹非寺量子位 | 公众号 QbitAI后期狂喜了家人们~现在,只需一张图片就能替换视频主角,效果还是如此的丝滑!且看这个叫做“VideoSwap”的新视频编辑...
谷歌:LLM找不到推理错误,但能纠正它
机器之心报道编辑:PandaLLM 找不到推理错误,但却能纠正错误!今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得...
清华微软「LLM+推理智能体」超越GPT-4!攻克数理难题,斩获开源界MATH最佳成绩
新智元报道编辑:润【新智元导读】由清华大学和微软研究院共同的提出的TORA,结合了LLM的分布推理能力和外部程序的解决问题能力,将开源大模型的推理和数理能...
让Llama2 直逼 GPT-4!清华最新研究,大幅提升大模型的通用智能体能力!
大数据文摘受权转载自夕小瑶科技说作者 | 智商掉了一地、ZenMoore智能体 (agent) 是一种能够感知环境、做出决策并采取行动的实体。传统的智能体在专业领域表...
大幅提升大模型的通用智能体能力!清华最新研究,让Llama2直逼GPT-4?
夕小瑶科技说 原创作者 | 智商掉了一地、ZenMoore智能体 (agent) 是一种能够感知环境、做出决策并采取行动的实体。传统的智能体在专业领域表现出色,但在适应...
带你穿越清明上河图!DragNUWA惊艳亮相:一拖一拽让静图秒变视频
新智元报道编辑:Lumina【新智元导读】微软提出文本图像轨迹条件视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运动及场景控制。微软开发的视...
12