标签:任务
导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
机器之心发布 机器之心编辑部大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的...
强化学习训练一两个小时,100%自主完成任务:机器人ChatGPT时刻真来了?
机器之心报道 编辑:Panda、佳琪把平均成功率从 50% 拉到了 100%。最近,AI 的进步有目共睹,现在这些进步已经开始传递到机器人领域。强大的 AI 技术也能帮助...
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代
新智元报道编辑:编辑部 HYZ 【新智元导读】LLM统一了语言生成任务,图像生成可以吗?就在刚刚,智源推出了全新扩散模型架构OmniGen,单个模型就能生成图像,...
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
新智元报道编辑:LRST 【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分...
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
新智元报道编辑:LRST 【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、...
多模态大模型: 盘点&Highlights part1——从BLIP到LLaVA
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读Hi大家好,我叫延捷,...
通用人工智能大型社会模拟器发布,朱松纯:判断AGI的关键在于两大“完备性”
作者 | 华卫 近日,由北京大学武汉人工智能研究院与武汉东湖高新区国家智能社会治理实验综合基地共同打造的“大型社会模拟器 1.0”正式发布。 据介绍,大型社...
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
新智元报道编辑:桃子 【新智元导读】AI评估AI可靠吗?来自Meta、KAUST团队的最新研究中,提出了Agent-as-a-Judge框架,证实了智能体系统能够以类人的方式评...
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
新智元报道编辑:桃子 LRS 【新智元导读】科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis...
UCL博士生创业一年,造出最强AI「ML工程师」,OpenAI盖戳认证
机器之心原创 作者:微胖重要的事说三遍:Agent 框架很重要。一、被忽略的「Agent 框架」 OpenAI 最近又有了新动作,这次他们的野心更大了。 鉴于大型语言模...
Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
新智元报道编辑:桃子 好困 【新智元导读】AI接管人类电脑,未来已来!Claude自主操控电脑,从编程到科研无所不能,代表着万能API。另一边,OpenAI内部加急研...
RNN回归!Bengio新作大道至简与Transformer一较高下
新智元报道编辑:alan 【新智元导读】近日,深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。在T...
最大开源机器人数据集!DeepMind联手21家机构,整合60个数据集,发布Open X-Embodiment,具身智能时代来临
作者:十九 编辑:李宝珠 谷歌 DeepMind 联手斯坦福大学、上海交通大学、英伟达、纽约大学、哥伦比亚大学等 21 家国际知名机构,整合 60 个现有的机器人数据...