标签:任务

Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑

机器之心报道 编辑:Panda、大盘鸡视频生成领域真是越来越卷且越来越迈向实用性! 在 OpenAI Sora 难产的时候,Meta 首次公开展示了自家的「用于媒体的突破性...
阅读原文

OpenAI发布新交互界面Canvas: 与ChatGPT一起写作编程,对标Claude Artifacts

时隔两年,ChatGPT终迎来界面全新升级!这一次,OpenAI官宣推出canvas。它不再是简单的对话框,而是能与ChatGPT「并肩作战」的全新界面。 不论是写作,还是编...
阅读原文

OpenAI canvas一夜封神!超强AI编码研究神器,ChatGPT再次颠覆人机交互

新智元报道编辑:桃子 乔杨 【新智元导读】ChatGPT横空出世以来,首次迎来界面史诗级升级!全新canvas界面,开启了人类与AI协作研究、编码的新时代,更代表着...
阅读原文

o1医学领域大胜GPT-4,性能暴涨!顶尖华人团队激动发文:离AI医生越来越近了

新智元报道编辑:LRS 【新智元导读】OpenAI的o1模型在通用语言任务上展现了显著的性能,最新测评展现了o1模型在医学领域的表现,主要关注理解、推理和多语言...
阅读原文

Windows 竞技场:面向下一代AI Agent的测试集

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

00后国人论文登Nature,大模型对人类可靠性降低

一水 发自 凹非寺量子位 | 公众号 QbitAI00后国人一作登上Nature,这篇大模型论文引起热议。 简单来说,论文发现:更大且更遵循指令的大模型也变得更不可靠了...
阅读原文

灵巧的机器人,DeepMind推出两个基于AI的机器手系统和未知场景「生成式AI」应对策略

来源:ScienceAI 编辑:萝卜皮 人们每天都会执行许多任务,例如系鞋带或拧紧螺丝。但对于机器人来说,学习这些高度灵巧的任务非常困难。为了让机器人在人们的...
阅读原文

Ilya预言错了!华人Nature一作给RLHF「判」,全球大模型都不可靠

新智元报道编辑:编辑部 HXY 【新智元导读】Ilya两年前观点,竟被Nature论文反驳了!来自剑桥大学等团队最新研究发现,所有大模型并不可靠,包括最强o1。2022...
阅读原文

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

选自sebastianraschka 机器之心编译 机器之心编辑部学起来吧!近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,...
阅读原文

利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA

优图实验室 投稿量子位 | 公众号 QbitAI告别传统指令微调,大模型特定任务性能提升有新方法了。 一种新型开源增强知识框架,可以从公开数据中自动提取相关知...
阅读原文

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

人工智能(AI)模型的参数规模越大,生成的答案就越准确?就更加可信? 还真不一定! 日前,一项发表在权威科学期刊 Nature 上的研究表明:相比于小参数模型...
阅读原文

AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率

新智元报道编辑:LRS 【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的...
阅读原文

当大模型Scaling Law继续,万卡集群算力释放在「百舸」这里找到一条通途

机器之心原创 作者:杜伟在电影《天下无贼》中,葛优扮演的黎叔有这样一句经典的台词,「二十一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,...
阅读原文

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

o1 之后是什么?OpenAI 开启 L3 阶段研发,多智能体将成为新的战场!

点击上方蓝字关注我们“OpenAI 正在组建一支全新的多智能体系统研发团队,力图推动 AI 领域的下一次重大突破。Google DeepMind 和 Nvidia 也瞄准这一技术,预...
阅读原文
15678948