标签:任务
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
2024KDD挑战任务,GPT-4仅得40分,Meta发布最新RAG评价基准
夕小瑶科技说 原创作者 | Axe_越众所周知,“要想富,先修路”,经常挖路的同学应该知道,要想修好一条路,首先就必须搞清楚关于道路质量的统一验收标准,否则...
ACL2024:浙江大学提出大小模型协同的跨文档理解,低成本高表现
夕小瑶科技说 原创作者 | Richard 自大模型出现以来,其在自然语言处理领域取得了令人瞩目的进展。然而如何有效地将大模型应用于具体的任务中,仍面临诸多挑...
王兴兴、王鹤、卢宗青、邵林、高阳等专家共论具身前沿
大数据文摘受权转载自智源社区 从Figure01和人类交流自如、特斯拉Optimus叠衬衫,以及宇树G1惊艳发布,再到公众对人形机器人的争相追逐可以看出,具身智能是2...
拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」
新智元报道编辑:乔杨 好困 【新智元导读】DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GN...
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
机器之心报道 机器之心编辑部如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两...
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
万字长文!AI Agent架构概况:关于推理、规划和工具调用
直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusi...
大模型理解复杂表格,字节&中科大出手了
允中 发自 凹非寺量子位 | 公众号 QbitAI只要一个大模型,就能解决打工人遇到的表格难题! 字节联手中科大推出了一款统一表格理解大模型,可以以用户友好的方...
2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源
蔡泽凡 投稿量子位 | 公众号 QbitAI用KV缓存加速大模型的显存瓶颈,终于迎来突破。 北大、威斯康辛-麦迪逊、微软等联合团队提出了全新的缓存分配方案,只用2....
一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩
Mobile-Agent团队 投稿量子位 | 公众号 QbitAI一句话让AI自动化操作手机,打个车已经不是难事了。 从官方公布的演示视频来看,用户只需要说出目的地,Agent就...
打通智能体「自我进化」全流程!复旦推出通用智能体平台AgentGym
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%,所有模型最易犯感知错误
王家豪 投稿自 凹非寺量子位 | 公众号 QbitAIGPT-4o再次掀起多模态大模型的浪潮。 如果他们能以近似人类的熟练程度,在不同领域执行广泛的任务,这对许多领域...
预测准确率达95.7%,ChatMOF利用LLM预测和生成金属有机框架
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑|X 金属有机框架(MOF)因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而...