标签:任务
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
新智元报道编辑:桃子 【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘...
今日arXiv最热大模型论文:北京大学发布,将试错引入大模型代理学习!
夕小瑶科技说 原创编辑 | 松果引言:探索语言智能的新边界在人工智能的发展历程中,语言智能始终是一个核心的研究领域。随着大语言模型(LLM)的兴起,我们对...
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
新智元报道编辑:LRS 好困 【新智元导读】研究人员证实了Visual Graph在图推理中的作用,以及其可以和文本模态相互增强。图神经网络(GNNs)擅长利用图的结构...
2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
丰色 发自 凹非寺量子位 | 公众号 QbitAI只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: 这个名为DUSt3R的新工具,火得一塌糊涂,才上...
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
机器之心报道 机器之心编辑部最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物...
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
新智元报道编辑:润 好困 【新智元导读】谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问...
北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂
北大前沿计算研究中心 投稿 投稿量子位 | 公众号 QbitAI只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗? 北大最新具身大模型研究成果Ma...
今日arXiv最热大模型论文:谷歌最新研究,将LLM用于回归分析任务,显著超越传统模型
夕小瑶科技说 原创编辑 | 松果 引言:探索语言模型在回归分析中的应用回归分析是一个强大的工具,能够准确预测系统或模型的结果指标,给定一组参数。然而,传...
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
新智元报道编辑:桃子 【新智元导读】许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟...
数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好
机器之心专栏 机器之心编辑部来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的...
AI x 机器人爆发年!英伟达Jim Fan领衔登月任务,谷歌DeepMind新技术曝光
新智元报道编辑:alan 【新智元导读】AI x 机器人正逐渐走上时代的风口,近日,谷歌DeepMind以及英伟达两家AI大厂都在机器人领域有所动作。AI x 机器人必然是...
大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘
机器之心报道 编辑:蛋酱、张倩大模型的成功很大程度上要归因于 Scaling Law 的存在,这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系...
Deepmind最新研究:一个技巧,思维链不再需要提示词激发了!
夕小瑶科技说 原创作者 | 松果、Python引言:探索无需特定提示的LLM推理能力在人工智能领域,大语言模型(LLMs)已经在各种复杂的推理基准测试中展现出了令人...
补齐Transformer规划短板,田渊栋团队的Searchformer火了
机器之心报道 编辑:PandaTransformer 强大的泛化能力再次得到证明!最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类...
今日arXiv最热NLP大模型论文:无需提示也能推理!Google DeepMind新研究揭示AI内在推理能力
夕小瑶科技说 原创作者 | 松果、Python引言:探索无需特定提示的LLM推理能力在人工智能领域,大语言模型(LLMs)已经在各种复杂的推理基准测试中展现出了令人...