标签:任务
CMU权威对比Gemini,GPT-3和Mistral8×7B!GPT-3.5依旧拿捏Gemini,开源模型差距依然不小
新智元报道编辑:山令alan 【新智元导读】谷歌发布Gemini以后,一直宣称Gemini Pro要优于GPT-3.5,而CMU的研究人员通过自己实测,给大家来了一个客观中立第三...
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
新智元报道编辑:桃子 【新智元导读】激发大模型解决复杂问题的重要技术之一CoT,如今要被颠覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代码链」(CoC),...
清华特奖焦剑涛大模型创业:突破GPT-4工具使用能力,搞开源种子轮融资七千万
鱼羊 丰色 发自 凹非寺量子位 | 公众号 QbitAI开源模型终于开始超越GPT-4了。 两位清华校友打造,在GPT-4核心优势之一使用工具上实现超越。 连HuggingFace CE...
腾讯发布实体任务规划基准,GPT-4V也频频出错!迈向大模型与物理世界交互!
夕小瑶科技说 原创作者 | 智商掉了一地、Python多模态大型语言模型(MLLM)目前主要通过数字化的方式与信息世界进行交互,涉及自然语言处理、计算机视觉和多...
大模型竟然能玩手机了,还能用软件修图:「AppAgent」会成为2024年的新趋势吗?
机器之心专栏 机器之心编辑部这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。 简单来说,AppAgent 的智能代理能力可以用于操作...
化身反编译好手!微软用大语言模型直接解读二进制代码!
夕小瑶科技说 原创作者 | 付奶茶、Python奶茶听说LLMs可以直接处理二进制代码了?近期一项研究展示了大语言模型(LLMs)分析二进制代码并自动生成摘要的能力...
通往具身通用智能:如何让机器从自然模态中学习到世界模型?
目前的人工智能系统虽然强大,却常常缺乏人类和动物的常识和灵活推理能力。人工智能研究的最终目标,是让机器能够像人类一样思考、学习并解决各种任务,实现...
一文说尽「大模型推理」!12家高校机构联合发布150页报告,综述750篇论文
新智元报道编辑:LRS 好困 【新智元导读】全面综述近750篇「基础模型推理」论文,聚焦于各种推理任务、方法论和基准测试的最新进展,详细阐述大模型在各种推...
谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告
happy投稿量子位 | 公众号 QbitAI谷歌扳回一局! 在Gemini开放API不到一周的时间,港中文等机构就完成评测,联合发布了多达128页的报告,结果显示: 在37个视...
CMU评测:Gemini Pro相比GPT3.5,全线溃败!代码公开可复现
夕小瑶科技说 原创作者 | 谢年年、python前段时间谷歌DeepMind推出了号称是谷歌史上功能最强大、最通用的多模态模型Gemini 1.0! Gemini 1.0共有Gemini Ult...
谷歌Gemini技术报告出炉,作者多达900余人
机器之心报道 机器之心编辑部从此以后,Google Scholar 数据该出问题了。备受期待的谷歌 Gemini 技术报告完整版,今天终于出炉了。两周前,人们兴奋于谷歌提...
清华陈建宇:当人形机器人成为人类替身,是一场怎样的?
人形机器人是当前最炙手可热的方向之一。谈到人形机器人的最终局,清华交叉信息研究院助理教授、星动纪元创始人陈建宇说到,在未来人形机器人很可能成为人类...
Gemini Pro还不如GPT-3.5,CMU深入对比研究:保证公平透明可重复
梦晨 发自 凹非寺量子位 | 公众号 QbitAI谷歌Gemini实力到底如何?卡耐基梅隆大学来了场专业客观第三方比较。 为保证公平,所有模型使用相同的提示和生成参数...
OpenAI 官方 Prompt 工程指南:写好 Prompt 的六个策略
其实一直有很多人问我,Prompt 要怎么写效果才好,有没有模板。 我每次都会说,能清晰的表达你的想法,才是最重要的,各种技巧都是其次。但是,我还是希望发...
Nature:2024 年值得关注的科学,GPT-5、嫦娥六号、超级计算机等上榜
来源:学术头条 2023 年是一个不平凡之年。 在 2023 年即将结束之际,权威科学期刊Nature发布了2024 年值得关注的科学事件,包括令人期待的 GPT-5、被细菌感...