标签:任务
上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译
夕小瑶科技说 原创作者 | Richard 在这个AI大爆发的时代,各种智能工具如雨后春笋般涌现,大语言模型的能力也在不断刷新我们的认知。随便拉出一个AI模型,似...
首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!
夕小瑶科技说 原创作者 | 潘奕琛、孔德涵、周思达、崔成 在当今科技迅速发展的时代,大型语言模型(Large Language Model,LLM)正以前所未有的速度改变着我...
VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格
新智元报道编辑:编辑部 【新智元导读】视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发...
大模型“玩”Excel更6了,微软搞的
金磊 发自 凹非寺量子位 | 公众号 QbitAI大模型理解、推理Excel,现在变得更加精准了。 这就是来自微软的一项最新研究——SPREADSHEETLLM,主打的就是让大模型...
还不如人类五岁小孩,难度为零的视觉测试,GPT-4o、Claude 3.5 Sonnet却挑战失败了
大数据文摘授权转载自学术头条 撰文:马雪薇 GPT-4o、Claude 3.5 Sonnet 等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一...
将慢思考蒸馏进快思考,Meta 把 Llama2 跃升至 GPT-4 水平
《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。 研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,让Llama2表现提升了257%,变得比GPT4还能打...
Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%
机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
新智元报道编辑:乔杨 【新智元导读】Mamba模型由于匹敌Transformer的巨大潜力,在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下,这两个架构...
MSRA:视觉生成六大技术问题
古纾旸 投稿量子位 | 公众号 QbitAI文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。 微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉...
AI Agent满级进化!骑马种田、办公修图,样样精通,昆仑万维等发布通用Agent新框架
新智元报道编辑:好困 【新智元导读】智能体又双叒叕进化了!这次,什么游戏都能玩,什么软件都能操控了。近日,昆仑万维携手北京智源人工智能研究院、新加坡...
AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题
克雷西 发自 凹非寺量子位 | 公众号 QbitAI《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。 研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,...
创业必看!AI Agent 开源和创业项目全盘点
AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。 近期美国风投 Madrona 合伙人 John Turow 发表了一篇行业洞...
Claude上新:一键生成、测试和评估prompt,让 prompt 写作零门槛!
文章转载自「机器之心」。 在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者深入了解应用需求,并具备大型...
赛尔笔记 | 具身大模型研究综述
原创作者:陈一帆,张宇驰,孙楚芮,冯怀绪,宋浩,王寄哲 指导老师:张伟男 转载须标注出处:哈工大SCIR 1. 引言1.1 机器人的智能——通用性和泛化性在上个世...
大语言模型的前世今生:万字长文完整梳理所有里程碑式大语言模型(LLMs)
点击下方卡片,关注“AI生成未来” >>后台回复“GAI”,免费获取AI行业报告和资料! 作者:APlayBoy编辑:AI生成未来 链接:https://zhuanlan.zhihu.com/p/...