标签:能力

Meta发布自我奖励机制,Llama在3轮训练后超越GPT-4

夕小瑶科技说 原创编辑 | 付奶茶 引言:大型语言模型的高效部署挑战在人工智能的发展中,训练大语言模型理解、执行人类发出的指令始终是核心任务。然而,传统...
阅读原文

谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了

新智元报道编辑:润 好困 【新智元导读】谷歌Bard又行了?在第三方LLM「排位赛」排行榜上,Bard击败GPT-4成为第二名。Jeff Dean兴奋宣布:谷歌回来了!一夜之...
阅读原文

LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处

新智元报道编辑:LRS 【新智元导读】如果语言模型是巫师,代码预训练就是魔杖!大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含...
阅读原文

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

机器之心专栏 机器之心编辑部近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和...
阅读原文

上海AI实验室开源科学大模型,理科能力全线提升,免费商用

允中 发自 凹非寺量子位 | 公众号 QbitAI最新科学大模型浦科化学(ChemLLM),发布即开源! 这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模...
阅读原文

中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出

新智元报道编辑:编辑部 【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费...
阅读原文

NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜

新智元报道编辑:Mindy 【新智元导读】美国著名科技播客Latent Space对于刚刚过去的NeurIPS 2023上的精彩论文进行了一个全面的总结,回顾了多篇优秀论文,虽...
阅读原文

多模态大模型,阿里通义千问能和GPT-4V掰手腕了

机器之心报道 编辑:泽南、蛋酱通义千问的图像推理能力,最近有了大幅提升。 2024 年,大模型领域要卷什么? 如果没有思路的话,不妨看看各家大厂都在押注什...
阅读原文

阿禅:如何使用ChatGPT开发产品,并且登上GitHub全球热榜?

作为知名的中文博客和公众号作者,阿禅也是一名知名的产品经理,而且算是移动互联网时期黄金时代产品经理的代表,在这篇文章里他分享了,在 ChatGPT 到来之后...
阅读原文

Dify 发布 AI Agent 能力:基于不同 LLM 构建 GPTs 和 Assistants

开源 LLMOps 平台 Dify 宣布推出基于自身平台的 AI Agent 及 GPTs,用户可以选择不同的大模型基座搭建自己的 GPTs 及 AI Agent。 以下内容转自 Dify 官方通告...
阅读原文

扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力

明敏 发自 凹非寺量子位 | 公众号 QbitAIPika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面...
阅读原文

从 Altman 对 GPT-5 的剧透中,我们应该如何迎接 AGI 的下一阶段?

前几天的 2024 达沃斯世界经济论坛上,Sam Altman 谈到了 GPT 发展的一些新的方向及可能性,对于当下大模型的一些现状的分析。 公众号「信息平权」对 Altman ...
阅读原文

我们用3000多道测试题,帮你找到了最聪明的大模型 | 文末附下载

作者 | InfoQ 研究中心 截至 2023 年底,国产大模型数量近 200 个,通用大模型、行业大模型和行业大模型应用百花齐放。在经历了激烈的市场竞争后,行业焦点逐...
阅读原文

LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

新智元报道编辑:LRS 【新智元导读】亚利桑那州立大学教授揭秘代码生成质量高的原因:语言模型是一个近似检索器,GitHub代码质量高,而文本数据中价值观冲突...
阅读原文

从GPT-5是什么说起

达沃斯上Sam Altman参加了4-5场访谈(我竟然全部听完了...),大家低估了其中的信息量,可能远比小扎说的60万张卡更重要。摘出了Sam对GPT-5的评论,其实拼图...
阅读原文
1262728293048