标签:能力

百川发布超千亿大模型 Baichuan 3:多项中文任务评测超 GPT-4、中文医疗任务最佳大模型

1 月 29 日,百川智能发布超千亿参数的大模型 Baichuan 3,除了在多个通用能力测试中表现出色,尤其是中文任务超越 GPT-4 以外,这次 Baichuan 3 在专业性要...
阅读原文

百川智能上新超千亿大模型Baichuan 3,冲榜成绩:若干中文任务超车GPT-4

衡宇 发自 凹非寺量子位 | 公众号 QbitAI走月更路线的百川智能,在年前猛地加速,变成了半月更: 发布了超千亿参数的最新版本大模型Baichuan 3,是百川智能基...
阅读原文

详解面向大模型的检索增强生成(RAG)

RAG最近有一篇广受关注的综述,最近是花了不少时间给啃了个大概,里面提及的挺多文章其实都挺精彩的,甚至是让人兴奋的。我先把链接放上。 论文:Retrieval-A...
阅读原文

Meta发布自我奖励机制,Llama在3轮训练后超越GPT-4

夕小瑶科技说 原创编辑 | 付奶茶 引言:大型语言模型的高效部署挑战在人工智能的发展中,训练大语言模型理解、执行人类发出的指令始终是核心任务。然而,传统...
阅读原文

谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了

新智元报道编辑:润 好困 【新智元导读】谷歌Bard又行了?在第三方LLM「排位赛」排行榜上,Bard击败GPT-4成为第二名。Jeff Dean兴奋宣布:谷歌回来了!一夜之...
阅读原文

LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处

新智元报道编辑:LRS 【新智元导读】如果语言模型是巫师,代码预训练就是魔杖!大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含...
阅读原文

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

机器之心专栏 机器之心编辑部近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和...
阅读原文

上海AI实验室开源科学大模型,理科能力全线提升,免费商用

允中 发自 凹非寺量子位 | 公众号 QbitAI最新科学大模型浦科化学(ChemLLM),发布即开源! 这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模...
阅读原文

中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出

新智元报道编辑:编辑部 【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费...
阅读原文

NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜

新智元报道编辑:Mindy 【新智元导读】美国著名科技播客Latent Space对于刚刚过去的NeurIPS 2023上的精彩论文进行了一个全面的总结,回顾了多篇优秀论文,虽...
阅读原文

多模态大模型,阿里通义千问能和GPT-4V掰手腕了

机器之心报道 编辑:泽南、蛋酱通义千问的图像推理能力,最近有了大幅提升。 2024 年,大模型领域要卷什么? 如果没有思路的话,不妨看看各家大厂都在押注什...
阅读原文

阿禅:如何使用ChatGPT开发产品,并且登上GitHub全球热榜?

作为知名的中文博客和公众号作者,阿禅也是一名知名的产品经理,而且算是移动互联网时期黄金时代产品经理的代表,在这篇文章里他分享了,在 ChatGPT 到来之后...
阅读原文

Dify 发布 AI Agent 能力:基于不同 LLM 构建 GPTs 和 Assistants

开源 LLMOps 平台 Dify 宣布推出基于自身平台的 AI Agent 及 GPTs,用户可以选择不同的大模型基座搭建自己的 GPTs 及 AI Agent。 以下内容转自 Dify 官方通告...
阅读原文

扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力

明敏 发自 凹非寺量子位 | 公众号 QbitAIPika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面...
阅读原文

从 Altman 对 GPT-5 的剧透中,我们应该如何迎接 AGI 的下一阶段?

前几天的 2024 达沃斯世界经济论坛上,Sam Altman 谈到了 GPT 发展的一些新的方向及可能性,对于当下大模型的一些现状的分析。 公众号「信息平权」对 Altman ...
阅读原文
1333435363755