标签:模型

大模型的致命缺陷:从GPT到Llama,全都中枪,回答正确率惨不忍睹

夕小瑶科技说 分享来源 | 机器之心大模型的逻辑?不存在的。我让 GPT-3 和 Llama 学会一个简单的知识:A 就是 B,然后反过来问 B 是什么,结果发现 AI 回答的...
阅读原文

CMU+清华开源Prompt2Model框架,性能超越GPT-3.5,仅需1/700的参数量

夕小瑶科技说 分享来源 | 新智元基于大型语言模型(LLM),开发者或用户可以通过描述任务,并给出几个样例来构造自然语言提示,很轻松地就能实现指定的功能。...
阅读原文

K2乔戈里,上交大团队推出一个70亿参数的地球科学大语言模型

机器之心专栏机器之心编辑部说到世界上最高的山峰大家都能想到是珠穆朗玛峰,但是世界上的第二高峰就鲜有人知 ——乔戈里峰(又称 K2,仅以 200 多米之差屈居第...
阅读原文

千元预算半天训练,效果媲美主流大模型,开源可商用中文LLaMA-2

机器之心发布机器之心编辑部LLaMA-2 相较于 LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步激发了开源社区的繁荣,拓展了...
阅读原文

生成式AI时代的模型压缩与加速,韩松主讲MIT课程,资料全公开

机器之心报道编辑:蛋酱近年来,生成式大模型(如大语言模型、扩散模型)已显示出卓越的性能,但它们需要大量的计算资源。为了让这些模型更易于使用,提高它...
阅读原文

6.7k Star量的vLLM出论文了,让每个人都能轻松快速低成本地部署LLM服务

机器之心专栏编辑:Panda利用操作系统的虚拟内存管理方法来提升LLM推理吞吐量。今年六月,来自加州大学伯克利分校等机构的一个研究团队开源了(目前已有 6700...
阅读原文

无惧图像中的文字,TextDiffuser提供更高质量文本渲染

机器之心专栏机器之心编辑部近几年来,Text-to-Image 领域取得了巨大的进展,特别是在 AIGC(Artificial Intelligence Generated Content)的时代。随着 DALL...
阅读原文

AI Agent 如何实现?6张4090 魔改Llama2:一句指令拆分任务、调用函数

机器之心 SOTA!模型社区专栏作者:星野源专栏编辑:之乎、 雅芳、小土同学本专栏由机器之心 SOTA!模型社区出品,每周日于机器之心公众号持续更新。本周我们...
阅读原文

进能形式逻辑,退能四则运算,MAmmoT让LLM成为数学通才

机器之心报道编辑:Panda一个新数据集外加思维链和思维程序两种方法之长,竟能让开源 LLM 的数学推理追上 GPT-4 等闭源大模型。数学推理是现代大型语言模型(...
阅读原文

预测编码和主动推理的大脑结构的演变

来源:CreateAMindThe evolution of brain architectures for predictive coding and active inference抽象的一、简介2. 预测调节和控制是大脑的基本设计原理...
阅读原文

麦肯锡:中国生成式AI市场现状和未来发展趋势

来源:麦肯锡没有好问题,就没有好答案:为什么生成式AI全球增速都这么快?为什么中国的增速远高于全球?中国的短板有哪些?能补上吗?——————与传统AI相比,...
阅读原文

OpenAI、Google和Meta 的当红华人研究员们在想些什么|对话实录

座无虚席,过道里也站满了人。甚至你会以为这是一场明星见面会。但这其实是一场在硅谷进行的GenAI大会的其中一个圆桌。它被安排在“副舞台”,时间在人们最昏昏...
阅读原文

AI算力70年增长6.8亿倍,3个历史阶段见证AI技术指数级爆发

新智元报道编辑:润【新智元导读】一张图揭示了AI算力70多年发展了6.7亿倍,未来AI各方面能力将全面超越人类,而真正令人期待的是,AI行业才刚刚进入爆发前的...
阅读原文

参数量仅为1/700,性能超越GPT-3.5!CMU+清华开源Prompt2Model框架

新智元报道编辑:LRS【新智元导读】只需要给出任务描述,Prompt2Model直接帮你训出个模型,性能还比LLM更好!基于大型语言模型(LLM),开发者或用户可以通过...
阅读原文

DALL·E 3必应开测!马骑宇航员难题攻破,一张画指定50个物体,微软前所未有深度参与研究

梦晨 发自 凹非寺量子位 | 公众号 QbitAIDALL·E 3限量测试,已由微软Bing抢先开启,看看你是欧皇之一吗?△来自WindowsLatest没收到资格也没关系,再加上第三...
阅读原文