标签:性能

数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好

机器之心专栏 机器之心编辑部来自腾讯的研究者们做了一个关于 agent 的scaling property(可拓展性)的工作。发现:通过简单的采样投票,大语言模型(LLM)的...
阅读原文

OMEN 暗影精灵 10 评测:游戏本中的六边形战士

变快了 也变强了以学生党和新职人为目标的笔记本电脑市场,每年都会迎来两波换机潮——9 月的开学季,和 2 月的返校季。 相较于介于 618 和双 11 之间的开学季...
阅读原文

英伟达新显卡发布!笔记本AI画图提速14倍,轻薄本也能当AI工作站

金磊 西风 发自 凹非寺量子位 | 公众号 QbitAI黄院士的新核弹,来了! 全新消费级显卡,专为提速笔记本大模型应用而生。 就在这两天的MWC上,英伟达重磅推出...
阅读原文

今日arXiv最热NLP大模型论文:做到头了!清华和哈工大把大模型量化做到了1比特

夕小瑶科技说 原创作者 | 谢年年在追求更高效的机器学习模型部署时,模型量化技术应运而生,它通过降低权重矩阵的位宽来显著减少大型语言模型的存储和计算需...
阅读原文

Scaling 能通往 AGI 吗?万字科普 Scaling Law 的业内争议与讨论

几乎所有关于 LLM 的讨论都无法跳开 scaling law,它被看作是 OpenAI 最核心的技术,Sora 的出现也被认为是 scaling law 的又一次成功。与此同时,关于 scali...
阅读原文

全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战

新智元报道编辑:编辑部 【新智元导读】谷歌发布全球最强开源大模型Gemma,7B性能超越Llama 2 13B!谷歌和OpenAI,已经卷出了新高度。这轮番放深夜炸弹的频率...
阅读原文

出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT

机器之心报道 编辑:杜伟好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续! 其中,Sora 研发负责人...
阅读原文

10倍英伟达GPU:大模型专用芯片一夜成名,来自谷歌TPU创业团队

机器之心报道 编辑:泽南、蛋酱能带来完全不同的大模型体验。我们知道,大模型到 GPT-3.5 这种千亿体量以后,训练和推理的算力就不是普通创业公司所能承担的...
阅读原文

三年16篇一作,前谷歌研究科学家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5

机器之心报道 编辑:陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。 如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名...
阅读原文

英伟达市值飙升1.8万亿美元,赶超谷歌、亚马逊!老黄:我才刚上路呢

新智元报道编辑:桃子 润 【新智元导读】当地时间周一,英伟达市值突破1.8万亿美元,赶超谷歌亚马逊。与此同时,新款GPU RTX 2000 Ada首发,性能比上一代暴涨...
阅读原文

今日arXiv最热NLP大模型论文:引入噪声,可提升RAG检索效果超30%??

夕小瑶科技说 原创编辑 | 谢年年检索增强生成(Retrieval-Augmented Generation,简称RAG)系统的出现,提高了LLMs回答生成的准确性。它分为两个部分:检索与...
阅读原文

2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源

机器之心报道 编辑:泽南千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和部署方面也取得了成果。 2 月 1 日,面壁智...
阅读原文

直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?

新智元报道编辑:Aeneas 【新智元导读】这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。此前,冲...
阅读原文

PyTorch 2.2大更新!集成FlashAttention-2,性能提升2倍

新智元报道编辑:alan 【新智元导读】新的一年,PyTorch也迎来了重大更新,PyTorch 2.2集成了FlashAttention-2和AOTInductor等新特性,计算性能翻倍。新的一...
阅读原文

媲美GPT-4的开源模型泄露!Mistral老板刚刚证实:正式版本还会更强

白交 发自 凹非寺量子位 | 公众号 QbitAIMistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。 CEO最新发声:确有其事,系早期客户员工泄露。...
阅读原文
1151617181926