标签:模型

Meta 科学家揭秘 Llama 3.1:合成数据很重要,MoE 不是必须的

刚刚发布的开源「巨无霸」Llama 3.1 虽然自带论文,但依旧激起了广大网友强烈的好奇心和求知欲。 Llama 3.1 都使用了哪些数据?其中有多少合成数据?为什么不...
阅读原文

谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快

每秒40 Token,谷歌开源20亿参数“小钢炮”。 编译 |香草 编辑|李水青 谷歌DeepMind的开源小模型家族,又迎来新成员! 智东西8月1日消息,今日凌晨,谷歌DeepMi...
阅读原文

黄仁勋对谈扎克伯格万字实录:爆粗口抨击闭源,谈智能硬件,互送夹克,下一次还要送金链

谈 AI 送皮衣最近在美国丹佛举行的第 51 届 SIGGRAPH 图形大会上,英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格举行炉边谈话。 他们讨论了 ...
阅读原文

NVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4

夕小瑶科技说 原创作者 | Richard在 Llama-3.1 模型发布之前,开源模型与闭源模型的性能之间一直存在较大的差距,尤其是在长上下文理解能力上。 大模型的上下...
阅读原文

谷歌Gemma 2 2B发布火爆,小模型如何撑起大格局?

大数据文摘授权转载自AI科技评论 作者:陈鹭伊 编辑:岑峰 语言模型的“小时代”正式到来? 北京时间8月1日凌晨(当地时间7月31日下午),Google深夜放出大招,...
阅读原文

​Apple Intelligence是如何“练”成的?最全解读:模型架构、预训练、后训练、推理优化和评测

大数据文摘授权转载自学术头条 撰文:马雪薇Siri 终于变身“AI Siri”,万众期待的 Apple Intelligence 来了。伴随 Apple Intelligence 上线 iOS 18、iPadOS 18...
阅读原文

合合信息研发总监常扬:大模型RAG技术架构与应用实践 | 公开课预告

随着大语言模型的兴起,其在处理自然语言任务上展现出了强大的能力,但也逐渐暴露出一些问题。大语言模型虽然能够生成连贯且富有逻辑的文本,但在某些情况下...
阅读原文

想跑千亿大模型?算力厂商放大招!CPU通用服务器成为新选择

克雷西 发自 凹非寺量子位 | 公众号 QbitAI千亿参数规模的大模型推理,服务器仅用4颗CPU就能实现! 在一台CPU通用服务器上,浪潮信息成功跑通了102B大模型推...
阅读原文

ChatGPT版「Her」被玩疯:哭着读诗,中文表现也很亮

金磊 发自 凹非寺量子位 | 公众号 QbitAI上线仅仅一天,GPT-4o的高级语音功能(Advanced Voice Mode)简直要被玩疯了。 无数网友脑洞大开的疯狂测试,GPT-4o...
阅读原文

贾扬清:大模型尺寸正在重走CNN的老路;马斯克:在特斯拉也是这样

衡宇 发自 凹非寺量子位 | 公众号 QbitAITransformer大模型尺寸变化,正在重走CNN的老路! 看到大家都被LLaMA 3.1吸引了注意力,贾扬清发出如此感慨。 拿大模...
阅读原文

21岁天才少年创业AI硬件一夜爆火:710元换一个挂在脖子上的AI朋友

克雷西 发自 凹非寺量子位 | 公众号 QbitAI99美元(约710人民币),就能和AI“交个朋友”? 一条叫做Friend的“AI项链”在推特上爆火,浏览量已超过2000万。 在Ra...
阅读原文

GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?

新智元报道编辑:编辑部 【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练...
阅读原文

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

新智元报道编辑:编辑部 【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma S...
阅读原文

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

新智元报道编辑:LRST 好困 【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比...
阅读原文

星尘智能获数千万美元融资,专注 AI 机器人商业化;OpenAI 部分开放 GPT-4o 语音,今秋扩至所有付费用户丨AI情报局

01 今日融资快报人形机器人星尘智能获数千万美元 Pre-A 轮融资,专注 AI 机器人商业化 AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由...
阅读原文