标签:成本

用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

机器之心报道 编辑:Panda硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还...
阅读原文

日活8000万、月活3.8亿,世界上用户最多的游戏Roblox,却还在亏损中

游戏平台 Roblox 现在应该是目前世界上玩家数最多的游戏了。 日均活跃用户 8000 万,月活用户超过 3.8 亿。 这是 PC 最大的游戏平台 Steam 用户数的 2 倍,Pl...
阅读原文

Llama3.1根本卖不动!业内人士:开源模型成本反而更高

允中 发自 凹非寺量子位 | 公众号 QbitAIMeta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。 据外媒The Information报道,...
阅读原文

Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备

新智元报道编辑:桃子 【新智元导读】微调的所有门道,都在这里了。开源,就要开的彻彻底底。 这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍...
阅读原文

模型成本疾速上升/下降,哪些技术让训AI更省钱?

机器之心PRO · 会员通讯 Week 34---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 模型成本疾速上升/下降,哪些技术让训 AI 更省钱? 模型...
阅读原文

又贵又难吃的雪糕刺客,割不动年轻人了

大数据文摘授权转载自网易数读 短短几年前,“雪糕刺客”还是夏天的关键词。 那时候,60 元的钟薛高横空出世,以一己之力将街边雪糕的定价“天花板”推到了两位数...
阅读原文

大模型降价又来新玩家——Claude,长文本缓存功能,最高节省 90% 成本

Claude 深夜上新重磅功能——API 长文本缓存。 新版 API 可以「记住」一整本书或整个代码库,不需要再重复输入了。 这样一来,不仅处理长文本的延时更低,更是...
阅读原文

成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude深夜上新重磅功能——API长文本缓存。 新版API可以“记住”一整本书或整个代码库,不需要再重复输入了。 这样一...
阅读原文

Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?

(图片来源:pxhere) 在PyTorch 之上重建大模型的整个推理和训练堆栈,乔琳用了五年。但现在,Fireworks的客户只用五天便可重复这一流程。作者丨刘洁 编辑丨...
阅读原文

月之暗面对谈 Zilliz:长文本和 RAG 如何选择?

关于长文本和 RAG 到底如何选择,一直有争论,从基模公司到应用开发者。 今天这篇文章,是来自基模公司月之暗面和中间层 Zilliz 的技术对话,值得一看。 本期...
阅读原文

全球外包之王易主?每月 1200元工资还天天 996,印度程序员 AI 加持下还是集体失业了!

作者|冬梅 采访嘉宾|肖然,Thoughtworks 中国区总经理 印度 IT 的梦想破灭了吗?两个月前,一家全球科技客户用一名越南高管取代了一名印度高管。此后,情...
阅读原文

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

新智元报道编辑:乔杨 【新智元导读】DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和...
阅读原文

1890美元,就能从头训练一个还不错的12亿参数扩散模型

机器之心报道 编辑:张倩、陈陈只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训...
阅读原文

今年,OpenAI可能要血亏50亿

新智元报道编辑:耳朵 好困 【新智元导读】最近,外媒给OpenAI算了笔账,今年可能要血亏50亿美元。OpenAI是历史上发展最快的企业之一,但也是最烧钱的企业之...
阅读原文

AI Scaling的神话

截至目前,语言模型越来越大,能力也越来越强,但过去的表现能预测未来吗? 一种流行的观点是,我们应该期待当前的趋势继续保持下去,并且出现更多数量级,这...
阅读原文
1238