标签:成本

Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备

新智元报道编辑:桃子 【新智元导读】微调的所有门道,都在这里了。开源,就要开的彻彻底底。 这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍...
阅读原文

模型成本疾速上升/下降,哪些技术让训AI更省钱?

机器之心PRO · 会员通讯 Week 34---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 模型成本疾速上升/下降,哪些技术让训 AI 更省钱? 模型...
阅读原文

又贵又难吃的雪糕刺客,割不动年轻人了

大数据文摘授权转载自网易数读 短短几年前,“雪糕刺客”还是夏天的关键词。 那时候,60 元的钟薛高横空出世,以一己之力将街边雪糕的定价“天花板”推到了两位数...
阅读原文

大模型降价又来新玩家——Claude,长文本缓存功能,最高节省 90% 成本

Claude 深夜上新重磅功能——API 长文本缓存。 新版 API 可以「记住」一整本书或整个代码库,不需要再重复输入了。 这样一来,不仅处理长文本的延时更低,更是...
阅读原文

成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude深夜上新重磅功能——API长文本缓存。 新版API可以“记住”一整本书或整个代码库,不需要再重复输入了。 这样一...
阅读原文

Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?

(图片来源:pxhere) 在PyTorch 之上重建大模型的整个推理和训练堆栈,乔琳用了五年。但现在,Fireworks的客户只用五天便可重复这一流程。作者丨刘洁 编辑丨...
阅读原文

月之暗面对谈 Zilliz:长文本和 RAG 如何选择?

关于长文本和 RAG 到底如何选择,一直有争论,从基模公司到应用开发者。 今天这篇文章,是来自基模公司月之暗面和中间层 Zilliz 的技术对话,值得一看。 本期...
阅读原文

全球外包之王易主?每月 1200元工资还天天 996,程序员 AI 加持下还是集体失业了!

作者|冬梅 采访嘉宾|肖然,Thoughtworks 中国区总经理 印度 IT 的梦想破灭了吗?两个月前,一家全球科技客户用一名越南高管取代了一名印度高管。此后,情...
阅读原文

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

新智元报道编辑:乔杨 【新智元导读】DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和...
阅读原文

1890美元,就能从头训练一个还不错的12亿参数扩散模型

机器之心报道 编辑:张倩、陈陈只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训...
阅读原文

今年,OpenAI可能要血亏50亿

新智元报道编辑:耳朵 好困 【新智元导读】最近,外媒给OpenAI算了笔账,今年可能要血亏50亿美元。OpenAI是历史上发展最快的企业之一,但也是最烧钱的企业之...
阅读原文

AI Scaling的神话

截至目前,语言模型越来越大,能力也越来越强,但过去的表现能预测未来吗? 一种流行的观点是,我们应该期待当前的趋势继续保持下去,并且出现更多数量级,这...
阅读原文

奥特曼进军搜索,谷歌慌了!让谷歌股价暴跌的“大杀器”三个月前就被程序员摸透了!

编辑 | Tina、褚杏娟 OpenAI 正式宣布备受期待的搜索市场新产品——SearchGPT,这是一款由 AI 驱动的搜索引擎,能够实时访问互联网信息。 该搜索引擎以一个大...
阅读原文

Mistral AI新旗舰模型挑战Llama 3.1!1230亿参数性能直逼GPT-4o

Mistral AI新旗舰模型重磅发布:“幻觉”控制出色。 编译|孟强 编辑|云鹏 智东西7月25日消息,继Meta昨日推出开源Llama3.1模型之后,法国初创AI公司Mistral AI...
阅读原文

曝OpenAI今年亏麻了!烧掉85亿美元

OpenAI今年亏损50亿美元?马上又要融资。 编译|李水青 编辑|心缘 智东西7月25日消息,据外媒The Information报道,OpenAI今年或许面临高达50亿美元(约合363...
阅读原文
12349