标签:成本

大模型算力的「热」与 10 亿万卡成本的「冷」思考

大模型原生应用仍未爆发,谁能cover动辄10亿/年的万卡成本?作者丨郭 思 编辑丨陈彩娴 人工智能的快速发展催生了智算中心这个概念。自 2023 年下半年起,中国...
阅读原文

降本增效,并不只有一条路|甲子光年

采购数字化如何成为企业“降本增效”驱动力?临近年底,不少媒体在盘点这一年时,“降本增效”依然是关键词之一。 市场大环境变化下,企业的运营理念正在从上升周...
阅读原文

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

新智元报道编辑:Aeneas【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4...
阅读原文

训练成本不到其 6% 的「联邦大模型」,凭什么在会议场景媲美 GPT-4?

「三个臭皮匠,顶个诸葛亮」。作者丨何思思编辑丨陈彩娴今年 8 月,在雷峰网于新加坡举办的 GAIR 大会主论坛上,前微软全球技术院士、美国双院院士黄学东用一...
阅读原文

上云还是下云:章文嵩博士解读真正的云原生 Kafka 十倍降本方案!

作者|章文嵩、周新宇 策划 | Tina近日,AutoMQ 团队发布了基于云的开源云原生 Kafka——AutoMQ for Kafka,所有的代码采用 Apache 2.0 开源许可。AutoMQ 充分...
阅读原文

RAG+GPT-4 Turbo让模型性能飙升!更长上下文不是终局,「大海捞针」实验成本仅4%

新智元报道编辑:桃子【新智元导读】RAG或许就是大模型能力飙升下一个未来。RAG+GPT-4,4%的成本,便可拥有卓越的性能。这是最新的「大海捞针」实验得出的结...
阅读原文

能耗比达到GPT-4 10倍!黄学东亲自解密Zoom AI的成功之道,AI伴侣直接替你开会

新智元报道编辑:润 alan【新智元导读】Zoom CTO黄学东发文,讨论了Zoom对于高效处理AI任务需求采用的技术——Zoom联邦AI。达到GPT-4性能的同时,Zoom AI只用了...
阅读原文

谁能代替英伟达?

英伟达的铠甲和软肋本文转自《远川研究所》;作者|叶子凌/何律衡 编辑|陈彬今年夏天,英伟达创始人黄仁勋专门腾出时间,拜访了一家名叫战略与国际研究中心 (C...
阅读原文

公测邀请:GreptimeAI —— LLM 应用的可观测性解决方案

随着生成式大语言模型(下文简称为:LLM)的成熟,LLM 应用的生态呈现爆炸式的增长,相应监控工具的需求也随之上升。由于 LLM 对算力要求过高,性能优化复杂...
阅读原文

OpenAI 将在首届开发者大会上让模型更便宜、更强大

点击上方蓝字关注我们图|匡萃彪文|匡萃彪“ OpenAI在首次开发者大会上宣布了产品升级,使其AI模型更便宜、功能更强大。这些升级旨在鼓励公司使用OpenAI的技...
阅读原文

OpenAI新模型研发遇挫,稀疏性是大模型降本的钥匙吗?

选自theinformation机器之心编译编辑:小舟OpenAI 也有失败的模型。大模型的训练与运行成本极其高昂,OpenAI 也尝试过降低成本,只可惜失败了。去年年底,当 ...
阅读原文

推理成本增加10倍?对文心大模型4.0的一些猜想

夕小瑶科技说 原创作者 | 卖萌酱大家好,我是卖萌酱。相信不少小伙伴这几天都听到了消息,在期待下周即将发布的文心大模型4.0。我们的几个读者群里也发生了相...
阅读原文

开发成本降至5%!OpenAI计划推出新功能吸引开发者,也稳住用他们模型亏损的“大冤种”客户

作者|冬梅OpenAI 计划推出新功能吸引开发者,称开发成本最高降至 5%近日,路透社援引消息人士称,为了吸引更多企业和开发者更多地使用其技术,OpenAI 计划...
阅读原文

打造ChatGPT平替,成本暴降95%!OpenAI硬核更新下月发布,视觉API要来

新智元报道编辑:桃子 好困【新智元导读】为了吸引更多开发者,OpenAI正在计划一波重大更新,并且让构建ChatGPT应用的成本降低多达20倍!天下开发人员,苦Ope...
阅读原文

ChatGPT们红遍全球却不赚钱?每月亏损高达3000万美元

夕小瑶科技说 分享来源 | 量子位 作者 | 丰色 萧箫别看全球科技圈都在大模型上轰轰烈烈搞了这么久——做出来的热门产品居然还是赔钱的?!就拿这里面最“得势”的...
阅读原文
156789