标签:性能

无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍

机器之心报道 编辑:陈萍Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI ...
阅读原文

将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B

机器之心专栏 机器之心编辑部对于大型视觉语言模型(LVLM)而言,扩展模型可以有效提高模型性能。然而,扩大参数规模会显著增加训练和推理成本,因为计算中每...
阅读原文

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

文章转自「新智元」,Founder Park 略有调整。 今天,OpenAI 正式发布了更新版的 GPT-4 Turbo——gpt-4-0125-preview。 不仅大幅改善了模型「偷懒」的情况,而...
阅读原文

GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折

白交 发自 凹非寺量子位 | 公众号 QbitAIOpenAI深夜更新!一口气连甩五个大模型: 新的GPT-4 Turbo预览模型 新的GPT-3.5 Turbo型号 新的文本审核模型 两种新...
阅读原文

OpenAI连甩5款新模型!价格暴降,功力大涨,还修复了GPT-4变懒问题

五款大模型新品深夜炸场,价格降至五分之一,模型更勤快、代码能力更强。 编译|云鹏 编辑|心缘 智东西1月26日报道,昨夜,OpenAI发布了一系列重磅大模型更新...
阅读原文

今日ArXiv最骚NLP论文:欺骗大模型却能大幅提升效果的骚操作

夕小瑶科技说 原创作者 |谢年年、python在大模型的提示工程中,少样本提示,思维链提示(CoT)都是行之有效的方法,通过为大模型提供几个样例,为模型提供更...
阅读原文

让CPU跑大模型该怎么做?阿里云交出答卷:AI推理速度飙升7倍

阿里云ECS g8i整机性能最高提升85%,可支撑720亿参数规模的大语言模型。 作者|程茜 编辑|漠影 AI应用落地加速,对推理的性能提出了更加苛刻的要求。 就在上周...
阅读原文

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

西风 发自 凹非寺量子位 | 公众号 QbitAIStability AI开年第一个大模型来了! 名为Stable Code 3B,参数27亿,专为写代码而生。 Stable Code 3B可理解处理18...
阅读原文

Stability AI发布Stable Code 3B模型,没有GPU也能本地运行

机器之心报道 编辑:陈萍、小舟Stable Code 3B 的性能优于类似大小的代码模型,并且与 CodeLLaMA 7B 的性能相当,尽管其大小只有 CodeLLaMA 7B 的 40%。 在文...
阅读原文

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

机器之心报道 编辑:张倩又有新的开源模型可以用了。 从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准...
阅读原文

AI:你总要高清视频,它来了

机器之心报道 机器之心编辑部以后,就算是跑着拍视频,FMA-Net也能给你处理得非常满意。 Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升...
阅读原文

DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2

夕小瑶科技说 原创作者 | 智商掉了一地、Python自从 LLaMA 被提出以来,开源大型语言模型(LLM)的快速发展就引起了广泛研究关注,随后的一些研究就主要集中...
阅读原文

英伟达CES三款芯片连发,市值暴涨超6%,AI PC时代来临

机器之心原创 作者:泽南、小舟英伟达再次给我们带来了一点生成式 AI 的震撼。生成式 AI 是最前沿的科技发展方向之一,正在举行的消费电子大展 CES 2024 上,...
阅读原文

英特尔发布第14代酷睿桌面处理器:24核、5.8GHz,更适合游戏玩家

机器之心报道 编辑:陈萍、佳琪英特尔全新酷睿第 14 代 HX 系列移动处理器旨在为创作者和移动爱好者提供最佳体验。 在 CES 2024 期间,英特尔推出了最新的第 ...
阅读原文

NVIDIA狂飙AI ,市值暴涨,PC性能提升60倍!40系SUPER显卡发布,4899元碾压上代旗舰

新智元报道编辑:编辑部 【新智元导读】今年的CES大会上,NVIDIA依然给全世界震撼不停。正式下场AI PC,性能直接飙涨60倍;40系SUPER显卡,已全面碾压上代旗...
阅读原文
1161718192026