2024年人工智能年终总结报告｜Artificial Analysis

AIGC动态2年前 (2024)发布新智元

原标题：2024年人工智能年终总结报告｜Artificial Analysis
文章来源：新智元
内容字数：4152字

2024人工智能年度回顾：飞速发展的一年

2024年，人工智能领域经历了前所未有的飞速发展，堪称里程碑式的一年。各家大模型能力提升显著，涌现出一批具有突破性进展的模型，对人们的生活和学习方式产生了重大影响。本文将对Artificial Analysis提供的2024年人工智能年度回顾报告进行总结。

1. 大模型领域的军备竞赛

自2022年ChatGPT发布以来，生成式AI领域的“军备竞赛”持续升温。短短两年内，多个实验室已追赶上甚至超越了OpenAI的GPT-4。例如，Claude 3.5 Sonnet、Gemini 1.5 Pro以及Gemini 2.0 Flash等模型都展现出超越GPT-4o的智能水平。虽然美国仍占据LLM领域的主导地位（ChatGPT、Gemini、Claude、Nova、LLama系列），但中国（Qwen2.5 Instruct 72B、DeepSeek V2.5等）和部分欧洲国家也取得了显著进展。

2. 开源模型的崛起与价格下降

OpenAI不再“Open”并没有导致开源模型与专有模型性能差距难以逾越。Meta、Mistral和阿里巴巴等发布的开源模型缩小了与专有模型的性能差距。更重要的是，语言模型的推理定价大幅下降，例如GPT-4o mini的价格仅为GPT-4的百分之一，国产模型Qwen2.5 72B的价格也远低于GPT-4 Turbo。这得益于小模型也能达到之前只有大模型才能达到的智能水平，例如微软的phi-4模型。

3. 上下文窗口的扩展与多模态能力的增强

上下文窗口长度已达到128K tokens，比2023年三季度增长了32倍，支持多模态输入（图像、视频、音频）。用户更倾向于使用头部企业的产品（OpenAI、Meta、Anthropic、Mistral、Google），选择模型的关键因素包括推理质量、上下文窗口、价格和速度。用户需求涵盖信息抽取、长文本总结、文本生成等，并越来越重视模型的多模态能力。大部分开发者同时使用多个模型，72%直接使用已发布模型，24%进行微调，仅4%从头训练。

4. 图像生成技术的飞跃

2024年图像生成质量显著提升，在照片真实感、提示符合度和文本渲染方面取得了巨大进步。多个先进的文生图模型不断迭代推出，例如Recraft v3。OpenAI的Sora以及快手的可灵、MiniMax的海螺AI、腾讯的混元等模型在该领域展开激烈竞争。

5. 文本转语音和语音识别的进步

OpenAI的Whisper模型重塑了语音识别领域，云推理服务提供商在响应速度和价格上展开竞争，带来高性价比体验。例如，Groq发布的最新Whisper模型比亚马逊2018年模型价格降低了72倍，速度提升了11倍。文本转语音模型也达到了新的质量里程碑，超越了之前的云服务供应商。

总而言之，2024年人工智能领域发展迅猛，大模型能力持续提升，价格持续下降，应用场景不断拓展。虽然报告中未包含最新的o3和Gemini 2.0 Flash Thinking，但其飞速发展已超乎想象，令人对2025年充满期待。

联系作者

文章来源：新智元
作者微信：
作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人对人类社会与文明进化的影响，领航中国新智能时代。

阅读原文

# AIGC动态 # AI伦理道德监管框架 # AI赋能实体经济 # 垂直领域AI解决方案 # 大模型应用落地案例 # 生成式AI安全风险

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

2024年人工智能年终总结报告｜Artificial Analysis

2024人工智能年度回顾：飞速发展的一年

1. 大模型领域的军备竞赛

2. 开源模型的崛起与价格下降

3. 上下文窗口的扩展与多模态能力的增强

4. 图像生成技术的飞跃

5. 文本转语音和语音识别的进步

联系作者

9大基准全面领先，性能暴涨10.8%！视觉价值模型VisVM成「图像描述」新宠

中国发表AI论文数量，全球第一！这些互联网大厂功不可没

相关文章

暂无评论