原标题:2024年人工智能年终总结报告|Artificial Analysis
文章来源:新智元
内容字数:4152字
2024人工智能年度回顾:飞速发展的一年
2024年,人工智能领域经历了前所未有的飞速发展,堪称里程碑式的一年。各家大模型能力提升显著,涌现出一批具有突破性进展的模型,对人们的生活和学习方式产生了重大影响。本文将对Artificial Analysis提供的2024年人工智能年度回顾报告进行总结。
1. 大模型领域的军备竞赛
自2022年ChatGPT发布以来,生成式AI领域的“军备竞赛”持续升温。短短两年内,多个实验室已追赶上甚至超越了OpenAI的GPT-4。例如,Claude 3.5 Sonnet、Gemini 1.5 Pro以及Gemini 2.0 Flash等模型都展现出超越GPT-4o的智能水平。虽然美国仍占据LLM领域的主导地位(ChatGPT、Gemini、Claude、Nova、LLama系列),但中国(Qwen2.5 Instruct 72B、DeepSeek V2.5等)和部分欧洲国家也取得了显著进展。
2. 开源模型的崛起与价格下降
OpenAI不再“Open”并没有导致开源模型与专有模型性能差距难以逾越。Meta、Mistral和阿里巴巴等发布的开源模型缩小了与专有模型的性能差距。更重要的是,语言模型的推理定价大幅下降,例如GPT-4o mini的价格仅为GPT-4的百分之一,国产模型Qwen2.5 72B的价格也远低于GPT-4 Turbo。这得益于小模型也能达到之前只有大模型才能达到的智能水平,例如微软的phi-4模型。
3. 上下文窗口的扩展与多模态能力的增强
上下文窗口长度已达到128K tokens,比2023年三季度增长了32倍,支持多模态输入(图像、视频、音频)。用户更倾向于使用头部企业的产品(OpenAI、Meta、Anthropic、Mistral、Google),选择模型的关键因素包括推理质量、上下文窗口、价格和速度。用户需求涵盖信息抽取、长文本总结、文本生成等,并越来越重视模型的多模态能力。大部分开发者同时使用多个模型,72%直接使用已发布模型,24%进行微调,仅4%从头训练。
4. 图像生成技术的飞跃
2024年图像生成质量显著提升,在照片真实感、提示符合度和文本渲染方面取得了巨大进步。多个先进的文生图模型不断迭代推出,例如Recraft v3。OpenAI的Sora以及快手的可灵、MiniMax的海螺AI、腾讯的混元等模型在该领域展开激烈竞争。
5. 文本转语音和语音识别的进步
OpenAI的Whisper模型重塑了语音识别领域,云推理服务提供商在响应速度和价格上展开竞争,带来高性价比体验。例如,Groq发布的最新Whisper模型比亚马逊2018年模型价格降低了72倍,速度提升了11倍。文本转语音模型也达到了新的质量里程碑,超越了之前的云服务供应商。
总而言之,2024年人工智能领域发展迅猛,大模型能力持续提升,价格持续下降,应用场景不断拓展。 虽然报告中未包含最新的o3和Gemini 2.0 Flash Thinking,但其飞速发展已超乎想象,令人对2025年充满期待。
联系作者
文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。