原标题:“agent”一词令人沮丧,GPT-4级模型已不值一提,大神程序员盘点「大模型的2024」
文章来源:人工智能学家
内容字数:28401字
2024年大语言模型(LLM)领域回顾:惊喜与挑战并存
2024年被业内人士称为“AGI元年”,大模型领域发生了翻天覆地的变化。本文总结了Simon Willison在《Things we learned about LLMs in 2024》一文中对2024年LLM领域的关键发现,并对其进行了精编。
1. GPT-4的护城河被突破
2023年,GPT-4的性能一度遥不可及。但2024年,多个组织的模型在Chatbot Arena Leaderboard上的得分超过了GPT-4-0314,例如谷歌的Gemini 1.5 Pro,以及Anthropic的Claude 3系列。这标志着GPT-4级的模型不再是少数机构的专利,训练此类模型已不再是特别值得一提的成就。
2. 笔记本电脑也能运行GPT-4级模型
得益于训练和推理性能的显著提升,如今即使是普通的64GB内存笔记本电脑也能运行多个GPT-4级模型,这在2023年是不可想象的。Meta的Llama 3.2系列模型也展现了在较小尺寸下取得的令人惊喜的效果。
3. LLM价格大幅下降
2024年,LLM的使用成本急剧下降,这主要归功于竞争加剧和效率提高。各家模型提供商的价格战使得使用先进模型的成本降低了数十倍,这对于个人用户和小型企业来说是个好消息,也降低了LLM对环境的影响。
4. 多模态模型的兴起
多模态大语言模型(MLLM)在2024年得到广泛应用,几乎所有模型提供商都推出了支持图像、音频和视频输入的模型。多模态能力极大地拓展了LLM的应用范围,也为用户提供了更丰富的交互方式。
5. 语音和实时视频模式的应用
语音和实时视频模式的出现,让科幻照进现实。OpenAI的GPT-4o和谷歌的Gemini都支持音频输入和输出,并能进行逼真的语音对话。实时视频模式也开始出现,用户可以与模型实时分享相机画面并进行交流。
6. Prompt驱动的应用生成成为商品
通过编写合适的prompt,LLM可以生成完整的交互式应用,这一能力在2024年得到广泛应用。许多团队都构建了类似的系统,这项功能已成为一种商品,可以有效地与所有领先的模型进行竞争。
7. 强大模型的普及与付费模式的转变
2024年,强大的模型在几个月内就变得普及,OpenAI和Anthropic都向所有用户免费提供了其强大的模型。然而,免费使用SOTA模型的时代可能已经结束,付费订阅模式将成为主流。
8. 智能体(Agent)的局限性
尽管“智能体”概念备受关注,但其定义仍然模糊,实际应用也面临挑战,尤其是在应对“轻信”(gullibility)问题上进展甚微。
9. 自动评估的重要性
为LLM驱动的系统编写优秀的自动评估,是构建有用应用的关键技能。拥有强大的评估套件能够加快模型迭代,并构建更可靠、更有用的产品功能。
10. 苹果的MLX库与Apple Intelligence的差距
苹果公司的MLX库为Apple Silicon带来了强大的模型运行能力,但其自家的Apple Intelligence功能却令人失望,与其他领先的LLM相比差距明显。
11. 推理扩展模型的兴起
OpenAI的o1模型开辟了一种新的模型扩展方法:通过在推理上花费更多计算量来解决更难的问题,而不是单纯增加训练计算量。
12. 中国在LLM训练方面的进展
DeepSeek v3等模型的出现,显示出中国在LLM训练方面的显著进展,尤其是在训练效率优化方面,这可能与美国对中国出口GPU的限制有关。
13. LLM环境影响的改善
模型效率的提高降低了运行prompt的能耗和对环境的影响,这消除了部分人对LLM环境影响的担忧。
14. 数据中心建设的必要性
LLM成本的下降引发了对未来数据中心建设必要性的讨论,过度的基础设施建设可能会造成资源浪费和环境问题。
15. “泔水”(Slop)时代的到来
2024年,“泔水”一词被用来形容人工智能生成的未经请求和未经审查的内容,这突显了滥用生成式人工智能的风险。
16. 合成训练数据的有效性
合成训练数据在LLM训练中发挥着越来越重要的作用,它可以帮助引导模型走向正确的方向,并提高训练效率。
17. 有效利用LLM的挑战
虽然LLM功能强大,但要充分利用它们并非易事,需要用户具备深入的理解和丰富的经验,才能避免其陷阱。
18. 认知差距的扩大
公众对LLM的认知存在巨大差距,这可能会影响到这项技术对社会的积极影响。
19. 对LLM的批判性思考
LLM值得被批判性地审视,需要对环境影响、数据可靠性、不正当应用等问题进行讨论,并找到解决方案,以确保其正面应用大于负面影响。
总而言之,2024年是LLM领域发展迅猛的一年,既带来了令人惊喜的进步,也带来了新的挑战。未来,如何更好地利用LLM,并解决其局限性和潜在风险,将是业界需要持续关注和努力的方向。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构