Anthropic估值涨到615亿美元
原标题:实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守
文章来源:量子位
内容字数:6560字
Claude 3.7 Sonnet:编程能力爆表的新一代AI模型
近日,Anthropic发布了其最新一代大型语言模型Claude 3.7 Sonnet,引发了广泛关注。其在编程、物理模拟以及现实世界任务处理上的强大能力,使其成为AI领域的新焦点。本文将对Claude 3.7 Sonnet的各项能力进行总结。
1. 编程能力:代码生成速度快,游戏开发能力强
Claude 3.7 Sonnet展现出惊人的编程能力。它能够根据简单的描述生成大量的、功能完善的代码。例如,仅需一个样本,就能生成3200多行代码,创建一个包含跳跃、打怪、回血、吃金币等复杂机制的可玩性很高的游戏,甚至可以复刻热门游戏《Flappy Bird》和《我的世界》。 它还能够快速生成模拟太阳系运行的1374行代码,并实现实时交互,展现了其对物理规律的准确把握和代码生成速度。
2. 物理模拟能力:精准把握物理规律,速度快
许多测试者利用Claude 3.7 Sonnet进行物理模拟,例如模拟四维空间内小球的弹跳,以及模拟流体。其速度远超之前的模型,例如o3-mini,展现了“天下武功,唯快不破”的优势。 它甚至能够根据简单的描述生成模拟太阳系运行的程序,准确地展现了各个行星的运行轨迹。
3. 现实世界任务处理能力:超越预期,应用场景广泛
Claude 3.7 Sonnet在处理现实世界任务方面也表现出色。它可以生成动画天气卡,模拟云彩移动和雨滴飘落;可以高精度还原网页HTML结构;甚至可以根据心率生成Apple Watch贪吃蛇游戏,游戏难度与玩家心率正相关。这些都体现了其强大的理解和应用能力。
4. 逻辑推理能力:识破逻辑陷阱,应对复杂情境
Claude 3.7 Sonnet能够识破许多逻辑陷阱。在“Misguided Attention”基准测试中,它成功避免了被误导信息影响,正确解答了改进后的“电车难题”和“薛定谔的猫”问题,甚至能识别出一些“弱智吧”式的因果倒置问题,表现出强大的逻辑推理能力。即使在未开启推理模式下,其表现也与开启推理模式的o3-mini不相上下。
5. Anthropic公司及融资
Claude 3.7 Sonnet的发布也伴随着Anthropic新一轮35亿美元的融资消息,估值达到615亿美元,远超预期,这体现了市场对其技术的认可。
6. 总结
Claude 3.7 Sonnet 在编程、物理模拟和现实世界任务处理等方面展现出强大的能力,其速度快、准确性高,并具有强大的逻辑推理能力。 这款新模型的出现,无疑将推动AI领域进一步发展,并为各种应用场景带来更多可能性。 其在代码生成和游戏开发方面的突出表现,也使其成为开发者和游戏爱好者关注的焦点。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破