“造假”齐白石的《虾》,被国产AI一眼识破!

商汤在交互这块玩了个大的

“造假”齐白石的《虾》,被国产AI一眼识破!

原标题:“造假”齐白石的《虾》,被国产AI一眼识破!
文章来源:量子位
内容字数:6012字

商汤日日新大模型:更快、更准、更好的人工智能交互体验

本文总结了量子位对商汤最新发布的日日新融合大模型交互版(SenseNova-5o,简称“新5o”)的测评文章。该模型主打多模态能力,旨在提升AI交互质量,其显著特点是速度快、准确性高、体验好。

1. “新5o”的惊艳表现

文章通过多个例子展现了“新5o”的强大能力:它能识别出用真虾“造假”的齐白石画作,并推测出另一种可能性——模型;它能准确识别并解读繁体书法作品“宁静致远”,并解释阅读方向;它在交互过程中延迟极低,通常在2秒以内,并能模拟人类的语气、停顿和情绪,极大提升了交互的真实感和流畅度。

2. 超强记忆力与多模态能力

测试显示,“新5o”拥有不低于5分钟的记忆力。它能准确记住并回忆起之前看到的菜品和食材,即使在对话过程中被打断也能迅速回应。这不仅仅是信息的存储,更体现了其深入的理解和回忆能力。 此外,“新5o”还能玩“大家来找茬”游戏,准确指出图片中与年代不相符的物品。

3. 轻松应对复杂任务

文章展示了“新5o”在解决复杂问题上的能力。它能解答2024年北京高考物理选择题,并对答案进行详细解析;它还能识别并讲解复杂的神经网络架构图。 甚至,文章还安排了“新5o”与GPT-4进行对话,展现了其自然流畅的交互能力,并且在速度上略胜一筹。

4. 原生融合多模态技术的突破

“新5o”的强大能力源于其底层技术——国内首个原生融合多模态模型。这不同于简单的模态融合,它在模型架构和训练过程中实现了多种模态信息的深度融合,打破了模态间的壁垒,从而更有效地处理复杂任务。商汤通过海量数据训练,包括利用逆渲染等技术合成数据,并构建大量跨模态任务,最终实现了模型对多模态信息的整合理解和分析能力。

5. 亮眼的评测成绩与未来应用

“新5o”在SuperCLUE和OpenCompass两个权威榜单上取得了优异成绩,展现了其在语言、推理和多模态信息处理方面的领先水平。 未来,原生融合多模态技术将在自动驾驶、具身智能等领域发挥重要作用,例如提升自动驾驶安全性,增强智能体对环境的感知理解能力。

6. 结语

商汤的“新5o”在AI交互领域取得了显著突破,其快速、准确、真实的交互体验令人印象深刻。原生融合多模态技术的应用,为AI发展指明了新的方向,也预示着未来更加智能、便捷的人机交互体验。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止