最强国产多模态大模型来了!硬刚GPT-4o,商汤现场演示实时音视频交互

AIGC动态3个月前发布 智东西
9 0 0

最强国产多模态大模型来了!硬刚GPT-4o,商汤现场演示实时音视频交互

AIGC动态欢迎阅读

原标题:最强国产多模态大模型来了!硬刚GPT-4o,商汤现场演示实时音视频交互
关键字:商汤,模型,政策,解读,演示
文章来源:智东西
内容字数:0字

内容摘要:


商汤发布国内首个流式多模态大模型日日新5o,多项测评超GPT-4o。
作者|三北
编辑|漠影
今日,“国产版GPT-4o”,日日新5o,亮相WAIC大会。
5月中旬,OpenAI推出新旗舰模型GPT-4o,凭借自然流畅的实时音视频交互震惊世界。
仅仅一个多月之后,在我国一年一度的最大人工智能盛会WAIC 2024上,商汤科技正式推出日日新5.5,以及可进行流式多模态交互的5o版本,不仅多项测评超GPT-4o,还实现实时跨文本、音频、图像与视频推理。
▲商汤日日新5.5多项核心指标测评超GPT-4o
商汤科技现场演示了新模型日日新5o的实时音视频交互,引起了WAIC观众的一片沸腾。
比如,当演示者用手机对着桌上小狗玩偶,日日新5o可以在要求下讲出小狗的表情,并识别出帽子上的文字和背景,多轮对话十分丝滑流畅。与此同时,商汤还推出可控人物类AI视频生成产品Vimi,可稳定生成长达1分钟的单镜头人物类视频,具有高动态、高保真特点,预计月内公测。
通过Vimi,商汤董事长兼CEO徐立在现场致敬了人工智能领域的多位大咖,包括让已故的AI科学家、商汤科技创始人汤晓鸥的照片“复活”,久违的音容笑貌浮现


原文链接:最强国产多模态大模型来了!硬刚GPT-4o,商汤现场演示实时音视频交互

联系作者

文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...