2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷

让 AIGC「飞入寻常百姓家」

2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷

原标题:2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
文章来源:机器之心
内容字数:7291字

智象多模态大模型:场景驱动,让AIGC飞入寻常百姓家

本文介绍了智象未来公司及其多模态大模型3.0版本的研发历程和应用场景。文章指出,OpenAI的Sora发布后并未带来预期震撼,部分国产模型在某些方面甚至超越了Sora,这引发了对AI视频生成模型应用前景的重新思考。

1. 场景驱动优化模型,填补模型与应用的Gap

智象未来基于用户反馈,发现用户更需要解决特定问题的模型,而非追求通用能力的完美模型。 他们发现简单的、带特定IP的动态壁纸更受年轻人欢迎,B端也类似,需要模型在特定场景下达到95分以上的实用性。因此,智象未来从场景需求出发优化模型,而非一味追求基础模型的“100分”。

2. 智象多模态大模型3.0的三大优化

智象多模态大模型3.0在画面质量、镜头控制和特色场景生成效果上进行了三大优化:

  1. 画面质量和相关性提升:采用DiT+AR混合架构,兼顾生成质量、可控性和推理速度。
  2. 镜头和画面更可控:联合训练镜头和画面,实现更自然的影视级运镜效果。
  3. 特色场景下的生成效果提升:针对特定场景(如IP迁移)进行优化,实现端到端95分以上的用户体验。

3. 理解与生成相辅相成:智象多模态理解大模型1.0

智象未来还推出了智象多模态理解大模型1.0,用于更精细、准确的图像和视频内容理解,并与生成大模型结合,打造多模态检索+内容编辑与生成的创作平台,降低创作门槛,提高效率。

4. 商业化落地与未来规划

智象未来专注于模型的应用落地,而非追求AGI。 他们已累计服务全球上千万个人用户和数万家企业客户,取得了亮眼的商业化成绩。未来,他们将继续专注于解决用户“最后一公里”的问题,让AIGC技术惠及更多用户。

5. 最新融资消息

智象未来近日获得数亿元人民币Pre-A和A轮融资,投资方包括敦鸿资本、合肥产投等国资基金以及其他战略资本。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...