让 AIGC「飞入寻常百姓家」
原标题:2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
文章来源:机器之心
内容字数:7291字
智象多模态大模型:场景驱动,让AIGC飞入寻常百姓家
本文介绍了智象未来公司及其多模态大模型3.0版本的研发历程和应用场景。文章指出,OpenAI的Sora发布后并未带来预期震撼,部分国产模型在某些方面甚至超越了Sora,这引发了对AI视频生成模型应用前景的重新思考。
1. 场景驱动优化模型,填补模型与应用的Gap
智象未来基于用户反馈,发现用户更需要解决特定问题的模型,而非追求通用能力的完美模型。 他们发现简单的、带特定IP的动态壁纸更受年轻人欢迎,B端也类似,需要模型在特定场景下达到95分以上的实用性。因此,智象未来从场景需求出发优化模型,而非一味追求基础模型的“100分”。
2. 智象多模态大模型3.0的三大优化
智象多模态大模型3.0在画面质量、镜头控制和特色场景生成效果上进行了三大优化:
- 画面质量和相关性提升:采用DiT+AR混合架构,兼顾生成质量、可控性和推理速度。
- 镜头和画面更可控:联合训练镜头和画面,实现更自然的影视级运镜效果。
- 特色场景下的生成效果提升:针对特定场景(如IP迁移)进行优化,实现端到端95分以上的用户体验。
3. 理解与生成相辅相成:智象多模态理解大模型1.0
智象未来还推出了智象多模态理解大模型1.0,用于更精细、准确的图像和视频内容理解,并与生成大模型结合,打造多模态检索+内容编辑与生成的创作平台,降低创作门槛,提高效率。
4. 商业化落地与未来规划
智象未来专注于模型的应用落地,而非追求AGI。 他们已累计服务全球上千万个人用户和数万家企业客户,取得了亮眼的商业化成绩。未来,他们将继续专注于解决用户“最后一公里”的问题,让AIGC技术惠及更多用户。
5. 最新融资消息
智象未来近日获得数亿元人民币Pre-A和A轮融资,投资方包括敦鸿资本、合肥产投等国资基金以及其他战略资本。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...