AIGC动态欢迎阅读
原标题:国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
关键字:模型,主体,显著特征,视频,场景
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:编辑部 HYZ
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。
生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!
上传小哥、机甲、街景,接下来,就是见证奇迹的时刻。
人、物、环境,被天衣无缝地融合到了同一个视频中,简直令人惊叹。
这种方法,颠覆了LoRA等传统的单点微调方法,标志着视频模型统一理解和生成的飞跃!
多模态人工智能,从此有了新标准。
与诸多漫长期货的视频模型不同,Vidu只要不到30s,就能生成一段视频了!
外国友人直接原地惊掉下巴:机甲跟原图一模一样,这绝对是最稳定的视频模型;有人更是言简意赅地给出评价:生数科技是名副其实的游戏规则改变者。
只要上传多个角色、物体和地点的图片,就能立即生成每个物体一致的场景,人手制作一部大片的时代真的来了吗?左右滑动查看踊跃的网友们,在评论区纷纷贴出了自己的脑洞素材。左右滑动查看而霸气的官号直接在评论区随机摇人,抽中的网友提供的素材,果然诞生
原文链接:国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
联系作者
文章来源:新智元
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...