标签:内容生成
GroundingBooth
GroundingBooth 是一个先进的文本到图像定制框架,由华盛顿大学圣路易斯分校、Adobe和普渡大学的研究团队共同推出。基于文本-图像对齐模块和遮罩交叉注意力层...
Baichuan-Omni
Baichuan-Omni 是由百川智能推出的一款开源的 7B 多模态大型语言模型(MLLM),能同时处理和分析图像、视频、音频和文本等多种模态的数据。Baichuan-Omni 提...
Story-Adapter
Story-Adapter 是一种新型的长篇故事可视化框架,能在保持语义一致性的同时,生成高质量且具有细腻交互的故事图像序列。通过迭代方式,基于全局参考交叉注意...