OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,能解决复杂场景下风格化图像的一致性问题。模型基于大规模配对的风格化数据进行训练,用两阶段训...
阅读原文

MagicPath

MagicPath 是基于 AI 的无限画布设计工具。工具支持用户基于自然语言与 AI 对话,快速生成和编辑设计组件,无需手动操作。MagicPath 能帮助设计师和创意工作...
阅读原文

AIpai

AIpai是AI视频创作Agent产品,支持帮助用户快速生成专业视频内容。基于智能编剧、角色设计、场景构建和视频生成等功能,满足从病毒式短剧、热点视频到品牌宣...
阅读原文

AI-Media2Doc

AI-Media2Doc 是开源的音视频转文档工具,基于AI大模型技术,支持将音视频内容智能转换为小红书笔记、公众号文章、知识笔记、思维导图和视频字幕等多种文档形...
阅读原文

Largo

Largo是基于AI技术加速影视内容开发的创新平台。平台分析海量影视数据(包括超过40万部电影和电视剧、95万名演员、5.9万个剧本等),为影视制作提供数据驱动...
阅读原文

DeepSeek-R1-0528

DeepSeek-R1-0528 是 DeepSeek 团队推出的最新版AI模型。模型基于 DeepSeek-V3-0324 训练,参数量达 660B。模型在 HuggingFace 上开源,开发者能自由使用和修...
阅读原文

CoGenAV

CoGenAV - 通义联合深圳技术大学推出的多模态语音表征模型
阅读原文

Style Art AI

Style Art AI 是基于AI技术的图像创作工具,结合最新的 ChatGPT 4o 模型与多种艺术风格,将文字描述或现有图像快速转换成各种艺术风格的图像。用户只需输入文...
阅读原文

Onit

Onit是为Mac设计的AI聊天助手,支持停靠在任何应用程序中。Onit支持高亮文本自动加载,用户只需选择文本,Onit能自动作为上下文打开,无需复制粘贴。
阅读原文

稿定AI社区

稿定AI社区是在线AI创意灵感平台,为用户提供丰富的创意设计资源和工具。平台涵盖多种设计领域,包括形象照、电商设计、节日主题、3D插画、头像设计、小红书...
阅读原文

Ming-lite-omni

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型。模型基于MoE架构,融合文本、图像、音频和视频等多种模态的感知能力,具备强大的理解和生成能力。模型在多...
阅读原文

SelectYet

SelectYet是实用的AI文献分析工具,基于先进的AI技术和“记忆摘要”技术,为研究人员提供高效便捷的文献处理服务。用户只需输入研究主题、上传PDF文献,设置自...
阅读原文

幻舟AI

幻舟AI是一站式AI短片创作平台,支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型,实现剧本创作、角色设计、分镜生成及视...
阅读原文

HunyuanVideo-Avatar

HunyuanVideo-Avatar是腾讯混元团队与腾讯音乐天琴实验室联合研发的语音数字人模型,基于多模态扩散Transformer架构,能生成动态、情感可控以及多角色对话视...
阅读原文

Jodi

Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,将视觉生成与理解统一起来。
阅读原文
12829303132254