AI项目和框架

Hailuo 02

Hailuo 02 是 MiniMax 公司推出的全新AI视频生成模型,是Hailuo 01的升级版本。这个模型目前在图生视频、文生视频的榜单位于第二,超越快手的可灵以及谷歌的V...
阅读原文

LeVo

LeVo是腾讯AI实验室推出的AI唱歌模型,具备强大的音色克隆能力,仅需3秒音频即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。LeVo支持分轨生...
阅读原文

Sparc3D

Sparc3D是南洋理工大学联合Sensory Universe和帝国理工学院推出的用在高分辨率3D模型生成框架,解决传统3D生成方法中细节丢失和效率低下的问题。框架结合稀疏...
阅读原文

Kimi-Dev

Kimi-Dev是Moonshot AI推出的开源代码模型,专为软件工程任务设计。模型拥有 72B 参数量,编程水平比最新的DeepSeek-R1还强,和闭源模型比较也表现优异。在 S...
阅读原文

MiniMax-M1

MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token...
阅读原文

FlowDirector

FlowDirector是西湖大学AGI Lab团队联合中南大学推出的新型无训练(training-free)视频编辑框架,专门用在根据自然语言指令对视频内容进行精确编辑。框架直...
阅读原文

DreamActor-H1

DreamActor-H1是字节跳动推出的基于扩散变换器(Diffusion Transformer, DiT)的框架,支持从配对的人类和产品图像生成高质量的人类产品演示视频。框架注入人...
阅读原文

Code Researcher

Code Researcher是微软研究院推出的深度研究Agent工具,专门用于处理大型系统代码库及其提交历史,自动化修复系统代码崩溃问题。通过三个阶段工作:分析(Ana...
阅读原文

Seaweed APT2

Seaweed APT2是字节跳动推出的创新的AI视频生成模型,通过自回归对抗后训练(AAPT)技术,将双向扩散模型转化为单向自回归生成器,实现高效、高质量的视频生成。
阅读原文

MAGREF

MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主...
阅读原文

Hunyuan3D-2.1

Hunyuan3D-2.1 是腾讯混元团队推出的开源项目,专注于从图像生成高保真 3D 资产。具备基于物理的渲染(PBR)材质合成能力,能生成逼真的纹理和材质,如金属反...
阅读原文

LLIA

LLIA(Low-Latency Interactive Avatars)是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成,支持实现低延...
阅读原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...
阅读原文

SeedVR2

SeedVR2是字节跳动推出的新型单步视频修复(Video Restoration, VR)模型,基于扩散模型和对抗性后训练(Adversarial Post-Training, APT)技术。模型基于自...
阅读原文

HistAgent

HistAgent 是普林斯顿大学 AI 实验室与复旦大学历史学系联合推出的专为历史研究设计的人工智能助手系统。解决历史研究中多模态信息处理、跨语言分析和复杂推...
阅读原文
156789131