AI项目和框架 - 第 73 页

DreamActor-H1

DreamActor-H1是字节跳动推出的基于扩散变换器（Diffusion Transformer, DiT）的框架，支持从配对的人类和产品图像生成高质量的人类产品演示视频。框架注入人...

阅读原文

AI工具

1年前 (2025)

Code Researcher

Code Researcher是微软研究院推出的深度研究Agent工具，专门用于处理大型系统代码库及其提交历史，自动化修复系统代码崩溃问题。通过三个阶段工作：分析（Ana...

阅读原文

AI工具

1年前 (2025)

Seaweed APT2

Seaweed APT2是字节跳动推出的创新的AI视频生成模型，通过自回归对抗后训练（AAPT）技术，将双向扩散模型转化为单向自回归生成器，实现高效、高质量的视频生成。

阅读原文

AI工具

1年前 (2025)

MAGREF

MAGREF（Masked Guidance for Any‑Reference Video Generation）是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示，能生成高质量、主...

阅读原文

AI工具

1年前 (2025)

Hunyuan3D-2.1

Hunyuan3D-2.1 是腾讯混元团队推出的开源项目，专注于从图像生成高保真 3D 资产。具备基于物理的渲染（PBR）材质合成能力，能生成逼真的纹理和材质，如金属反...

阅读原文

AI工具

1年前 (2025)

LLIA

LLIA（Low-Latency Interactive Avatars）是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成，支持实现低延...

阅读原文

AI工具

1年前 (2025)

Next-Frame Diffusion

Next-Frame Diffusion（NFD）是北京大学和微软研究院联合推出的自回归视频生成模型，结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...

阅读原文

AI工具

1年前 (2025)

SeedVR2

SeedVR2是字节跳动推出的新型单步视频修复（Video Restoration, VR）模型，基于扩散模型和对抗性后训练（Adversarial Post-Training, APT）技术。模型基于自...

阅读原文

AI工具

1年前 (2025)

HistAgent

HistAgent 是普林斯顿大学 AI 实验室与复旦大学历史学系联合推出的专为历史研究设计的人工智能助手系统。解决历史研究中多模态信息处理、跨语言分析和复杂推...

阅读原文

AI工具

1年前 (2025)

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型，基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构（JEPA），基于自监督学习...

阅读原文

AI工具

1年前 (2025)

豆包大模型1.6

豆包大模型1.6（Doubao-Seed-1.6）是字节跳动推出的多模态深度思考大模型。模型支持auto、thinking和non-thinking三种思考模式，能处理文字、图片、视频等多...

阅读原文

AI工具

1年前 (2025)

Reor

Reor是开源的本地化AI个人知识管理应用。应用支持自动链接相关笔记、语义搜索和Q&A功能，用户基于类似Obsidian的Markdown编辑器进行笔记编辑。Reor基于Ol...

阅读原文

AI工具

1年前 (2025)

Seedance 1.0

Seedance 1.0 是字节跳动Seed团队推出的视频生成基础模型。模型支持文字与图片输入，能生成多镜头无缝切换的1080p高品质视频，具备原生多镜头叙事能力，能进...

阅读原文

AI工具

1年前 (2025)

o3-pro

o3-pro 是OpenAI推出的强大推理模型，作为 o3 的升级版，在处理复杂问题和提供精准回答方面表现出色，尤其在科学研究、编程、教育和写作等场景中优势明显。o3...

阅读原文

AI工具

1年前 (2025)

Magistral

Magistral 是 Mistral AI 推出的推理模型，核心聚焦在透明、多语言和特定领域的推理能力。模型包含 Magistral Small（开源版）和 Magistral Medium（企业版）...

阅读原文

AI工具

1年前 (2025)