AI项目和框架

Seaweed APT2

Seaweed APT2是字节跳动推出的创新的AI视频生成模型,通过自回归对抗后训练(AAPT)技术,将双向扩散模型转化为单向自回归生成器,实现高效、高质量的视频生成。
阅读原文

MAGREF

MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主...
阅读原文

Hunyuan3D-2.1

Hunyuan3D-2.1 是腾讯混元团队推出的开源项目,专注于从图像生成高保真 3D 资产。具备基于物理的渲染(PBR)材质合成能力,能生成逼真的纹理和材质,如金属反...
阅读原文

LLIA

LLIA(Low-Latency Interactive Avatars)是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成,支持实现低延...
阅读原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...
阅读原文

SeedVR2

SeedVR2是字节跳动推出的新型单步视频修复(Video Restoration, VR)模型,基于扩散模型和对抗性后训练(Adversarial Post-Training, APT)技术。模型基于自...
阅读原文

HistAgent

HistAgent 是普林斯顿大学 AI 实验室与复旦大学历史学系联合推出的专为历史研究设计的人工智能助手系统。解决历史研究中多模态信息处理、跨语言分析和复杂推...
阅读原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构(JEPA),基于自监督学习...
阅读原文

豆包大模型1.6

豆包大模型1.6(Doubao-Seed-1.6)是字节跳动推出的多模态深度思考大模型。模型支持auto、thinking和non-thinking三种思考模式,能处理文字、图片、视频等多...
阅读原文

Reor

Reor是开源的本地化AI个人知识管理应用。应用支持自动链接相关笔记、语义搜索和Q&A功能,用户基于类似Obsidian的Markdown编辑器进行笔记编辑。Reor基于Ol...
阅读原文

Seedance 1.0

Seedance 1.0 是字节跳动Seed团队推出的视频生成基础模型。模型支持文字与图片输入,能生成多镜头无缝切换的1080p高品质视频,具备原生多镜头叙事能力,能进...
阅读原文

o3-pro

o3-pro 是OpenAI推出的强大推理模型,作为 o3 的升级版,在处理复杂问题和提供精准回答方面表现出色,尤其在科学研究、编程、教育和写作等场景中优势明显。o3...
阅读原文

Magistral

Magistral 是 Mistral AI 推出的推理模型,核心聚焦在透明、多语言和特定领域的推理能力。模型包含 Magistral Small(开源版)和 Magistral Medium(企业版)...
阅读原文

Vui

Vui 是 Fluxions-AI 团队开源的轻量级语音对话模型,基于 LLaMA 架构。模型经过 4 万小时对话训练,能模拟真实对话中的语气词、笑声和停顿,提供沉浸式交互体...
阅读原文

Krea 1

Krea 1 是 Krea AI 推出的 AI 图像生成模型,解决传统 AI 图像生成中的“AI 美学”问题。模型能生成高度逼真、纹理清晰的图像,支持多种艺术风格,提供风格参考...
阅读原文