AI项目和框架

MiniMax-M1

MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token...
阅读原文

FlowDirector

FlowDirector是西湖大学AGI Lab团队联合中南大学推出的新型无训练(training-free)视频编辑框架,专门用在根据自然语言指令对视频内容进行精确编辑。框架直...
阅读原文

DreamActor-H1

DreamActor-H1是字节跳动推出的基于扩散变换器(Diffusion Transformer, DiT)的框架,支持从配对的人类和产品图像生成高质量的人类产品演示视频。框架注入人...
阅读原文

Code Researcher

Code Researcher是微软研究院推出的深度研究Agent工具,专门用于处理大型系统代码库及其提交历史,自动化修复系统代码崩溃问题。通过三个阶段工作:分析(Ana...
阅读原文

Seaweed APT2

Seaweed APT2是字节跳动推出的创新的AI视频生成模型,通过自回归对抗后训练(AAPT)技术,将双向扩散模型转化为单向自回归生成器,实现高效、高质量的视频生成。
阅读原文

MAGREF

MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主...
阅读原文

Hunyuan3D-2.1

Hunyuan3D-2.1 是腾讯混元团队推出的开源项目,专注于从图像生成高保真 3D 资产。具备基于物理的渲染(PBR)材质合成能力,能生成逼真的纹理和材质,如金属反...
阅读原文

LLIA

LLIA(Low-Latency Interactive Avatars)是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成,支持实现低延...
阅读原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...
阅读原文

SeedVR2

SeedVR2是字节跳动推出的新型单步视频修复(Video Restoration, VR)模型,基于扩散模型和对抗性后训练(Adversarial Post-Training, APT)技术。模型基于自...
阅读原文

HistAgent

HistAgent 是普林斯顿大学 AI 实验室与复旦大学历史学系联合推出的专为历史研究设计的人工智能助手系统。解决历史研究中多模态信息处理、跨语言分析和复杂推...
阅读原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构(JEPA),基于自监督学习...
阅读原文

豆包大模型1.6

豆包大模型1.6(Doubao-Seed-1.6)是字节跳动推出的多模态深度思考大模型。模型支持auto、thinking和non-thinking三种思考模式,能处理文字、图片、视频等多...
阅读原文

Reor

Reor是开源的本地化AI个人知识管理应用。应用支持自动链接相关笔记、语义搜索和Q&A功能,用户基于类似Obsidian的Markdown编辑器进行笔记编辑。Reor基于Ol...
阅读原文

Seedance 1.0

Seedance 1.0 是字节跳动Seed团队推出的视频生成基础模型。模型支持文字与图片输入,能生成多镜头无缝切换的1080p高品质视频,具备原生多镜头叙事能力,能进...
阅读原文
14041424344166