AI项目和框架

MiniMax H3

MiniMax H3 是稀宇科技推出的通用全模态生成模型，打破传统任务与模态边界，支持对文本、图像、视频、音频的统一理解与原生生成。模型能输出原生双声道音视频...

阅读原文

AI工具

2天前

Grok Voice Think Fast 2.0

Grok Voice Think Fast 2.0 是 SpaceXAI（xAI）推出的端到端语音到语音模型，采用原生语音到语音架构，无需经过识别—推理—合成多阶段流程即可直接理解并回应...

阅读原文

AI工具

3天前

AngelSpec

AngelSpec 是腾讯混元团队开源的端到端推测解码训练框架，基于 TorchSpec 构建，支持 MTP 自回归与 DFly 块并行共 6 种草稿架构。推理与训练解耦，推理引擎经...

阅读原文

AI工具

3天前

Codex Security CLI

Codex Security CLI是OpenAI开源的AI代码安全扫描CLI工具，前身为Codex内置的闭源安全插件。工具基于大模型语义理解自动扫描代码漏洞，深度验证攻击路径真实...

阅读原文

AI工具

3天前

Lyria 3.5

Lyria 3.5是Google DeepMind 在 Google Flow Music 中推出的新一代音乐生成模型，实现音乐性、歌词质量、人声表现力与创作控制四项核心升级。

阅读原文

AI工具

3天前

Instella-MoE

Instella-MoE 是 AMD 开源的混合专家语言模型系列，总参数量 16B、激活参数量 2.8B，采用 27 层解码器架构。模型基于 AMD Instinct MI300X / MI325X GPU 及 R...

阅读原文

AI工具

4天前

JiuwenSwarm

JiuwenSwarm是华为2012实验室、华为云、终端小艺等团队联合构建的开源AI Agent平台，也是首个面向鸿蒙PC的开源AI统一工作台。平台采用多智能体协同架构，支持...

阅读原文

AI工具

4天前

Qwen-Audio-Agent

Qwen-Audio-Agent 是阿里语音AI团队推出的开源实时语音 Agent 框架，基于 Qwen-Audio-3.0-Realtime 模型构建。框架作为统一的实时语音入口层，让用户通过自然...

阅读原文

AI工具

4天前

Midjourney V8.2

Midjourney V8.2是Midjourney推出的最新AI图像生成模型版本，在提示词理解、风格参考逻辑和出图稳定性上实现全面升级。

阅读原文

AI工具

5天前

水杉输入法

水杉输入法是基于 Windows 原生 TSF 框架的免费开源中文输入法，专为 Win10/Win11 设计。与多数基于 RIME 的方案不同，工具完全自研，原生兼容 UWP 及高 DPI ...

阅读原文

AI工具

5天前

PerceptionBench

PerceptionBench是月之暗面开源的视觉感知诊断基准。PerceptionBench 从 42 个现有评测集中前沿模型的失败案例中，归纳出 10 项原子视觉感知能力，并构建 3,0...

阅读原文

AI工具

5天前

UniWorld-View

UniWorld-View 是兔展智能联合北京大学、鹏城实验室推出的开源世界模型，登顶李飞飞团队 WorldScore 世界模型评测榜单。模型基于单张图片或一段视频，可按指...

阅读原文

AI工具

5天前

AlphaEval

AlphaEval 是跨赴科技联合推出的生产级 Agent 评测框架。框架覆盖 7 家真实企业场景的 94 个生产任务，构建从需求澄清到 App 交付的完整可复现链路。

阅读原文

AI工具

5天前

Nanbeige4.2-3B

Nanbeige4.2-3B是BOSS直聘南北阁实验室推出的通用Agent小模型，仅3B参数却在代码智能体、办公工作流、复杂工具调用等Agent任务上超越Qwen3.5-9B与Gemma4-12B...

阅读原文

AI工具

6天前

OpenWorker

OpenWorker是吴恩达发布的开源AI桌面代理，采用MIT许可证完全免费。非聊天机器人，是"交付成果"的本地优先AI同事。用户提出目标结果，直接产出可用...

阅读原文

AI工具

7天前