AI工具

html-ppt-skill

html-ppt-skill 是基于 HTML 的 AI 演示文稿 Skill,工具支持输出浏览器原生支持的 HTML 文件,内置 36 套主题、31 种布局、47 个动效和 15 套完整模板,Agen...
阅读原文

SwarmFlow

SwarmFlow 是 openJiuwen 开源的多智能体可控工作流编排框架,将编排与智能分离,协作流程由系统稳定执行,推理判断交给 Agent 处理。
阅读原文

EvoQuality

EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。
阅读原文

Kimi K2.7 Code

Kimi K2.7 Code 是月之暗面(Moonshot AI)开源的新一代编程专用模型。相比 K2.6,在长上下文编程场景的指令遵循能力、长程任务性能上显著提升,改善了过度思...
阅读原文

DiffusionGemma

DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去...
阅读原文

Tuanjie Cowork

Tuanjie Cowork 是 Unity 中国推出的面向 Unity引擎、团结引擎的专属 AI Agent 编程智能体。Tuanjie Cowork 基于引擎独家授权,围绕游戏项目代码结构、玩法逻...
阅读原文

Hojo-ASR-V1

Hojo-ASR-V1 是初创团队 Hojo 开源的自动语音识别模型,采用Whisper 特征提取 + Qwen3-Omni 音频编码 + Conformer 适配 + Qwen3-4B 语言模型解码的架构。
阅读原文

Decitron

Decitron 是中科闻歌推出的 AI 多主体博弈推演平台,通过世界建模、多智能体模拟与决策求解技术,将复杂决策问题拆解为主体、变量、路径和触发条件,在沙盘观...
阅读原文

HPC-Ops

HPC-Ops是腾讯混元AI Infra团队开源的工业级高性能大模型推理算子库,覆盖Attention、MoE、GEMM、采样及通信融合等核心模块,原生支持BF16/FP8与混合精度。
阅读原文

Meoo CLI

Meoo CLI 是阿里秒悟Meoo推出的开源命令行工具,定位为本地 AI 编程 Agent 与云端基础设施之间的连接入口。工具解决了本地 AI 编程助手,如 Claude Code、Cod...
阅读原文

Meshy 3D Agent

Meshy 3D Agent 是 Meshy 推出全球首个 3D 创作 AI Agent,通过多轮对话将用户的模糊想法转化为可直接使用的 3D 资产。
阅读原文

HiDream-O1-Image-1.5

HiDream-O1-Image-1.5 是智象未来推出的商用图像生成大模型,基于原生全模态 UiT 架构。在 Artificial Analysis 文生图榜单中用 ELO 1265 位列全球第三、中国...
阅读原文

SpaceMind

SpaceMind是科大讯飞推出的智慧空间Agentic架构,将空间升级为具备感知、理解、记忆、决策与执行能力的L2.5阶段主动智能体。
阅读原文

Khala

Khala 是中央音乐学院与清华大学联合推出的开源 AI 音乐大模型,面向高保真歌曲生成。模型采用 64 层深度声学 Token 层级结构,支持根据文本描述和歌词条件生...
阅读原文

North Mini Code

North Mini Code 是 Cohere 开源的 Agentic 编码模型。模型采用 MoE 架构,总参数 30B、激活仅 3B,支持 256K 上下文与 64K 输出。
阅读原文
123343