AI项目和框架

html-ppt-skill

html-ppt-skill 是基于 HTML 的 AI 演示文稿 Skill,工具支持输出浏览器原生支持的 HTML 文件,内置 36 套主题、31 种布局、47 个动效和 15 套完整模板,Agen...
阅读原文

SwarmFlow

SwarmFlow 是 openJiuwen 开源的多智能体可控工作流编排框架,将编排与智能分离,协作流程由系统稳定执行,推理判断交给 Agent 处理。
阅读原文

EvoQuality

EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。
阅读原文

Kimi K2.7 Code

Kimi K2.7 Code 是月之暗面(Moonshot AI)开源的新一代编程专用模型。相比 K2.6,在长上下文编程场景的指令遵循能力、长程任务性能上显著提升,改善了过度思...
阅读原文

DiffusionGemma

DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去...
阅读原文

Hojo-ASR-V1

Hojo-ASR-V1 是初创团队 Hojo 开源的自动语音识别模型,采用Whisper 特征提取 + Qwen3-Omni 音频编码 + Conformer 适配 + Qwen3-4B 语言模型解码的架构。
阅读原文

HPC-Ops

HPC-Ops是腾讯混元AI Infra团队开源的工业级高性能大模型推理算子库,覆盖Attention、MoE、GEMM、采样及通信融合等核心模块,原生支持BF16/FP8与混合精度。
阅读原文

HiDream-O1-Image-1.5

HiDream-O1-Image-1.5 是智象未来推出的商用图像生成大模型,基于原生全模态 UiT 架构。在 Artificial Analysis 文生图榜单中用 ELO 1265 位列全球第三、中国...
阅读原文

SpaceMind

SpaceMind是科大讯飞推出的智慧空间Agentic架构,将空间升级为具备感知、理解、记忆、决策与执行能力的L2.5阶段主动智能体。
阅读原文

Khala

Khala 是中央音乐学院与清华大学联合推出的开源 AI 音乐大模型,面向高保真歌曲生成。模型采用 64 层深度声学 Token 层级结构,支持根据文本描述和歌词条件生...
阅读原文

North Mini Code

North Mini Code 是 Cohere 开源的 Agentic 编码模型。模型采用 MoE 架构,总参数 30B、激活仅 3B,支持 256K 上下文与 64K 输出。
阅读原文

MusaCoder

MusaCoder是摩尔线程开源的面向GPU底层算子生成的专用代码大模型,支持从PyTorch算子自动生成高性能CUDA/MUSA Kernel。
阅读原文

cmux

cmux 是专为 AI Coding Agent 设计的开源终端工具,通过垂直标签页聚合展示 Git 分支、PR 状态、端口及 Agent 通知,配合智能通知环精准定位待确认任务。
阅读原文

Claude Fable 5

Claude Fable 5 是 Anthropic 推出的最强 AI 模型,是 thos-class 安全版旗舰模型,底层与Claude Mythos 5 完全一致,加装了保守的安全护栏。
阅读原文

SCAIL-2

SCAIL-2是智谱联合清华大学刘永进教授课题组开源的影视级角色动画框架第二代。基于扩散变换器(DiT)架构,采用端到端训练直接实现高质量动画迁移,无需传统...
阅读原文
123196