AI项目和框架

GLM-5.2

GLM-5.2是智谱AI推出的最新旗舰开源大模型,采用MIT协议开源,主打Agentic Coding与超长上下文能力。模型支持1M tokens上下文窗口,可处理大规模代码库与复杂...
阅读原文

PP-OCRv6

PP-OCRv6 是百度飞桨 PaddleOCR 团队推出的第六代开源 OCR 模型,首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖从浏览器端到服务器...
阅读原文

openPangu 2.0

openPangu 2.0 是华为开源的盘古大模型重大升级版,提供最高 505B 参数的 Pro 版本与 92B 的 Flash 版本,模型统一搭载 512K 超长上下文,原生深度调优昇腾与...
阅读原文

SkillSpector

SkillSpector 是 NVIDIA 开源的 AI Agent 技能安全扫描工具,能在安装 Claude Code、Codex CLI、Gemini CLI 等平台的技能之前自动检测漏洞、恶意模式及安全风...
阅读原文

html-ppt-skill

html-ppt-skill 是基于 HTML 的 AI 演示文稿 Skill,工具支持输出浏览器原生支持的 HTML 文件,内置 36 套主题、31 种布局、47 个动效和 15 套完整模板,Agen...
阅读原文

SwarmFlow

SwarmFlow 是 openJiuwen 开源的多智能体可控工作流编排框架,将编排与智能分离,协作流程由系统稳定执行,推理判断交给 Agent 处理。
阅读原文

EvoQuality

EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。
阅读原文

Kimi K2.7 Code

Kimi K2.7 Code 是月之暗面(Moonshot AI)开源的新一代编程专用模型。相比 K2.6,在长上下文编程场景的指令遵循能力、长程任务性能上显著提升,改善了过度思...
阅读原文

DiffusionGemma

DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去...
阅读原文

Hojo-ASR-V1

Hojo-ASR-V1 是初创团队 Hojo 开源的自动语音识别模型,采用Whisper 特征提取 + Qwen3-Omni 音频编码 + Conformer 适配 + Qwen3-4B 语言模型解码的架构。
阅读原文

HPC-Ops

HPC-Ops是腾讯混元AI Infra团队开源的工业级高性能大模型推理算子库,覆盖Attention、MoE、GEMM、采样及通信融合等核心模块,原生支持BF16/FP8与混合精度。
阅读原文

HiDream-O1-Image-1.5

HiDream-O1-Image-1.5 是智象未来推出的商用图像生成大模型,基于原生全模态 UiT 架构。在 Artificial Analysis 文生图榜单中用 ELO 1265 位列全球第三、中国...
阅读原文

SpaceMind

SpaceMind是科大讯飞推出的智慧空间Agentic架构,将空间升级为具备感知、理解、记忆、决策与执行能力的L2.5阶段主动智能体。
阅读原文

Khala

Khala 是中央音乐学院与清华大学联合推出的开源 AI 音乐大模型,面向高保真歌曲生成。模型采用 64 层深度声学 Token 层级结构,支持根据文本描述和歌词条件生...
阅读原文

North Mini Code

North Mini Code 是 Cohere 开源的 Agentic 编码模型。模型采用 MoE 架构,总参数 30B、激活仅 3B,支持 256K 上下文与 64K 输出。
阅读原文
123197