AI工具

GLM-5.2

GLM-5.2是智谱AI推出的最新旗舰开源大模型,采用MIT协议开源,主打Agentic Coding与超长上下文能力。模型支持1M tokens上下文窗口,可处理大规模代码库与复杂...
阅读原文

PP-OCRv6

PP-OCRv6 是百度飞桨 PaddleOCR 团队推出的第六代开源 OCR 模型,首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖从浏览器端到服务器...
阅读原文

声忆

声忆是专为 macOS 打造的语音输入法,主打"说得比打字快"。按住右 Option 说话,松开后仅需 1.4 秒即可将语音转为文字并自动插入光标处,支持中英...
阅读原文

openPangu 2.0

openPangu 2.0 是华为开源的盘古大模型重大升级版,提供最高 505B 参数的 Pro 版本与 92B 的 Flash 版本,模型统一搭载 512K 超长上下文,原生深度调优昇腾与...
阅读原文

SkillSpector

SkillSpector 是 NVIDIA 开源的 AI Agent 技能安全扫描工具,能在安装 Claude Code、Codex CLI、Gemini CLI 等平台的技能之前自动检测漏洞、恶意模式及安全风...
阅读原文

iArt.ai

iArt.ai 是 AI 驱动的动态图形生成工具,定位为 Adobe After Effects 的零学习曲线替代方案。用户只需用自然语言描述创意、上传 Figma 设计或输入音频,AI 代...
阅读原文

html-ppt-skill

html-ppt-skill 是基于 HTML 的 AI 演示文稿 Skill,工具支持输出浏览器原生支持的 HTML 文件,内置 36 套主题、31 种布局、47 个动效和 15 套完整模板,Agen...
阅读原文

SwarmFlow

SwarmFlow 是 openJiuwen 开源的多智能体可控工作流编排框架,将编排与智能分离,协作流程由系统稳定执行,推理判断交给 Agent 处理。
阅读原文

EvoQuality

EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。
阅读原文

Kimi K2.7 Code

Kimi K2.7 Code 是月之暗面(Moonshot AI)开源的新一代编程专用模型。相比 K2.6,在长上下文编程场景的指令遵循能力、长程任务性能上显著提升,改善了过度思...
阅读原文

DiffusionGemma

DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去...
阅读原文

Tuanjie Cowork

Tuanjie Cowork 是 Unity 中国推出的面向 Unity引擎、团结引擎的专属 AI Agent 编程智能体。Tuanjie Cowork 基于引擎独家授权,围绕游戏项目代码结构、玩法逻...
阅读原文

Hojo-ASR-V1

Hojo-ASR-V1 是初创团队 Hojo 开源的自动语音识别模型,采用Whisper 特征提取 + Qwen3-Omni 音频编码 + Conformer 适配 + Qwen3-4B 语言模型解码的架构。
阅读原文

Decitron

Decitron 是中科闻歌推出的 AI 多主体博弈推演平台,通过世界建模、多智能体模拟与决策求解技术,将复杂决策问题拆解为主体、变量、路径和触发条件,在沙盘观...
阅读原文

HPC-Ops

HPC-Ops是腾讯混元AI Infra团队开源的工业级高性能大模型推理算子库,覆盖Attention、MoE、GEMM、采样及通信融合等核心模块,原生支持BF16/FP8与混合精度。
阅读原文
123343