AI项目和框架 - 第 12 页

Qwen-Scope

Qwen-Scope 是阿里通义千问团队开源的大模型可解释性工具套件，基于稀疏自编码器（SAE）技术，在 Qwen3/Qwen3.5 系列模型隐藏层提取可解释特征。

阅读原文

AI工具

2个月前

Hy-MT1.5-1.8B-1.25bit

Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队推出的极致量化压缩版手机端离线翻译大模型。模型基于混元翻译大模型 Hy-MT1.5-1.8B（18亿参数）打造，通过创新的 Sher...

阅读原文

AI工具

2个月前

FlashQLA

FlashQLA 是通义实验室开源的基于 TileLang 实现的高性能线性注意力算子库。FlashQLA 通过算子融合、Gate 驱动卡内序列并行及 Warp-Specialized 优化，在 Hop...

阅读原文

AI工具

2个月前

Ling-2.6-1T

Ling-2.6-1T 是百灵大模型（InclusionAI）最新开源的万亿参数综合旗舰模型，专为 Agent、Coding 和复杂工作流设计。模型采用 MLA 与 Linear Attention 混合架...

阅读原文

AI工具

2个月前

MindDR 1.5

MindDR 1.5 是理想汽车信息智能体团队推出的多智能体深度研究框架，用仅约 30B 参数规模在 DeepResearch Bench 取得 52.54 分，达到业界领先水平。

阅读原文

AI工具

2个月前

SenseNova U1

SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型，在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE，构建统一表征空间...

阅读原文

AI工具

2个月前

Nemotron 3 Nano Omni

Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列，是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构，将视觉、音频、文...

阅读原文

AI工具

2个月前

One-Eval

One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架，基于 DataFlow 与 LangGraph 构建，主打 NL2Eval（自然语言转评测）能力。

阅读原文

AI工具

2个月前

Step Image Edit 2

Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型，参数量仅 3.5B，能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒，...

阅读原文

AI工具

2个月前

星火X2-Flash

星火X2-Flash是科大讯飞发布的MoE架构大语言模型，总参数30B，支持256K超长上下文，基于华为昇腾910B国产算力集群训练。

阅读原文

AI工具

2个月前

EAPO

EAPO是阿里通义实验室推出的长文本推理强化学习框架，通过引入"证据奖励"机制，将监督信号从最终答案下沉到证据提取过程。

阅读原文

AI工具

2个月前

Tolaria

Tolaria 是面向 AI 时代的开源本地笔记工具，由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsi...

阅读原文

AI工具

2个月前

TIPSv2

TIPSv2 是 Google DeepMind 推出的多模态模型，模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新，解决密集图像块与文本嵌入的精准对齐难题。

阅读原文

AI工具

2个月前

guizang-ppt-skill

guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill，能将提示词转化为单文件 HTML 横向翻页PPT。

阅读原文

AI工具

2个月前

find-skill

find-skills 是 Vercel Labs 推出的「元 Skill」，属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills 包中，安装后可直接...

阅读原文

AI工具

2个月前