AI项目和框架

Qwen-Scope

Qwen-Scope 是阿里通义千问团队开源的大模型可解释性工具套件,基于稀疏自编码器(SAE)技术,在 Qwen3/Qwen3.5 系列模型隐藏层提取可解释特征。
阅读原文

Hy-MT1.5-1.8B-1.25bit

Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队推出的极致量化压缩版手机端离线翻译大模型。模型基于混元翻译大模型 Hy-MT1.5-1.8B(18亿参数)打造,通过创新的 Sher...
阅读原文

FlashQLA

FlashQLA 是通义实验室开源的基于 TileLang 实现的高性能线性注意力算子库。FlashQLA 通过算子融合、Gate 驱动卡内序列并行及 Warp-Specialized 优化,在 Hop...
阅读原文

Ling-2.6-1T

Ling-2.6-1T 是百灵大模型(InclusionAI)最新开源的万亿参数综合旗舰模型,专为 Agent、Coding 和复杂工作流设计。模型采用 MLA 与 Linear Attention 混合架...
阅读原文

MindDR 1.5

MindDR 1.5 是理想汽车信息智能体团队推出的多智能体深度研究框架,用仅约 30B 参数规模在 DeepResearch Bench 取得 52.54 分,达到业界领先水平。
阅读原文

SenseNova U1

SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间...
阅读原文

Nemotron 3 Nano Omni

Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,将视觉、音频、文...
阅读原文

One-Eval

One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架,基于 DataFlow 与 LangGraph 构建,主打 NL2Eval(自然语言转评测)能力。
阅读原文

Step Image Edit 2

Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,...
阅读原文

星火X2-Flash

星火X2-Flash是科大讯飞发布的MoE架构大语言模型,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。
阅读原文

EAPO

EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入"证据奖励"机制,将监督信号从最终答案下沉到证据提取过程。
阅读原文

Tolaria

Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsi...
阅读原文

TIPSv2

TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。
阅读原文

guizang-ppt-skill

guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。
阅读原文

find-skill

find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills 包中,安装后可直接...
阅读原文
11011121314197