AI项目和框架

MindDR 1.5

MindDR 1.5 是理想汽车信息智能体团队推出的多智能体深度研究框架,用仅约 30B 参数规模在 DeepResearch Bench 取得 52.54 分,达到业界领先水平。
阅读原文

SenseNova U1

SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间...
阅读原文

Nemotron 3 Nano Omni

Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,将视觉、音频、文...
阅读原文

One-Eval

One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架,基于 DataFlow 与 LangGraph 构建,主打 NL2Eval(自然语言转评测)能力。
阅读原文

Step Image Edit 2

Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,...
阅读原文

星火X2-Flash

星火X2-Flash是科大讯飞发布的MoE架构大语言模型,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。
阅读原文

EAPO

EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入"证据奖励"机制,将监督信号从最终答案下沉到证据提取过程。
阅读原文

Tolaria

Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsi...
阅读原文

TIPSv2

TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。
阅读原文

guizang-ppt-skill

guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。
阅读原文

find-skill

find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills 包中,安装后可直接...
阅读原文

GoSkill

GoSkill 是面向长任务与复杂任务的推进工具。工具通过装饰器或类方式封装任务,将"一次性 Skill 调用"升级为"围绕目标持续推进,直到满足成功...
阅读原文

Claude Design系统提示词

Claude Design系统提示词是Anthropic为Claude在Design模式下设定的核心指令文件,由安全研究员Pliny泄露至GitHub。
阅读原文

StepAudio 2.5 ASR

StepAudio 2.5 ASR 是阶跃星辰推出的新一代自动语音识别模型,专为语音转写、会议纪要与长音频处理设计。模型采用 Audio Encoder + Linear Adapter + 4B LLM ...
阅读原文

GBrain

GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 OpenClaw、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转化...
阅读原文
123185