AI工具

HTML Anything

HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器,内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态,可自动识别本地 18...
阅读原文

DSpark

DSpark 是 DeepSeek 联合北京大学开源的推测解码加速框架,专门解决大模型自回归生成速度慢、像"挤牙膏"的痛点。采用半自回归生成架构,通过轻量级...
阅读原文

GPT-5.6

GPT-5.6 是 OpenAI 推出的最新一代大语言模型,目前受美国政府监管要求仅以"有限预览"形式向少数可信合作伙伴开放。系列首次采用天文学命名体系,...
阅读原文

向尾

向尾是阿里云推出的AI互动故事创作与阅读平台,主打创作与沉浸式互动。平台支持从零起稿、文稿续写、长篇小说分章规划三种模式,覆盖网文、剧本、儿童故事等...
阅读原文

PhoneBuddy

PhoneBuddy 是腾讯混元团队开源的 4B 参数手机 Agent 模型,核心研究如何在真实手机场景中训练可用的 AI Agent。
阅读原文

Mistral OCR 4

Mistral OCR 4 是 Mistral AI 推出的最新一代文档理解模型。模型支持从 PDF、图片、演示文稿等复杂文档中提取文本,能返回带边框定位、区域类型分类和置信度...
阅读原文

TRAE Work Design

TRAE Work Design 是字节跳动旗下 AI 办公工具 TRAE Work 推出的全新设计模式,面向设计师、开发者、产品经理等角色,支持通过自然语言对话直接生成 UI 设计...
阅读原文

Agent Mail

Agent Mail 是腾讯QQ邮箱推出的AI Agent专属邮箱服务,与个人邮箱完全隔离,原生适配Agent框架。Agent可通过微信扫码授权获得独立邮箱地址,安全地收发邮件、...
阅读原文

Ornith-1.0

Ornith-1.0 是 DeepReinforce 团队推出的专为 Agentic 编程任务设计的开源大模型系列,模型基于 Gemma 4 与 Qwen 3.5 预训练基座,采用自改进训练框架,在代...
阅读原文

SkillOpt

SkillOpt是微软开源的Agent技能文档优化工具。工具将深度学习训练逻辑引入文本空间,把skill.md视为可训练参数,通过轨迹分析生成编辑方向,用文本学习率约束...
阅读原文

Confucius4-TTS

Confucius4-TTS 是网易有道开源的 1.3B 参数多语言语音合成引擎。模型只需 3 秒参考音频可零样本克隆音色,无需参考文本,支持中、英、日、韩等 14 种语言跨...
阅读原文

MMSkills

MMSkills 是上海交通大学与小红书联合推出的面向通用视觉 Agent 的多模态技能框架,支持将可复用技能从纯文本步骤扩展为包含文本流程、运行时状态卡片和多视...
阅读原文

Otty

Otty 是 Typora 团队推出的原生 macOS 终端应用,专为频繁使用 AI Agent 的开发者设计。工具在传统终端的基础上,原生集成多 Agent 面板管理、会话恢复、对话...
阅读原文

JoyAI-VL-Interaction

JoyAI-VL-Interaction 是京东 Joy Future Academy 开源的实时视频视觉语言交互模型,是全球首个全栈开源的 interaction 模型系统。
阅读原文

Honestly

Honestly 是面向品牌方的 AI 社交情报与联盟营销分析平台,核心定位是"将社交媒体上的真实产品讨论转化为可执行的商业信号"。通过爬取 Reddit、Tik...
阅读原文
123347