AI工具

BrowserBC

BrowserBC 是 Einsia AI 旗下 Navers Lab 发布的开源项目,核心目标是将人类在浏览器中的操作轨迹转化为可复用的自然语言技能(Skill),让 Web Agent 能&quo...
阅读原文

Vidy

Vidy是生数科技推出的AI陪伴应用,定位 AI Vibe Buddy,支持文字、语音互动。产品内置Humi等AI角色,具备关系成长记忆系统,能随对话积累理解用户习惯与情绪。
阅读原文

袋马

袋马(daimax)是高德推出的 AI 应用生成平台,主打 Vibe Coding 零代码开发。用户用自然语言描述需求,可在分钟级生成可上线的小程序或 iOS 原生应用。
阅读原文

千问输入法

千问输入法是阿里巴巴通义千问团队推出的独立AI语音输入法,主打"说得随意,写得漂亮"。底层接入千问大模型的CosyVoice语音与文本理解能力,不只是...
阅读原文

Krea 2

Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型,定位为"美学优先"的创意协作者。专注于视觉美学一致性、风格迁移和创意控制,而非单纯...
阅读原文

HTML Anything

HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器,内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态,可自动识别本地 18...
阅读原文

DSpark

DSpark 是 DeepSeek 联合北京大学开源的推测解码加速框架,专门解决大模型自回归生成速度慢、像"挤牙膏"的痛点。采用半自回归生成架构,通过轻量级...
阅读原文

GPT-5.6

GPT-5.6 是 OpenAI 推出的最新一代大语言模型,目前受美国政府监管要求仅以"有限预览"形式向少数可信合作伙伴开放。系列首次采用天文学命名体系,...
阅读原文

向尾

向尾是阿里云推出的AI互动故事创作与阅读平台,主打创作与沉浸式互动。平台支持从零起稿、文稿续写、长篇小说分章规划三种模式,覆盖网文、剧本、儿童故事等...
阅读原文

PhoneBuddy

PhoneBuddy 是腾讯混元团队开源的 4B 参数手机 Agent 模型,核心研究如何在真实手机场景中训练可用的 AI Agent。
阅读原文

Mistral OCR 4

Mistral OCR 4 是 Mistral AI 推出的最新一代文档理解模型。模型支持从 PDF、图片、演示文稿等复杂文档中提取文本,能返回带边框定位、区域类型分类和置信度...
阅读原文

TRAE Work Design

TRAE Work Design 是字节跳动旗下 AI 办公工具 TRAE Work 推出的全新设计模式,面向设计师、开发者、产品经理等角色,支持通过自然语言对话直接生成 UI 设计...
阅读原文

Agent Mail

Agent Mail 是腾讯QQ邮箱推出的AI Agent专属邮箱服务,与个人邮箱完全隔离,原生适配Agent框架。Agent可通过微信扫码授权获得独立邮箱地址,安全地收发邮件、...
阅读原文

Ornith-1.0

Ornith-1.0 是 DeepReinforce 团队推出的专为 Agentic 编程任务设计的开源大模型系列,模型基于 Gemma 4 与 Qwen 3.5 预训练基座,采用自改进训练框架,在代...
阅读原文

SkillOpt

SkillOpt是微软开源的Agent技能文档优化工具。工具将深度学习训练逻辑引入文本空间,把skill.md视为可训练参数,通过轨迹分析生成编辑方向,用文本学习率约束...
阅读原文
123348