AI工具

BrowseComp

BrowseComp 是 OpenAI 开源的用于评估 AI 代理网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育、音乐、电子...
阅读原文

日日新SenseNova V6

日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视频的原生融合。日日新SenseNova V6在...
阅读原文

DevDocs

DevDocs 是专为程序员和开发者设计的开源技术文档爬取和处理工具,基于智能爬虫技术,快速爬取、整理技术文档,将理解文档的时间从数周缩短至几小时。DevDocs...
阅读原文

MoLing

MoLing 是无依赖的本地办公自动化助手,是基于计算机和浏览器使用的 MCP 服务器。MoLing 基于操作系统 API 实现系统交互,支持文件系统操作(如读写、合并、...
阅读原文

atypica.AI

atypica.AI 是专注于商业研究的智能体框架,通过语言模型快速生成用户洞察。通过虚拟访谈任务,模拟真实用户行为,快速收集和分析数据,生成详细的研究报告。...
阅读原文

Multi-SWE-bench

Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript...
阅读原文

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延迟的 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时,引入思考能力。
阅读原文

A2A

A2A(Agent2Agent)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智能体安全...
阅读原文

DCEdit

DCEdit 是新型的双层控制图像编辑方法,是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略(PSL),用视觉和文本自注意力优化交叉注意力...
阅读原文

LocAgent

LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的,专注于代码定位任务的框架,帮助开发者快速准确地找到代码库中需要修改的部分。LocAgent将代...
阅读原文

OmniSVG

OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化方法...
阅读原文

小卡健康

小卡健康是北京快欧科技推出的AI健康管理应用,专注于帮助用户轻松管理热量摄入与消耗。核心功能包括拍照识别热量,用户只需对食物拍照,APP能快速准确地识别...
阅读原文

Firebase Studio

Firebase Studio 是谷歌推出基于云端的全栈应用开发环境,专注于构建和交付具有 AI 功能的高质量应用。Firebase Studio整合 Project IDX 和 Firebase 的专用 ...
阅读原文

多面

多面是一款为年轻求职者和企业提供服务的AI招聘平台。通过AI在线面试、魔镜智能评价和模拟面试三大功能,帮助求职者提升面试技巧、增强自信心,助力企业高效...
阅读原文

Data Agent

Data Agent是火山引擎推出的企业级数据智能体,专注于数据分析和智能营销。Data Agent整合和分析企业内部的结构化与非结构化数据,生成深度研究报告,制定营...
阅读原文
13233343536230