AI工具

A2A

A2A(Agent2Agent)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智能体安全...
阅读原文

DCEdit

DCEdit 是新型的双层控制图像编辑方法,是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略(PSL),用视觉和文本自注意力优化交叉注意力...
阅读原文

LocAgent

LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的,专注于代码定位任务的框架,帮助开发者快速准确地找到代码库中需要修改的部分。LocAgent将代...
阅读原文

OmniSVG

OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化方法...
阅读原文

小卡健康

小卡健康是北京快欧科技推出的AI健康管理应用,专注于帮助用户轻松管理热量摄入与消耗。核心功能包括拍照识别热量,用户只需对食物拍照,APP能快速准确地识别...
阅读原文

Firebase Studio

Firebase Studio 是谷歌推出基于云端的全栈应用开发环境,专注于构建和交付具有 AI 功能的高质量应用。Firebase Studio整合 Project IDX 和 Firebase 的专用 ...
阅读原文

多面

多面是一款为年轻求职者和企业提供服务的AI招聘平台。通过AI在线面试、魔镜智能评价和模拟面试三大功能,帮助求职者提升面试技巧、增强自信心,助力企业高效...
阅读原文

Data Agent

Data Agent是火山引擎推出的企业级数据智能体,专注于数据分析和智能营销。Data Agent整合和分析企业内部的结构化与非结构化数据,生成深度研究报告,制定营...
阅读原文

Lipsync-2

Lipsync-2 是 Sync Labs 推出的全球首个零-shot 嘴型同步模型。无需针对特定演讲者进行预训练,能即时学习并生成符合独特说话风格的嘴型同步效果。
阅读原文

Llama Nemotron

Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在...
阅读原文

Dream-7B

Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5...
阅读原文

Miracle F1

Miracle F1 是美图 WHEE 推出的全新AI图像生成模型。具备强大的图像生成能力,能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果,生成的图像真实...
阅读原文

扣子罗盘

扣子罗盘是专为个人开发者及创业团队设计的工具平台,支持开发者快速搭建 AI Agent。扣子罗盘提供从开发、调试、评估到监控的全生命周期管理能力,涵盖 Promp...
阅读原文

DeepCoder-14B-Preview

DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。DeepCoder-14B-Preview基...
阅读原文

Cloudflare Agents

Cloudflare Agents 是用在构建智能代理(Agent)的平台,支持实现具有自主性、目标导向推理和自适应决策能力的“代理型AI”(Agentic AI)。Cloudflare Agents...
阅读原文
11314151617211