AI项目和框架 - 第 94 页

A2A

A2A（Agent2Agent）是谷歌开源的首个标准智能体交互协议，让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式，打破系统孤岛，让智能体安全...

阅读原文

AI工具

1年前 (2025)

DCEdit

DCEdit 是新型的双层控制图像编辑方法，是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略（PSL），用视觉和文本自注意力优化交叉注意力...

阅读原文

AI工具

1年前 (2025)

LocAgent

LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的，专注于代码定位任务的框架，帮助开发者快速准确地找到代码库中需要修改的部分。LocAgent将代...

阅读原文

AI工具

1年前 (2025)

OmniSVG

OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG（可缩放矢量图形）生成模型。基于预训练视觉语言模型（VLM），通过创新的 SVG 标记化方法...

阅读原文

AI工具

1年前 (2025)

Lipsync-2

Lipsync-2 是 Sync Labs 推出的全球首个零-shot 嘴型同步模型。无需针对特定演讲者进行预训练，能即时学习并生成符合独特说话风格的嘴型同步效果。

阅读原文

AI工具

1年前 (2025)

Llama Nemotron

Llama Nemotron是NVIDIA推出的一系列推理模型，专注于推理和多种智能代理（agentic AI）任务。模型基于Llama开源模型，经过NVIDIA的后训练，加入推理能力，在...

阅读原文

AI工具

1年前 (2025)

Dream-7B

Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型，是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码，预训练使用5...

阅读原文

AI工具

1年前 (2025)

Miracle F1

Miracle F1 是美图 WHEE 推出的全新AI图像生成模型。具备强大的图像生成能力，能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果，生成的图像真实...

阅读原文

AI工具

1年前 (2025)

DeepCoder-14B-Preview

DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型，基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。DeepCoder-14B-Preview基...

阅读原文

AI工具

1年前 (2025)

GitHub MCP Server

GitHub MCP Server 是GitHub 官方推出的基于 Model Context Protocol (MCP) 的服务器工具，GitHub MCP Server能无缝集成 GitHub API，为开发者提供高级自动化...

阅读原文

AI工具

1年前 (2025)

Nova Sonic

Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中，能根据说话者的语调、风格等声学上下文调整生成的语音响应，对话...

阅读原文

AI工具

1年前 (2025)

Step-R1-V-Mini

Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出，具备良好的指令遵循和通用能力，能高精度感知图像完成复杂推理任务。模型在视...

阅读原文

AI工具

1年前 (2025)

SeniorTalk

SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室（HLT Lab）推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超...

阅读原文

AI工具

1年前 (2025)

ChildMandarin

ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室（HLT Lab）共同推出的，针对3-5岁儿童的普通话语音数据集。数据集包含41.25小时的语音...

阅读原文

AI工具

1年前 (2025)

SkyReels-A2

SkyReels-A2是昆仑万维推出的可控视频生成框架，支持根据文本提示将任意视觉元素（如人物、物体、背景）组合成合成视频，严格保持与每个元素的参考图像的一致...

AI工具

1年前 (2025)