AI项目和框架 - 第 56 页

AgentCLUE-ICabin

AgentCLUE-ICabin 是专注于汽车智能座舱场景的 AI 智能体测评基准，全面评估大语言模型在智能座舱中的工具调用能力。基准基于12大常见用车场景构建，覆盖从日...

阅读原文

AI工具

9个月前

IndexTTS2

IndexTTS2是B站语音团队开发的新型文本转语音（TTS）模型，已经正式开源。模型在情感表达和时长控制方面实现了重大突破，是首个支持精确时长控制的自回归TTS...

阅读原文

AI工具

9个月前

Stand-In

Stand-In 是腾讯微信视觉团队推出的轻量级的视频生成框架，专注于生成身份保护视频。框架通过训练1%的基础模型参数，能生成高保真度、身份一致的视频，且具有...

阅读原文

AI工具

9个月前

ST-Raptor

ST-Raptor 是用在半结构化表格问答的工具，仅需一个 Excel 格式的表格和一个自然语言问题作为输入，能产生精确的答案。

阅读原文

AI工具

9个月前

Strix

Strix 是开源的 AI 驱动安全测试工具，能帮助开发人员和安全团队快速发现、验证应用程序中的漏洞。工具通过模拟真实黑客攻击，动态运行代码，减少误报。

阅读原文

AI工具

9个月前

HuMo

HuMo是清华大学和字节跳动智能创作实验室共同提出的多模态视频生成框架，专注于人类中心的视频生成。能从文本、图像和音频等多种模态输入中生成高质量、精细...

阅读原文

AI工具

9个月前

FireRedTTS-2

FireRedTTS-2 是先进的长格式流式文本转语音（TTS）系统，专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构，能实现低延迟、高保真、多...

阅读原文

AI工具

9个月前

SRPO

SRPO（Semantic Relative Preference Optimization）是腾讯混元推出的文本到图像生成模型，通过将奖励信号设计为文本条件信号，实现对奖励的在线调整，减少对...

阅读原文

AI工具

9个月前

Qwen3-Next

Qwen3-Next是阿里通义开源的新一代混合架构大模型，包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。

阅读原文

AI工具

9个月前

AutoDocs

AutoDocs 是 TrySita 开发的开源代码文档自动化工具，帮助开发者高效生成和维护代码库文档。通过深度解析代码库的抽象语法树（AST）和构建依赖图，生成准确且...

阅读原文

AI工具

9个月前

AnyI2V

AnyI2V 是复旦大学、阿里巴巴达摩院和湖畔实验室联合推出的创新图像动画生成框架。框架无需大量训练数据，能将静态条件图像（如网格、点云等）转化为动态视频...

阅读原文

AI工具

9个月前

MiniMax Music 1.5

MiniMax Music 1.5 是先进的 AI 音乐生成模型，支持最长 4 分钟的音乐创作，能根据用户输入的风格、情绪和场景等自然语言描述生成高质量的音乐作品。

阅读原文

AI工具

9个月前

K2-Think

K2-Think是阿联酋穆罕默德·本·扎耶德人工智能大学MBZUAI与G42联合推出的开源推理模型，拥有320亿参数，在数学推理、代码生成和科学知识等多领域表现出色，尤...

阅读原文

AI工具

9个月前

LMDeploy

LMDeploy 是上海人工智能实验室推出的大模型推理部署工具，能显著提升大模型的推理性能，支持多种硬件架构，包括 NVIDIA 的 Hopper 和 Ampere 系列 GPU，实现...

阅读原文

AI工具

9个月前

文心大模型X1.1

文心大模型X1.1是百度推出的深度思考模型，基于迭代式混合强化学习框架，在事实性、指令遵循能力和智能体能力上显著提升，分别提高34.8%、12.5%和9.6%。在权...

阅读原文

AI工具

9个月前