AI工具 - 第 154 页

Piece it Together

Piece it Together （PiT）是Bria AI等机构推出的创新图像生成框架，专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识，将用户提供的碎片...

阅读原文

AI工具

1年前 (2025)

HitPaw Univd

HitPaw Univd 是功能强大的人工智能驱动的多功能视频转换工具。支持将视频和音频文件转换为1000多种格式，涵盖主流编解码器，满足不同设备和平台的需求。无损...

阅读原文

AI工具

1年前 (2025)

RF-DETR

RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值（mAP）的实时模型，性能优于现有的目标检测模型。RF-DETR结合LW...

阅读原文

AI工具

1年前 (2025)

Bolt3D

Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术，是潜在扩散模型，能在单个 GPU 上，仅需不到七秒的时间，直接从一...

阅读原文

AI工具

1年前 (2025)

Smithery

Smithery 是 MCP 服务器托管平台。基于 Model Context Protocol（MCP）规范，提供集中的枢纽，用在发现、托管和分发 MCP 服务器。Smithery 基于标准化的接口...

阅读原文

AI工具

1年前 (2025)

ima知识号

ima知识号是腾讯旗下ima推出的全新功能，为知识库创作者提供集中发布和管理知识库的平台。ima知识号配备数据分析工具，创作者能直观地查看知识库的数量、参与...

阅读原文

AI工具

1年前 (2025)

Qwen2.5-Omni

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型，拥有7B参数，Qwen2.5-Omni具备强大的多模态感知能力，能处理文本、图像、音频和视频输入，支持流式文...

阅读原文

AI工具

1年前 (2025)

Cosmos-Reason1

Cosmos-Reason1 是 NVIDIA 推出的一系列多模态大型语言模型，基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型：Cosmos-Reason1-8B 和 Cosmo...

阅读原文

AI工具

1年前 (2025)

Video-T1

Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术，基于测试时扩展（Test-Time Scaling，TTS）提升视频生成的质量和一致性。传统视频生成模型在训...

阅读原文

AI工具

1年前 (2025)

Oliva

Oliva 是开源的语音RAG助手，结合 Langchain 和 Superlinked 技术，基于语音驱动的 RAG（检索增强生成）架构，帮助用户在 Qdrant 向量数据库中实时搜索信息。...

阅读原文

AI工具

1年前 (2025)

Mureka O1

Mureka O1是昆仑万维发布的全球首款音乐推理大模型，全球首个引入“思维链”（Chain of Thought，CoT）技术的音乐模型，Mureka O1在推理过程中加入思考与自我批...

阅读原文

AI工具

1年前 (2025)

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型，支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL（in-context learning）技术，使声场更加开阔...

阅读原文

AI工具

1年前 (2025)

Browseragent

Browseragent是基于浏览器的AI自动化工具，直接在浏览器中创建和运行AI工作流，无需API调用费用，实现零成本的无限次执行。Browseragent基于无代码可视化编辑...

阅读原文

AI工具

1年前 (2025)

pdf-craft

pdf-craft 是用在将 PDF 文件转换为其他格式（如 Markdown、EPUB）的工具，专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容，过滤掉页眉、页脚、...

阅读原文

AI工具

1年前 (2025)

TaoAvatar

TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术，能生成照片级逼真的3D全身虚拟形象，支持高分辨率渲染且...

阅读原文

AI工具

1年前 (2025)