AI工具 - 第 8 页

Qwen3.7-Plus

Qwen3.7-Plus 是通义千问推出的新一代多模态大模型，将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代...

阅读原文

AI工具

3周前

Dubbing v2

Dubbing v2 是 ElevenLabs 推出的 AI 配音模型，支持 29 种语言自动翻译配音，保留原始说话人音色与情感。模型提供双工作流模式，Auto Dub 快速生成预览，Dub...

阅读原文

AI工具

3周前

Cosmos 3

Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型，采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。

阅读原文

AI工具

3周前

Webwright

Webwright 是微软研究院开源的终端原生网页智能体框架，仅需约 1000 行代码可让 AI 模型在终端中编写 Playwright 代码、执行 bash 命令、查看日志并反复修正...

阅读原文

AI工具

3周前

ControlFoley

ControlFoley是小米开源的可控视频音效生成模型，能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频配音任务，通过自研时空音...

阅读原文

AI工具

3周前

OmniVoice Studio

OmniVoice Studio 是全本地运行的开源 ElevenLabs 替代方案，提供跨平台桌面客户端，支持零样本语音克隆、声音设计、视频自动配音、语音听写等功能，覆盖 646...

阅读原文

AI工具

3周前

墨见

墨见是墨刀推出的 AI 协作平台，专为一人公司与超级个体打造。平台搭载 OpenClaw 引擎，内置产品经理、UI/视觉设计师、前后端工程师、增长运营师等虚拟合伙人...

阅读原文

AI工具

3周前

MiniMax M3

MiniMax M3是MiniMax推出的全新AI模型，具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构，支持1M超长上下文，效率提升20倍。

阅读原文

AI工具

3周前

Qwen-VLA

Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型，以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架，将...

阅读原文

AI工具

3周前

Hermes Desktop

Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打包为单一可执行文...

阅读原文

AI工具

3周前

Funloom

Funloom 是 00 后创业者吴同创立的 AI 原生游戏内容共创平台，让用户无需编程、美术或游戏引擎基础，通过简单的人物设定和世界观输入，可在五分钟内生成包含...

阅读原文

AI工具

3周前

Music v2

Music v2 是 ElevenLabs 全新推出的音乐生成大模型，在人声表现、乐器演奏和编曲水平上实现全面提升，支持多语言及单曲目内跨流派无缝转换。

阅读原文

AI工具

3周前

Gamma-World

Gamma-World 是 NVIDIA 推出的多智能体世界模型，能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。

阅读原文

AI工具

3周前

美团GEO营销门户

美团 GEO 营销门户是美团推出的生成式引擎优化（GEO）平台，专为 AI 搜索时代设计，帮助品牌在豆包、DeepSeek、文心一言等主流大模型中提升曝光与推荐频次。...

阅读原文

AI工具

4周前

getdesign.md

getdesign.md 是 VoltAgent 团队推出的 AI 原生设计系统库与工具平台，核心提供 60+ 顶级品牌的 DESIGN.md 设计规范文件。基于 Google Stitch 提出的 DESIGN....

阅读原文

AI工具

4周前