AI工具 - 第 26 页

LongCat-AudioDiT

LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音（TTS）模型，核心创新在于直接在波形潜空间进行扩散生成，非传统梅尔频谱等中间表示，有效避免误差累...

阅读原文

AI工具

3个月前

Vision2Web

Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准，用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务，分为三层递进难...

阅读原文

AI工具

3个月前

wecom-cli

wecom-cli（企业微信 CLI）是企业微信官方团队开源的命令行工具，让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文...

阅读原文

AI工具

3个月前

PixVerse V6

PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破，运镜更精准，角色情绪跨帧连贯，物理交互更...

阅读原文

AI工具

3个月前

Multi-Shot

Multi-Shot 是 Runway 推出的 AI 视频生成应用，支持实现"一键成片"。用户只需输入场景描述，系统自动拆解为最多5个连贯镜头，同步完成构图、运镜...

阅读原文

AI工具

3个月前

Qwen3.5-Omni

Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型，可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术，在215项音...

阅读原文

AI工具

3个月前

Pascal Editor

Pascal Editor 是基于 Web 的开源 3D 建筑编辑器，由 Claude 辅助开发。工具无需安装，浏览器可运行，采用 WebGPU 技术实现高性能渲染。

阅读原文

AI工具

3个月前

GigaWorld-1

GigaWorld-1 是极佳视界推出的具身世界模型，在 WorldArena 评测中登顶全球第一。模型采用 AC-WM（动作控制世界模型）架构，结合显式动作建模与可微分物理引...

阅读原文

AI工具

3个月前

MicroCoder

MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目，针对Qwen3等新一代模型训练瓶颈，从算法、数据、评估、经验四维度全面...

阅读原文

AI工具

3个月前

Mureka V9

Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品，登顶Artificial Analysis人声和乐器...

阅读原文

AI工具

3个月前

KAT-Coder-Pro V2

KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型，专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码...

阅读原文

AI工具

3个月前

移动云 MobileClaw

移动云 MobileClaw 是中国移动推出的桌面级 AI 办公智能体，深度兼容 OpenClaw 生态。主打"央企自研、安全合规"，核心数据本地存储不上云。

阅读原文

AI工具

3个月前

Matrix-Game 3.0

Matrix-Game 3.0 是昆仑万维（Skywork AI）推出的实时交互式世界模型，支持720p@40FPS实时生成。模型采用误差缓冲机制实现自校正，结合相机感知记忆检索确保...

阅读原文

AI工具

3个月前

Lark CLI

Lark CLI 是飞书开源的命令行工具，专为 AI Agent 设计，让 Claude Code、Codex 等 AI 助手能直接操作飞书。

阅读原文

AI工具

3个月前

AnyClaw

AnyClaw 是专为 AI Agent 设计的开源智能转接头，扮演"Agent 互联网与传统互联网的连接器"角色。能将传统互联网分散的 API、脚本、网页自动化工作...

阅读原文

AI工具

3个月前