AI工具

ControlFoley

ControlFoley是小米开源的可控视频音效生成模型,能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频配音任务,通过自研时空音...
阅读原文

OmniVoice Studio

OmniVoice Studio 是全本地运行的开源 ElevenLabs 替代方案,提供跨平台桌面客户端,支持零样本语音克隆、声音设计、视频自动配音、语音听写等功能,覆盖 646...
阅读原文

墨见

墨见是墨刀推出的 AI 协作平台,专为一人公司与超级个体打造。平台搭载 OpenClaw 引擎,内置产品经理、UI/视觉设计师、前后端工程师、增长运营师等虚拟合伙人...
阅读原文

MiniMax M3

MiniMax M3是MiniMax推出的全新AI模型,具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构,支持1M超长上下文,效率提升20倍。
阅读原文

Qwen-VLA

Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型,以 Qwen3.5-4B 为视觉语言主干,搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架,将...
阅读原文

Hermes Desktop

Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打包为单一可执行文...
阅读原文

Funloom

Funloom 是 00 后创业者吴同创立的 AI 原生游戏内容共创平台,让用户无需编程、美术或游戏引擎基础,通过简单的人物设定和世界观输入,可在五分钟内生成包含...
阅读原文

Music v2

Music v2 是 ElevenLabs 全新推出的音乐生成大模型,在人声表现、乐器演奏和编曲水平上实现全面提升,支持多语言及单曲目内跨流派无缝转换。
阅读原文

Gamma-World

Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。
阅读原文

美团GEO营销门户

美团 GEO 营销门户是美团推出的生成式引擎优化(GEO)平台,专为 AI 搜索时代设计,帮助品牌在豆包、DeepSeek、文心一言等主流大模型中提升曝光与推荐频次。...
阅读原文

getdesign.md

getdesign.md 是 VoltAgent 团队推出的 AI 原生设计系统库与工具平台,核心提供 60+ 顶级品牌的 DESIGN.md 设计规范文件。基于 Google Stitch 提出的 DESIGN....
阅读原文

SenseNova-U1-8B-MoT-Infographic

SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型,基于 SenseNova-U1-8B-MoT 统一架构,通过专项数据训练与 RL 强化学习,显著提升...
阅读原文

MAI-Image-2.5

MAI-Image-2.5 是微软研究院推出的旗舰级文生图模型,为 MAI-Image 系列最强版本。模型在 Arena 文生图排行榜以 1,254 分冲上第 3 名,较前代提升 72 分,打...
阅读原文

Runway MCP

Runway MCP 是 Runway 推出的官方MCP 服务器,工具将 Gen-4.5、Seedance 2.0、Kling 3.0 等顶尖 AI 图像与视频生成模型接入 Claude、ChatGPT、Cursor 等 MCP ...
阅读原文

omp

omp(oh-my-pi) 是基于 Pi 项目二次开发的开源 AI 终端编程智能体,核心代码约 2.7 万行 Rust,支持 40+ 模型供应商与 32+ 内置工具。
阅读原文
1234340