将电子书转换为有声书的工具。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
Whisper Input 是一个通过按键控制语音录制并快速转译的工具。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
LLaSA: 扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
一款为 Apple Watch 设计的智能语音助手应用,无需手机即可完成多种操作。
一个提供语音克隆和AI语音内容创作的平台。
为酒店提供多语言AI语音代理,提升客户体验并降低运营成本。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
自动化AI语音代理测试与性能分析平台,提供真实场景模拟与评估。
致力于通过自然语音技术,打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
实时语音AI代理,500毫秒内响应语音查询。
让应用通过语音与文本的转换实现智能交互。
个性化AI唤醒服务,助你早起。
将文本转换为自然流畅的语音输出
领先的文本到语音转换模型
快速AI语音助手
将语音转化为结构化的笔记。
一款用于离线语音转录的GUI工具
大规模多语种语音生成数据集
AI语音思维笔记,捕捉灵感,提升行动力。
全端到端的类人语音对话模型
将语音转化为强大的内容
趣味语音互动,让设备记住你的名字。
基于羊驼模型的大型语音生成模型
一站式生活助手,整合日程、提醒、记事、购物、天气等多功能。