语音处理 - 第 2 页 - OpenI

语音处理

Whisper-Input

Whisper Input 是一个通过按键控制语音录制并快速转译的工具。

SpeechGPT 2.0-preview

首个面向语境智能的人类级实时交互系统，支持多情感、多风格语音交互。

LLaSA_training

LLaSA：扩展基于 LLaMA 的语音合成的训练时间和测试时间计算量

FireRedASR-AED-L

开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

一款为 Apple Watch 设计的智能语音助手应用，无需手机即可完成多种操作。

Supertone Play

一个提供语音克隆和AI语音内容创作的平台。

为酒店提供多语言AI语音代理，提升客户体验并降低运营成本。

ElevenLabs Scribe

Scribe 是全球最准确的语音转文字模型，支持99种语言。

自动化AI语音代理测试与性能分析平台，提供真实场景模拟与评估。

致力于通过自然语音技术，打造个人语音伴侣和全天候可穿戴轻量级眼镜设备。

基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

音刻转录是一款快速、精准、丝滑的音视频转录工具。

Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

一个用于生成对话式语音的模型，支持从文本和音频输入生成高质量的语音。

Real-time Voice AI Agent

实时语音AI代理，500毫秒内响应语音查询。

Azure 认知服务语音

让应用通过语音与文本的转换实现智能交互。

WAKE UP MOTHAF&#$R

个性化AI唤醒服务，助你早起。

Fish Audio文本转语音

将文本转换为自然流畅的语音输出

Fish Speech V1.2

领先的文本到语音转换模型

快速AI语音助手

Audioscribe

将语音转化为结构化的笔记。

一款用于离线语音转录的GUI工具

大规模多语种语音生成数据集

AI语音思维笔记，捕捉灵感，提升行动力。

全端到端的类人语音对话模型

Speech to Note

将语音转化为强大的内容

Say My Name!

趣味语音互动，让设备记住你的名字。

基于羊驼模型的大型语音生成模型

一站式生活助手，整合日程、提醒、记事、购物、天气等多功能。

实时语音交互的人工智能对话系统。

300行代码实现基于LLM的语音转录。

Qwen2 Audio Instruct Demo

音频指令演示，体验智能交互。

123 4