语音识别 - OpenI

语音识别

超级椰子 Super Coco

专为 Mac 用户设计的 AI 语音助手，通过语音指令实现润色、翻译及自动化办公。

Fly Cut Caption

免费的 AI 视频字幕生成工具。使用先进的 AI 技术自动生成、编辑和导出视频字幕。

Google AI提示词库

Google Cloud生成式AI提示库是Google官方提供的AI提示词资源库，能帮助用户更好地利用生成式AI模型完成各种任务。

LongCat开放平台

LongCat开放平台是美团LongCat团队推出的大模型API服务平台，基于全自研 MoE 架构（Zero-Computation Experts + Shortcut-connected MoE），为用户提供高效、稳定且安全的AI服务。

蛐蛐 (QuQu)

开源免费的 Wispr Flow 替代方案，为中文用户打造的桌面端语音输入与文本处理工具。

Mumble Note

让Mumble Note将您的会议、任务、想法和快速笔记立即转换为笔记、待办事项和输出。

爱解析是一款音视频转图文神器，支持音视频内容快速转换为结构化文本，并提供智能分析和多语言翻译功能，帮助用户快速获取和理解音视频中的关键信息。

Amazon Nova Sonic

亚马逊全新基础模型理解语气、语调与节奏，提升人机对话自然度。

灵云开放平台

灵云开放平台免费提供全面的智能人机交互技术，包括语音合成、识别，手写识别，光学字符识别，语义理解，机器翻译等，助力移动应用、智能硬件实现自然、智能的交互。

标贝AI虚拟主播

一站式虚拟主播视频生产和编辑平台

灵云AI开放平台

灵云AI开放平台

科大讯飞-AI虚拟主播

科大讯飞推出的移动互联网智能交互平台，为开发者免费提供：涵盖语音能力增强型SDK，一站式人机智能语音交互解决方案，专业全面的移动应用分析；

Whisper Turbo.online

Whisper Turbo 是一款免费在线快速准确的语音识别工具。

FireRedASR-AED-L

开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

ElevenLabs Scribe

Scribe 是全球最准确的语音转文字模型，支持99种语言。

音刻转录是一款快速、精准、丝滑的音视频转录工具。

DuRT 是一款 macOS 上的实时语音识别和翻译软件，致力于提供高效、准确的语音处理服务。

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct 是微软开发的轻量级多模态基础模型，支持文本、图像和音频输入。

将口语转化为优雅文字的AI写作工具，让写作变得轻松自然。

思必驰 DFM-2 大模型

思必驰DFM-2大模型赋能多模态交互和行业应用，提供更智能、个性化的对话体验。

Seamless Communication

强大的AI同声传译工具，实时精准翻译多种语言，高效促进跨语言沟通。

全诊通Aioclinic

AI辅助病历生成系统，提升效率、保障质量、保护隐私。

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。PengChengStarling官网入口网址

风车AI翻译

集图片翻译、视频翻译、智能抠图、去除图片文字和视频字幕等功能于一体的在线翻译工具风车AI翻译官网入口网址

Argmax WhisperKit

WhisperKit是一个开源项目，...

讯飞A.I.智能客服解决方案

基于科大讯飞语音技术，实现智能客服的多渠道解决方案。

构建高级语音AI，由LLM提供支持，实现人类般的交互体验。

Azure 认知服务语音

让应用通过语音与文本的转换实现智能交互。

Say My Name!

趣味语音互动，让设备记住你的名字。

实时语音交互的人工智能对话系统。

300行代码实现基于LLM的语音转录。

Qwen2 Audio Instruct Demo

音频指令演示，体验智能交互。

12 3…6