实时语音交互的人工智能对话系统。
300行代码实现基于LLM的语音转录。
音频指令演示,体验智能交互。
基于OpenAI Whisper的自动语音识别与说话人分割
生成高质量中文方言语音的大规模文本到语音模型。
自动化AI代理测试工具
您的个性化AI时尚顾问
与任何大型语言模型进行快速的免提语音交互。
个性化语音克隆工具,实现自然语音生成。
智能语音分析,提升零售客户服务体验。
最新多模态检查点,提升语音理解能力。
与大型语言模型进行自然的语音对话
个性化AI助手,记录每一刻,与AI对话获取反馈。
AI驱动的语音代理,提供企业级IVR解决方案。
精确到词级的自动语音识别模型
轻量级端到端文本到语音模型
利用AI生成视频脚本、语音和会说话的头像
实现与生成AI自然沟通的可穿戴设备
微软亚洲研究院开发的语音合成技术
将任何PDF文档转换成播客节目。
极速语音识别,精准时间戳
实时语音和视频AI平台
使用Llama模型的语音合成工具
情感丰富的多模态语言模型
会议语音转文本并自动生成摘要的AI工具
开源的语音识别和说话人分割模型推理代码
使用OpenAI实时API与文档进行语音聊天
首款AI智能体耳机,无需手机即可语音唤醒AI助手。
一款文本转语音工具,帮助您轻松阅读文本。
使用AI整理和提炼你的想法的语音和文本笔记应用
TypeScript客户端,用于OpenAI的实时语音API。
在Google Docs中添加语音评论