NeMo是一款由NVIDIA开发的生成式人工智能框架,可用于构建大型语言模型、多模态模型、自动语音识别和文本到语音合成等应用。NeMo框架具有高效性、灵活性和易用性,可满足研究人员和开发者的需求。,NeMo官网入口网址
Voci是一款高效、准确的自动语音识别产品,可以将联系中心呼叫转录为文字,帮助企业提升客户体验和获取有价值的数据。,Voci Technologies官网入口网址
Whisper是一个接近人类级别准确性的自动语音识别系统,具有鲁棒性和多语言转录翻译功能。,Whisper by OpenAI官网入口网址
Vivoka提供一种全方位解决方案,使任何公司能够在最短时间内创建自己的高性能、安全的离线语音AI助手。该解决方案包括唤醒词、自动语音识别、自然语言理解、语音生物识别、语音合成和音频增强等功能。它适用于智能眼镜、供应链、维护报告、虚拟现实、嵌入式系统和智能建筑等多个应用场景。,Vivoka官网入口网址
zeroscope_v2_XL官网入口网址,管道标签不在官方列表中
SpeechFlow官网入口网址,SpeechFlow Speech Recognition API 是一款功能强大的工具,可将声音转换为文本、语音转换为文本和音频转换为文本,准确率高达 14 种语言。