Whisper by OpenAI官网
Whisper是一个接近人类级别准确性的自动语音识别系统,具有鲁棒性和多语言转录翻译功能。
网站服务:文字转语音,自动语音识别,语音识别,音频AI,文字转语音,自动语音识别,语音识别。
Whisper by OpenAI简介
We’ve trained and are open-sourcing a neural net called Whisper that approaches human level robustness and accuracy on English speech recognition.
什么是”Whisper by OpenAI”?
Whisper是一个自动语音识别(ASR)系统,经过训练后可以接近人类级别的鲁棒性和准确性。它使用了680,000小时的多语言和多任务监督数据进行训练,可以提供更好的口音、背景噪音和技术语言的鲁棒性。此外,它还可以进行多语言转录和从其他语言翻译成英语。我们开源了模型和推理代码,以便构建有用的应用程序和进行更深入的鲁棒性语音处理研究。
“Whisper by OpenAI”有哪些功能?
1. 提供鲁棒的语音识别功能,对口音、背景噪音和技术语言具有较高的识别准确性。
2. 支持多语言转录和从其他语言翻译成英语的功能。
3. 使用简单的端到端架构,基于编码器-解码器Transformer模型实现。
4. 输入音频被分割成30秒的片段,转换为对数梅尔频谱图,并传入编码器进行处理。
5. 训练解码器以预测相应的文本标题,并与特殊标记交替使用,以指示单个模型执行语言识别、短语级时间戳、多语言语音转录和到英语的语音翻译等任务。
应用场景:
1. 语音识别应用程序:可以用于构建语音助手、语音输入工具等应用。
2. 多语言转录和翻译应用程序:可以用于将其他语言的音频转录成文本,并进行翻译。
“Whisper by OpenAI”如何使用?
开发者可以使用Whisper的模型和推理代码来构建语音识别和转录翻译应用程序。详细信息和使用方法请参考论文、模型卡片和代码。
Whisper by OpenAI官网入口网址
https://openai.com/blog/whisper/
OpenI小编发现Whisper by OpenAI网站非常受用户欢迎,请访问Whisper by OpenAI网址入口试用。
数据统计
数据评估
本站OpenI提供的Whisper by OpenAI都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由OpenI实际控制,在2024年 4月 18日 上午3:38收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,OpenI不承担任何责任。