Fun-ASR

AI工具23小时前更新 AI工具集
0 0 0

Fun-ASR – 钉钉联合通义推出的语音识别大模型

Fun-ASR:钉钉携手通义实验室打造的下一代语音识别大模型,专为企业级场景优化,显著提升多行业专业术语和“黑话”的识别精度,结合企业内部信息进行上下文推理,减少幻觉,并支持企业专属模型定制,已广泛应用于会议字幕、智能纪要、语音助手等钉钉核心功能。

Fun-ASR:企业级语音识别的革新者

Fun-ASR,由钉钉与通义实验室语音团队联合研发,是一款面向企业级应用的新一代语音识别大模型。它凭借海量音频数据的深度训练,能够精准捕捉并理解互联网、科技、家装、畜牧等十余个垂直行业的专业术语,甚至能够识别行业内部的“黑话”。在实际应用中,Fun-ASR已在保险行业实现了18%的准确率提升,在家装和畜牧等领域也达到了15%-20%的显著进步。更重要的是,Fun-ASR能够巧妙地融合钉钉平台内的企业信息,如通讯录、日程和知识库等,进行智能推理优化,有效规避大模型常见的“幻觉”现象,从而交付更为可靠的转写结果。此外,Fun-ASR还提供企业专属模型定制训练服务,允许企业利用自身真实的语音数据进一步精炼算法,大幅提升品牌名称、项目代号、产品型号以及人名等专属词汇的识别精度,单次导入热词数量最高可达1000+。

目前,Fun-ASR已深度集成至钉钉的会议字幕、智能纪要以及语音助手等关键功能模块,为企业在各类语境下提供稳定、高效且易于扩展的语音识别解决方案。

Fun-ASR的核心优势

  • 精通行业术语,洞悉“黑话”:Fun-ASR通过海量数据的锤炼,能够精准识别互联网、科技、家装、畜牧、汽车等众多行业的专业术语。实测数据显示,在保险行业,其准确率较过往提升了18%;在家装、畜牧等行业,准确率也实现了15%-20%的跨越。通过支持最多1000+热词的导入,Fun-ASR能进一步优化对生僻词汇的识别能力。
  • 上下文感知,智能优化:模型能够结合企业在钉钉平台内的信息(如通讯录、日程安排、知识库等),进行智能推理优化,有效减少潜在的“幻觉”问题,确保转写结果的准确性与可靠性,此功能需企业授权后方可启用。
  • 企业专属定制,个性化提升:得益于高效的端到端训练架构,Fun-ASR能够基于企业提供的真实场景语音数据进行算法优化,显著提升品牌名称、项目代号、产品型号、人名等专属词汇的识别准确率。
  • 多场景融合,赋能企业应用:Fun-ASR已无缝集成到钉钉的会议字幕与同传、智能纪要、语音助手等功能中,为企业级应用场景构建了一个稳定、高效且可扩展的语音识别基座,满足企业日益增长的语音识别需求。

Fun-ASR的技术基石

  • 海量数据驱动:Fun-ASR的强大能力源于上亿小时音频数据的深度训练,覆盖了广泛的行业和场景,使其能够精准理解各类专业术语。
  • 行业共创,精益求精:通过与钉钉众多行业客户的真实场景协同打磨,Fun-ASR在互联网、科技、家装、畜牧、汽车等十余个领域表现卓越,专业术语识别准确率大幅提升。
  • 上下文推理,精准输出:模型通过整合企业在钉钉内的现有信息(如通讯录、日程、知识库等),进行上下文推理优化,有效抑制大模型可能出现的“幻觉”现象,提供更可信赖的转写结果。
  • 端到端训练,高效定制:基于先进的端到端训练架构,Fun-ASR能够利用企业提供的真实场景语音数据进行算法优化,提升专属词汇的识别精度,支持企业进行专属模型的定制训练。
  • 自定义热词,精准识别:Fun-ASR提供企业自定义热词功能,最多可导入1000+热词,进一步提升对生僻词汇和行业特定术语的识别准确度。

Fun-ASR的多元化应用场景

  • 实时会议字幕与同传:Fun-ASR能够实时转录会议内容,提供精准的字幕和同传服务,帮助与会者更深入地理解和记录会议要点。
  • 智能会议纪要生成:模型可自动提炼会议中的关键信息和行动项,生成会议纪要,从而节省人工整理时间,提升会议效率。
  • 便捷的语音助手交互:支持语音指令和交互操作,用户可通过语音命令完成信息查询、日程安排等多种任务,极大提升用户体验。
  • 赋能家装与畜牧行业:在顾家家居等家装企业,Fun-ASR能够准确识别如“比利时进口 Pulse 脉冲乳胶”等专业表述,为后续的客户需求分析提供坚实依据。在畜牧行业,其精准识别相关术语的能力,也为企业的高效运营提供了有力支持。
  • 优化保险行业服务:Fun-ASR在保险行业的应用显著提高了语音识别的准确性,助力保险企业更高效地处理客户咨询和业务流程。
阅读原文
© 版权声明
蝉镜AI数字人

相关文章

蝉镜AI数字人

暂无评论

暂无评论...