大规模、动态「语音增强/分离」新基准！清华发布移动音源仿真平台SonicSim，含950+小时训练数据

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：大规模、动态「语音增强/分离」新基准！清华发布移动音源仿真平台SonicSim，含950+小时训练数据
关键字：声源,数据,环境,语音,声学
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：LRST
【新智元导读】清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持，有效降低了数据采集成本，实验证明这些工具能有效提升模型在真实环境中的性能。随着语音技术的快速发展，现有的语音分离和增强方法在静态环境下已经取得了显著的进展。然而，在动态环境中，这些方法的性能仍然存在很大的不确定性。
目前，用于研究动态声源的数据集极为稀少，主要原因是录制成本高昂，难以大规模应用，极大地阻碍了动态环境下语音分离与增强技术的发展和应用。
为了应对这一挑战，清华大学研究团队开发了SonicSim仿真平台和SonicSet数据集：
SonicSim是一个高度可定制的数据生成工具，能够模拟各种复杂的动态声源场景；
SonicSet则是基于SonicSim生成的大规模动态声源数据集，为语音分离和增强研究提供了丰富的训练和测试数据，这一创新性的解决方案不仅大幅降低了数据采集成本，还为动态语音处理技术的发展提供了强有力的支持。论文地址：https://arxiv.org/abs/2410.01481
项目主页：https://csl

原文链接：大规模、动态「语音增强/分离」新基准！清华发布移动音源仿真平台SonicSim，含950+小时训练数据