处理Voxceleb数据集,合并并批量将m4a转为wav格式
于上个月举办的IEEE语音语言会议SLT 2021中,谷歌联合 DeepMind 提出了名为 Synth2Aug 的架构,首次将合成语音用于声纹识别模型的训练,从而大幅提升训练数据的声纹多样性以及文本多样性,实现跨领域的声纹识别。
和同学们去青海完成了一次毕业旅行
本文介绍在多人共用的服务器上如何配置属于自己的docker容器
需要重写wav头