于上个月举办的IEEE语音语言会议SLT 2021中,谷歌联合 DeepMind 提出了名为 Synth2Aug 的架构,首次将合成语音用于声纹识别模型的训练,从而大幅提升训练数据的声纹多样性以及文本多样性,实现跨领域的声纹识别。
和同学们去青海完成了一次毕业旅行
本文介绍在多人共用的服务器上如何配置属于自己的docker容器
需要重写wav头
Speech Processing for Machine Learning: Filter banks, Mel-Frequency Cepstral Coefficients (MFCCs) and What's In-BetweenSpeech processing plays an important role in any speech system whether its Aut...