本文内容默认读者已经下载完成VoxCeleb数据集。
本文默认的操作系统环境为Ubuntu18.04。
下载VoxCeleb数据集
VoxCeleb数据集是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。该数据集有2个子集: VoxCeleb1 和 VoxCeleb2。
下载数据集需要去官网上下载,这里给出官网链接。
VoxCeleb1:https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
VoxCeleb2:https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox2.html
注意,下载这两个数据集需要以企业或者学校申请,需在指定时间内下载。
处理VoxCeleb数据集
用自己的数据路径替换YOUR_DATA_PATH,分别进行整理数据集与数据音频格式转换,点此获取数据处理代码。
python dataprep.py --save_path YOUR_DATA_PATH --extract
python dataprep.py --save_path YOUR_DATA_PATH --convert
转换前需要在系统安装wget
和ffmpeg
。
安装wget
apt update
apt install wget
wget --version
安装ffmpeg3.x
apt update
apt install ffmpeg
ffmpeg -version
大功告成
经过漫长的等待坐牢,处理好的数据新鲜出炉,具体怎么用就看各位操作了。
本文地址:https://alphalrx.cn/index.php/archives/186/
版权说明:若无注明,本文皆为“LRX's Blog”原创,转载请保留文章出处。
对应的人脸图像文件去哪里下载啊