正文

CelebA-HQ数据集是通过CelebA原始的未裁剪数据集生成的不同分辨率的版本。

数据集下载 Large-scale CelebFaces Attributes (CelebA) Dataset,注意要下载img_celeba.7z这个未裁剪的原始版本

数据集转化方式可以参考:CelebA-HQ的jpg格式版转化

  1. 下载img_celeba.7z,共计14个分卷压缩文件

  2. 解压文件,先合并文件再进行解压

    1
    cat img_celeba.7z.0* > img_celeba.7z

    解压文件可以直接使用unzip,但我处理时遇到了一些问题,见后文。

  3. 下载CelebA_hq_deltas,Google Drive,百度云地址见下文。

  4. 下载celebA的人脸标注list_landmarks_celeba.txt,和数据集在同一文件夹中

  5. 图片生成脚本 willylulu/celeba-hq-modified 中的 h5tool.py


遇到的问题:

  1. 使用cat链接之后再centos下无法使用unzip解压,报错如下:

    1
    2
    3
    4
    5
    6
    7
    Archive:  img_celeba.7z
    End-of-central-directory signature not found. Either this file is not
    a zipfile, or it constitutes one disk of a multi-part archive. In the
    latter case the central directory and zipfile comment will be found on
    the last disk(s) of this archive.
    unzip: cannot find zipfile directory in one of img_celeba.7z or
    img_celeba.7z.zip, and cannot find img_celeba.7z.ZIP, period.

    此时需要使用7za工具进行解压:

    1
    2
    sudo yum install -y p7zip
    7za x img_celeba.7z
  2. celeba-HQ deltas下载

    1
    2
    链接: https://pan.baidu.com/s/1NmhVaCmRNoBYtIxfxkpQ3g 
    提取码: bmxv