COCO数据集介绍
什么是COCO数据集?
COCO数据集是一个可用于图像检测、语义分割和图像标题生成的大规模数据集。它有超过330K张图像(其中220K张是有标注的图像),包含150万个目标,80个目标类别(行人、汽车、大象等),91种材料类别(草、墙、天空等),每张图像包含五句图像的语句描述,且有250,000个带关键点标注的行人。
COCO数据集特点
COCO数据集具有以下几个特点:
(1)目标分割 ;
(2)图像情景识别 ;
(3)超像素分割 ;
(4)拥有 330K 张图像(其中 >200K 张有标签);
(5)150 万个实例对象 ;
(6)80 个目标类别 ;
(7)91个物品类别 ;
(8)每张图片有 5 个描述 ;
(9)250K 张人的图像有关键点标注 ;
COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), 和image captions(看图说话),使用JSON文件存储,并且这3种类型共享这些基本类型:info、image、license。
COCO数据集的下载
下载网址:https://cocodataset.org/#download
不用全部下载,只需要下载2017 Train images、2017 Val images以及对应的所需的Task的annotation即可。
博主提供
这里我们使用coco数据集,但coco数据集实在太大,这里我们使用coco128数据集,因为只有128张图片,复制和解压的速度可以很快:
链接: https://pan.baidu.com/s/1GSztpSTVbIBA3f1ab2TLhg 提取码: 0213