本文来源公众号“极市平台”,仅用于学术分享,侵权删,干货满满。
原文链接:16个图像分类方向开源数据集资源汇总(附下载链接)
本文汇总了16个图像分类相关的开源数据集,均附有下载链接。要构建机器学习模型,整洁干净的数据集是基本要求。
1 FruitNet水果分类/识别数据集
下载链接:http://suo.nz/2Cfo4y
需要高质量的水果图像来解决水果分类和识别问题。要构建机器学习模型,整洁干净的数据集是基本要求。为了这个目标,我们创建了名为“FruitNet”的六种流行印度水果的数据集。该数据集包含 6 种不同类别水果的 14700 多张经过处理的格式的高质量图像。图像分为 3 个子文件夹 1) 优质水果 2) 劣质水果和 3) 混合质量水果。每个子文件夹包含 6 个水果图像,即苹果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相机的手机来捕捉图像。这些图像是在不同的背景和不同的光照条件下拍摄的。建议的数据集可用于训练,水果分类或重组模型的测试和验证。
2 卫星图像分类
下载链接:http://suo.nz/2D00yp
卫星图像分类数据集-RSI-CB256,该数据集有 4 个不同的类别,混合了传感器和谷歌地图快照。
3 intel 自然风光图像分类数据集
下载链接:http://suo.nz/2KwdmY
这是世界各地自然风光的图像数据。
内容:此数据包含分布在 6 个类别下的大约 25,000 张大小为 150x150 的图像。{'建筑物'-> 0, '森林'-> 1, '冰川'-> 2, '山'-> 3, '海'-> 4, '街道'-> 5}
4 建筑遗产元素图像数据集
下载链接:http://suo.nz/2RmsZl
Architectural Heritage Elements Dataset (AHE) 是一个图像数据集,用于开发深度学习算法和建筑遗产图像分类中的特定技术。该数据集包含 10235 张图像,分为 10 个类别:祭坛:829 张图像;后殿:514 张图片;钟楼:1059张图片;栏目:1919张图片;圆顶(内部):616 张图像;圆顶(外部):1177 张图像;飞扶壁:407张图片;Gargoyle(和 Chimera):1571 张图像;彩色玻璃:1033 幅图像;保险库:1110 张图像。
5 贝壳或鹅卵石:图像分类数据集
下载链接:http://suo.nz/2YSG42
数据集包含两个类:贝壳或卵石。该数据集可用于二元分类任务,以确定某个图像是贝壳还是鹅卵石。
6 DeepWeeds 杂草类型分类数据集
下载链接:http://suo.nz/2OmaTQ
数据集包含 17,509 张图像,这些图像捕捉了八种原产于澳大利亚的不同杂草以及邻近的植物群。选定的杂草品种是昆士兰州牧草地的本地品种。它们包括:“中国苹果”、“蛇草”、“马缨丹”、“刺金合欢”、“暹罗草”、“白花菊”、“橡胶藤”和“帕金森属植物”。这些图像是从昆士兰以下地点的杂草侵扰中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。
7 仙人掌航拍图片数据集
下载链接:http://suo.nz/2VSnYx
在此数据集中,展示了 16,000 多个用于植物识别或分类的柱状仙人掌 (Neobuxbaumia tetetzo) 示例。
8 农作物图像分类(小麦、水稻、甘蔗、玉米等)
链接:http://suo.nz/33oB1C
数据集(作物图像)包含5种农业作物(玉米、小麦、黄麻、水稻和甘蔗)的 40 多张图像 数据集(kag2)包含每类作物图像的 159 多张增强图像。增强包括水平翻转、旋转、水平平移、垂直平移。
9 5种不同的水稻图像数据集
下载链接:http://suo.nz/349aVN
使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 一共5种水稻品种。其中,数据集(1) 有75K 幅图像,包括每个水稻品种的15K 幅图像。数据集(2)有 12 个形态特征、4 个形状特征和 90 个颜色特征。
10 板球-足球-棒球分类
数据集下载链接:http://suo.nz/33juP6
该数据集包含 252 张打板球、踢足球和打棒球的图像。主文件夹中有 3 个子文件夹 (1) cricket (2) football (3) baseball (cricket-football-baseball)。
11 垃圾分类数据集
数据集下载链接:http://suo.nz/3gb5Jj
该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像;纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。
12 花卉数据集
数据集下载地址:http://suo.nz/2fGKVt
该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类植物:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高,约为 320x240 像素。照片不会缩小到单一尺寸,它们有不同的比例。
13 90种动物图像数据集
数据集下载地址:http://suo.nz/2ncY0a
在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫 毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。
14 衣服数据集
数据集下载地址:http://suo.nz/2uJaOJ
衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集:Toloka——众包平台;社交媒体上的网络众包计划;Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的,同时我们使用简单的神经网络纠正了标签错误。
数据集包含 20 个类,包括T 恤(1011 件),长袖(699 件),裤子(692 件),鞋子(431 件)衬衫(378 件),连衣裙(357 件),外套(312 件),短裤(308 件),帽子(171 件),裙子(155 件),西装外套(109 件)等。
15 商标数据集
数据集下载地址:http://suo.nz/2CfnTq
在这项工作中,我们构建了一个大规模的 logo 数据集 Logo-2K+,它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像,具有 10 个根类别和 2,341 个类别。
16 食物图像数据集
数据集下载地址:http://suo.nz/2D00oT
该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集,该数据包括图像的大规模缩小版本,以实现快速测试。数据已被重新格式化为 HDF5,特别是 Keras HDF5Matrix,这样可以轻松读取它们。文件名表示文件的内容。例如
foodc101n1000_r384x384x3.h5 表示有 101 个类别,n=1000 图像,分辨率为 384x384x3(RGB,uint8) foodtestc101n1000r32x32x1.h5 表示数据是验证集的一部分,代表 101 个类别,n=1000 图像,分辨率为 32x32x1(float32 从 -1 到 1)
使用该数据集的第一个目标是对未知图像进行分类,但除此之外,还可以查看哪些区域/图像组件对进行分类很重要,将新类型的食物识别为现有标签的组合,构建对象检测器,可以在整个场景中找到相似的对象。
THE END!
文章结束,感谢阅读。您的点赞,收藏,评论是我更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。