年龄性别预测1:年龄性别数据集说明(含下载地址)

年龄性别预测1:年龄性别数据集说明(含下载地址)

目录

年龄性别预测1:年龄性别数据集说明(含下载地址)

1.前言

2.MegaAge_Asian

3.MORPH

4.IMDB-WIKI

5.数据集下载

6.年龄性别预测和识别(Python/C++/Android) 


1.前言

本项目将实现年龄性别预测和识别,整套方案采用二阶段方法实现,即首先使用通用的人脸检测算法(Face Detection)定位人脸区域,裁剪人脸,再构建多任务模型,分别进行年龄预测(Age)和性别识别(Gender)。项目分为数据集说明,Pytorch模型训练和C++/Android部署等多个章节,本篇是项目《年龄性别预测》系列文章之年龄性别数据集说明;为了方便后续模型工程化和Android平台部署,项目骨干网络backbone支持resnet18/resnet50,以及轻量化模型MobilenetV2模型训练和测试,并提供Python/C++/Android多个版本;

本篇,主要分享年龄性别人脸数据集,主要介绍MegaAge_Asian,MORPH以及IMDB-WIKI三大数据集,总数约28W+的人脸图片,并且都标注了年龄和性别的信息,可以用于龄性别预测和识别模型的开发。

 【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/135127124


更多项目《年龄性别预测》和《面部表情识别》系列文章请参考:

  1. 面部表情识别1:表情识别数据集(含下载链接)
  2. 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)
  3. 面部表情识别3:Android实现表情识别(含源码,可实时检测)
  4. 面部表情识别4:C++实现表情识别(含源码,可实时检测)
  5. 年龄性别预测1:年龄性别数据集说明(含下载地址)
  6. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)
  7. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)
  8. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)


2.MegaAge_Asian

数据说明:Quantifying Facial Age by Posterior of Age Comparisons

MegaAge_Asian一个是亚洲人脸数据集,标注了年龄和性别标签,年龄分布为0-70岁,其中训练集37563,测试集3583;项目对该数据集进行数据清洗,标注格式统一转换为

  • 数据格式:image_path age gender xmin ymin xmax ymax,如
test/287.jpg 8 0 41 64 124 180
test/135.jpg 1 1 39 74 125 182
test/1446.jpg 26 1 40 74 131 181
test/599.jpg 11 1 65 81 147 176
  • image_path是图片的相对路径
  • age是年龄,
  • gender是性别,0表示女性,1表示男性
  • xmin ymin xmax ymax对应的人脸框位置

3.MORPH

数据说明:MORPH | UNCW

MORPH一个是欧美人脸数据集,标注了年龄和性别标签,包含 2003 年至 2007 年底超过 13,000 个人的 55,000 张独特图像。年龄范围从 16 岁到 77 岁,中位年龄为 33 岁。每个人的平均图像数量为 4 张,照片之间的平均时间为 164天,最短1天,最长1681天。 图像之间的天数标准差为 180。项目对该数据集进行数据清洗,最后整理保留了训练数据49096张图片,测试数据3000张图片,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

4.IMDB-WIKI

数据说明:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

IMDB-WIKI人脸数据集是基于IMDB 和 Wikipedia 两大数据库整合的人脸数据集,其中 IMDB 数据库包含 460,723 张人脸图片,Wikipedia 数据库包含 62,328 张人脸图片,共计 523,051 张人脸图片,该数据库中每张图片都被标注年龄和性别,但很可惜,标注质量差强人意,年龄信息标注不精准,性别信息也存在标注错误的情况,勉强凑合用吧。官网也强调MDB-WIKI数据并不能保证年龄信息的准确性。

为提高IMDB-WIKI数据的质量,项目对该数据集进行了大规模的清洗,数据清洗完后,Wikipedia 数据训练数据43590张图片,测试数据3000张图片,清洗后的数据称为wiki_crop;IMDB数据清洗完后,训练数据158868张图片,测试数据10000张图片,清洗后的数据称为imdb_crop,标注格式统一转换为:

  • 数据格式:image_path age gender xmin ymin xmax ymax

尽管,项目已经对该数据进行了清洗,但依然无法保证该数据的质量,实际项目开发中,还请谨慎使用。


5.数据集下载

数据集下载地址:可公众号【AI吃大瓜】咨询联系

内容包含:

  1. MegaAge_Asian亚洲人脸数据集,标注了年龄和性别标签,其中训练集37563,测试集3583
  2. MORPH欧美人脸数据集,标注了年龄和性别标签,训练数据49096张图片,测试数据3000张图片
  3. IMDB-WIKI欧美人脸数据集,标注了年龄和性别标签,其中wiki_crop训练数据43590张图片,测试数据3000张图片;imdb_crop训练数据158868张图片,测试数据10000张图片
  4. 标注格式统一转换为:image_path age gender xmin ymin xmax ymax

6.年龄性别预测和识别(Python/C++/Android) 

  1.  年龄性别预测1:年龄性别数据集说明(含下载地址)https://blog.csdn.net/guyuealian/article/details/135127124
  2. 年龄性别预测2:Pytorch实现年龄性别预测和识别(含训练代码和数据)https://blog.csdn.net/guyuealian/article/details/135556789
  3. 年龄性别预测3:Android实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556824
  4. 年龄性别预测4:C/C++实现年龄性别预测和识别(含源码,可实时预测)https://blog.csdn.net/guyuealian/article/details/135556843

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/414011.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在线扒站网PHP源码-在线扒站工具网站源码

源码介绍 这是一款在线的网站模板下载程序,也就是我们常说的扒站工具,利用它我们可以很轻松的将别人的网站模板样式下载下来,这样就可以大大提高我们编写前端的速度了!注:扒取的任何站点不得用于商业、违法用途&#…

VSCode 插件推荐

前言 关于开发用的插件就不做赘述了,网上面有很多文章都做了推荐,本文推荐几个好看的插件。 文件图标主题 Vscode icons Material Icon Theme 字体主题 推荐 One Dark Pro 其他 推荐一个生成好看代码的网址 https://carbon.now.sh/

uniapp+vue3打包问题记录

**背景:**打包app出现问题,只显示底部导航的文字,其他一片空白 1. pages.json文件:tabBar中的iconPath图标格式不支持svg,只支持:png, jpg, jpeg的格式,当图片改为.png的时候可以正常显示 2. …

搭建开源数据库中间件MyCat2-配置mysql数据库双主双从

mycat2官网:MyCat2 前言:mycat2下载地址无法访问,不知道是不是被DNS污染了,还是需要搭梯子访问,所以我只能找到1.21的版本进行安装。搭建mycat2的前提是搭建数据库主从复制。 架构:双主双从 配置&#xf…

在线App封装技术:HTML5的新生命

HTML5封装的魅力所在HTML5带来了丰富的多媒体功能、地理位置服务、离线存储等特性,使得Web应用的体验更加接近原生App。封装HTML5到App中,可以大大缩短开发周期,降低开发成本,并且一次编写,多平台运行,极大…

一套可以替代人工的Cnc机床自动上下料机器人

Cnc机床自动上下料|整体解决方案 CNC机床自动上下料是指通过自动化设备和系统,实现CNC机床在加工过程中自动进行上下料操作。这种自动化系统通常包括自动送料机和卸料机,可以根据加工工件的尺寸和形状自动调整上下料的位置和角度,从而提高生产…

Git提交 ssh: connect to host github.com port 22: Connection timed out解决方案

你们好,我是金金金。 场景 之前都是好好的,不知道今天为什么提交代码就这样了 排查 根据英文可以看出,ssh端口号被拒绝了,22号端口不行,那就换一个端口 造成error的原因 ssh端口被拒绝 解决 找到.ssh文件&#xff…

【数据库原理】(27)数据库恢复

在数据库系统中,恢复是指在发生某种故障导致数据库数据不再正确时,将数据库恢复到已知正确的某一状态的过程。数据库故障可能由多种原因引起,包括硬件故障、软件错误、操作员失误以及恶意破坏。为了确保数据库的安全性和完整性,数…

RK3568 android11 移植 v4l2loopback 虚拟摄像头

一,v4l2loopback 简介 v4l2loopback是一个Linux内核模块,它允许用户创建虚拟视频设备。这种虚拟视频设备可以用于各种用途,例如将实际摄像头的视频流复制到虚拟设备上,或者用于视频流的处理和分析等。v4l2loopback的主要作用是创…

python数字图像处理基础(十)——背景建模

目录 背景建模背景消除-帧差法混合高斯模型 背景建模 背景建模是计算机视觉和图像处理中的一项关键技术,用于提取视频中的前景对象。在视频监控、运动检测和行为分析等领域中,背景建模被广泛应用。其基本思想是通过对视频序列中的像素进行建模&#xff…

【RT-DETR有效改进】轻量化CNN网络MobileNetV2改进特征提取网络

前言 大家好,这里是RT-DETR有效涨点专栏。 本专栏的内容为根据ultralytics版本的RT-DETR进行改进,内容持续更新,每周更新文章数量3-10篇。 专栏以ResNet18、ResNet50为基础修改版本,同时修改内容也支持ResNet32、ResNet101和PP…

4. 示例:更改监听端口

默认Spring Boot启动是监听在8080上的。 如果8080被使用,就会报以下错误。 这个时候可以更换一个新的端口。 server: port: 8180 然后再启动,启动成功并且绑定到端口8180。