基于opencv+ImageAI+tensorflow的智能动漫人物识别系统——深度学习算法应用(含python、JS、模型源码)+数据集(三)

目录

  • 前言
  • 总体设计
    • 系统整体结构图
    • 系统流程图
  • 运行环境
    • 爬虫
    • 模型训练
    • 实际应用
  • 模块实现
    • 1. 数据准备
      • 1)爬虫下载原始图片
      • 2)手动筛选图片
    • 2. 数据处理
      • 1)切割得到人物脸部
      • 2)重新命名处理后的图片
      • 3)添加到数据集
    • 3. 模型训练及保存
      • 1)设置基本参数
      • 2)模型保存
      • 3)模块预测
  • 相关其它博客
  • 工程源代码下载
  • 其它资料下载


在这里插入图片描述

前言

本项目通过爬虫技术获取图片,利用OpenCV库对图像进行处理,识别并切割出人物脸部,形成了一个用于训练的数据集。通过ImageAI进行训练,最终实现了对动漫人物的识别模型。同时,本项目还开发了一个线上Web应用,使得用户可以方便地体验和使用该模型。

首先,项目使用爬虫技术从网络上获取图片。这些图片包含各种动漫人物,其中我们只对人物脸部进行训练,所以我们会对图像进行处理,并最终将这些图像将作为训练数据的来源。

其次,利用OpenCV库对这些图像进行处理,包括人脸检测、图像增强等步骤,以便准确识别并切割出人物脸部。这一步是为了构建一个清晰而准确的数据集,用于模型的训练。

接下来,通过ImageAI进行训练。ImageAI是一个简化图像识别任务的库,它可以方便地用于训练模型,这里用于训练动漫人物的识别模型。

最终,通过项目开发的线上Web应用,用户可以上传动漫图像,系统将使用训练好的模型识别图像中的动漫人物,并返回相应的结果。

总的来说,本项目结合了爬虫、图像处理、深度学习和Web开发技术,旨在提供一个便捷的动漫人物识别服务。这对于动漫爱好者、社交媒体平台等有着广泛的应用前景。

总体设计

本部分包括系统整体结构图和系统流程图。

系统整体结构图

系统整体结构如图所示。

在这里插入图片描述

系统流程图

系统流程如图所示。

在这里插入图片描述

运行环境

本部分包括爬虫、模型训练及实际应用运行环境。

爬虫

安装Python3.6以上及Selenium3.0.2版本。

详见博客。

模型训练

本部分包括安装依赖、安装ImageAI。

详见博客。

实际应用

实际应用包括前端开发环境和后端环境的搭建。

详见博客。

模块实现

本项目包括4个模块:数据准备、数据处理、模型训练及保存、模型测试,下面分别介绍各模块的功能及相关代码。

1. 数据准备

本项目的数据来自于百度图片,通过爬虫获取。

1)爬虫下载原始图片

详见博客。

2)手动筛选图片

部分人物的名称、现实事物或人物有重名现象,加上一些图片质量不佳,需要人为剔除,手动筛选。

详见博客。

2. 数据处理

将图片中的人脸裁剪进行模型训练,切割人脸部分由OpenCV通过训练好的动漫人物脸部识别模型lbpcascade_animeface截取人物脸部。GitHub下载地址为https://github.com/nagadomi/lbpcascade_animeface。

1)切割得到人物脸部

相关代码如下:

#基本参数设定
SRC = "Raw"    #待处理的文件路径
DST = "Data"   #处理后的文件路径
TRAIN_PER = 5  #训练的图片比例
TEST_PER = 1   #测试的图片比例
#处理原图片得到人物脸部图片并按比例分配训练和测试用于训练模型
for image_file in files:  #读取所有图片image_file = image_file.replace('\\', '/')  #解决Windows下的文件路径问题target_path = "/".join(image_file.strip("/").split('/')[1:-1])target_path = os.path.join(dst, target_path) + "/"if not os.path.exists(target_path):os.makedirs(target_path)
count = len(os.listdir(target_path)) + 1
image = cv2.imdecode(np.fromfile(image_file, dtype=np.uint8), -1)  
#解决中文路径读入图片问题gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  #OpenCV的设置gray = cv2.equalizeHist(gray)  #转化为灰度图片faces = cascade.detectMultiScale(gray,scaleFactor=1.05,  #指定每个图像缩放比例,缩小图像大小的参数minNeighbors=4,    #此参数将影响检测到的面孔,值越高,检测结果越少,质量越好minSize=(24, 24)   #最小对象大小或者小于此值的对象将被忽略for (x, y, w, h) in faces:crop_img = image[y:y + h, x:x + w]crop_img = cv2.resize(crop_img, (96, 96))  #重置为96*96filename = os.path.basename(image_file).split('.')[0]   cv2.imencode('.jpg',crop_img)[1].tofile(os.path.join(target_path, str(count) + ".jpg")) #保存切割的脸部

处理前和处理后的效果如图所示。

在这里插入图片描述

处理前图片

在这里插入图片描述

处理后图片

2)重新命名处理后的图片

对于处理后的图片,需要重新指定文件名称以便于统计和处理。相关代码如下:

def rename_files(dir, prefix='', joiner='_', startNum=0,changeType='', ignoreType='', typeOnly=''):'''重命名一个文件夹中的所有文件Args:dir(string):  重命名文件夹的路径prefix(string):  文件名前缀joiner(string):  连接文件名前缀和数字的连接符,默认为下划线startNum(int):  重命名文件的开始数字,默认为0changeType(string):  把文件重命名为指定类型,默认不指定类型typeOnly(string):  只处理指定类型的文件,使用空格分割,例如“.jpg .jpeg .png .bmp .webp”ignoreType(string):  忽略处理文件的类型,使用空格分割,例如,“.py .docx”'''for root, _, files in os.walk(dir):root = root.replace('\\', '/')if prefix == '':prefix = root.split('/')[-1]count = startNumfor file in files:true_type = os.path.splitext(file)[-1]  #文件真实类型type_list = typeOnly.split()ignore_list = ignoreType.split()if true_type in type_list or len(type_list) == 0:if true_type in ignore_list:continueif changeType == '':  #是否指定改变类型file_type = true_typeelse:file_type = changeTypenew_name = "{}{}{}{}".format(prefix, joiner, str(count), file_type)path = os.path.join(root, new_name)old_path = os.path.join(root, file)if old_path == path:continueif not os.path.exists(path):os.rename(old_path, path)count = count + 1
def main():parser = argparse.ArgumentParser(description="重命名指定文件夹下的所有文件")parser.add_argument("dir", type=str, help="重命名文件的路径")parser.add_argument("--prefix", "-p", type=str,default='', help="前缀,默认为文件名")parser.add_argument("--joiner", "-j", type=str, default="_", help="连接符")parser.add_argument("--startNum", "-s", type=int, default=0, help="开始数")parser.add_argument("--changeType", "-c", type=str,default='', help="重命名文件为指定类型")parser.add_argument("--ignoreType", "-i", type=str,default='', help="忽略处理的类型,使用空格分割")parser.add_argument("--typeOnly", "-t", type=str,default='', help="指定处理的类型,使用空格分割")args = parser.parse_args()rename_files(dir=args.dir, joiner="_temp_", ignoreType=args.ignoreType, typeOnly=args.typeOnly)rename_files(dir=args.dir, prefix=args.prefix, joiner=args.joiner, startNum=args.startNum,changeType=args.changeType, ignoreType=args.ignoreType, typeOnly=args.typeOnly)
print("Rename files finished")

3)添加到数据集

已经切割得到的脸部经过重新排序命名后,按照一定的比例添加到数据集。相关代码如下:

def divide_train_test(src, train_percentage=5, test_percentage=1):if not os.path.exists(src):print("folder %s is not exist" % src)returndirs = os.listdir(src)test_dir = os.path.join(src, "test")train_dir = os.path.join(src, "train")  #训练数据路径if not os.path.exists(test_dir):os.mkdir(test_dir)if not os.path.exists(train_dir):os.mkdir(train_dir)for dir_name in dirs:if dir_name != "test" and dir_name != "train":current_dir = os.path.join(src, dir_name)test_dir = os.path.join(src, "test", dir_name)  #测试集路径train_dir = os.path.join(src, "train", dir_name)  #训练集路径if not os.path.exists(test_dir):os.mkdir(test_dir)if not os.path.exists(train_dir):os.mkdir(train_dir)if os.path.isdir(current_dir):images = os.listdir(current_dir)image_num = len(images)for image in images:filename = os.path.basename(image).split('.')[0]if filename.isdigit():percentage = train_percentage + test_percentagetest_num = (image_num / percentage) * test_percentage + 1if int(filename) <= test_num:if not os.path.exists(os.path.join(test_dir, image)):shutil.move(os.path.join(current_dir, image), os.path.join(test_dir))else:os.remove(os.path.join(current_dir, image))else:if not os.path.exists(os.path.join(train_dir, image)):shutil.move(os.path.join(current_dir, image), os.path.join(train_dir))else:os.remove(os.path.join(current_dir, image))shutil.rmtree(current_dir)for dirs in os.listdir(src):for name in os.listdir(os.path.join(src, dirs)):if os.path.isdir(os.path.join(src, dirs, name)):rename_file(os.path.join(src, dirs, name))print("Set all cropped images to train and test")

3. 模型训练及保存

本部分包括设置基本参数、模型保存和模块预测。

1)设置基本参数

相关代码如下:

DATA_PATH = "Datas" #数据集路径
TRAIN_NUM = 30       #训练次数
BATCH = 5             #批次
model_trainer = ModelTraining()
model_trainer.setModelTypeAsResNet()        #训练算法
model_trainer.setDataDirectory(data_path)  #训练目录
model_trainer.trainModel(num_objects=num_obj,  
#该参数用于指定图像数据集中对象的数量
num_experiments=train_num,  #该参数用于指定图像训练的次数
enhance_data=True,  #该参数用于指定是否生成训练图像的副本以获得更好的性能
batch_size=batch,  #该参数用于指定批次数量,分批训练,直到所有批次训练集都完成为止
show_network_summary=True #该参数用于指定是否在控制台中显示训练的过程 

2)模型保存

模型每次训练完成都会输出一个.h5文件和对应的.json文件,如图1所示。model_class.json文件中包含人物名称,molde_ex-xxx_acc_xxxxxx.h5中ex后的数字表示训练次数,acc后的数字表示对应的精度。model_class.json文件中的人物名称如图2所示,采用Unicode编码。训练好的模型保存后可重复使用,也可移植到其他环境中使用。

在这里插入图片描述

图1 训练模型后输出结果

在这里插入图片描述

图2 model_class.json文件中的人物名称

3)模块预测

相关代码如下:

#设置基本参数
IMAGE_PATH = "uploader/"  #预测图片路径
MODEL_PATH = "data/models/model_ex-150_acc-0.883871.h5"  #模型路径
JSON_PATH = "data/json/model_class.json"  #json文件路径
RESULT_COUNT = 3  #显示预测结果的数量
prediction = CustomImagePrediction()  #初始化ResNet
prediction.setModelTypeAsResNet()  #设置ResNet模型
#预测函数
def predict(img_path, model_path=MODEL_PATH, json_path=JSON_PATH, result_count=RESULT_COUNT):if not os.path.exists(img_path):print("Can not found img %s" % img_path)returnwith open(json_path) as f:num_obj = len(json.load(f))print(num_obj)prediction.setModelPath(model_path)prediction.setJsonPath(json_path)prediction.loadModel(num_objects=num_obj)predictions, probabilities = prediction.predictImage(img_path, result_count=result_count)result = {}i = 1for eachPrediction, eachProbability in zip(predictions, probabilities):result[i]={eachPrediction: str(round(float(eachProbability), 2)) + '%' }i = i + 1print(result)return result

相关其它博客

基于opencv+ImageAI+tensorflow的智能动漫人物识别系统——深度学习算法应用(含python、JS、模型源码)+数据集(一)

基于opencv+ImageAI+tensorflow的智能动漫人物识别系统——深度学习算法应用(含python、JS、模型源码)+数据集(二)

基于opencv+ImageAI+tensorflow的智能动漫人物识别系统——深度学习算法应用(含python、JS、模型源码)+数据集(四)

工程源代码下载

详见本人博客资源下载页


其它资料下载

如果大家想继续了解人工智能相关学习路线和知识体系,欢迎大家翻阅我的另外一篇博客《重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载》
这篇博客参考了Github知名开源平台,AI技术平台以及相关领域专家:Datawhale,ApacheCN,AI有道和黄海广博士等约有近100G相关资料,希望能帮助到所有小伙伴们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/217128.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析Selenium动作链:精通点击、拖拽、切换等操作

背景&#xff1a; 一些交互动作都是针对某个节点执行的。比如&#xff0c;对于输入框&#xff0c;我们就调用它的输入文字和清空文字方法&#xff1b;对于按钮&#xff0c;就调用它的点击方法。其实&#xff0c;还有另外一些操作&#xff0c;它们没有特定的执行对象&#xff0…

JAVA创建线程方式有几种

方式1&#xff1a;继承Thread类 步骤&#xff1a; 创建一个继承于Thread类的子类重写Thread的run()方法创建当前Thread子类的对象通过实例对象调用start()方法&#xff0c;启动线程----》JAVA虚拟机会调用run()方法 实现&#xff1a; public class TestMyThread {public sta…

html实现各种瀑布流(附源码)

文章目录 1.设计来源1.1 动态响应瀑布流1.2 分页瀑布流1.3 响应瀑布流 2.效果和源码2.1 动态效果2.2 源代码 源码下载 作者&#xff1a;xcLeigh 文章地址&#xff1a;https://blog.csdn.net/weixin_43151418/article/details/134613121 html实现各种瀑布流(附源码)&#xff0c;…

pwn:[NISACTF 2022]ReorPwn?

题目 按正常方式走&#xff0c;发现指令被反着输出

十大排序之计数排序、桶排序、基数排序(详解)

文章目录 &#x1f412;个人主页&#x1f3c5;算法思维框架&#x1f4d6;前言&#xff1a; &#x1f380;计数排序 时间复杂度O(nk)&#x1f387;1. 算法步骤思想&#x1f387;2.动画实现&#x1f387; 3.代码实现 &#x1f380;桶排序&#x1f387;1. 算法步骤思想&#x1f38…

list的总结

目录 1.什么是list 1.1list 的优势和劣势 优势&#xff1a; 劣势&#xff1a; 2.构造函数 2.1 default (1) 2.2 fill (2) 2.3 range (3) 2.4 copy (4) 3.list iterator的使用 3.1. begin() 3.2. end() 3.3迭代器遍历 4. list容量函数 4.1. empty() 4.2. siz…

开源vs闭源,处在大模型洪流中,向何处去?

文章目录 一、开源和闭源的优劣势比较1.1 开源优势1.2 闭源的优势 二、开源和闭源对大模型技术发展的影响2.1 数据共享2.2 算法创新2.3 业务拓展2.4 安全性和隐私2.5 社会责任和伦理 三、开源与闭源的商业模式比较3.1 盈利模式3.2 市场竞争3.3 用户生态3.4 创新速度 四&#xf…

基于厨师算法优化概率神经网络PNN的分类预测 - 附代码

基于厨师算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于厨师算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于厨师优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要&#xff1a;针对PNN神经网络的光滑…

Java Web 学习之路(1) —— 前端篇

文章目录 前言1. JS1.1 引入方式1.2 基础语法1.3 函数1.4 对象1.5 事件监听 2. Vue3. Ajax4. Element5. Nginx 前言 在学习后端前&#xff0c;还需要大致了解下前端的一些知识&#xff0c;所以本篇就先快速把前端的一些知识过一遍。本篇不含过多干货和技术知识&#xff0c;仅仅…

python排序算法_归并排序

什么是归并排序&#xff1a; 归并排序是一种基于分治法的排序算法。它的基本思想是将待排序的序列分成若干个子序列&#xff0c;分别进行排序&#xff0c;然后再将已排序的子序列合并成一个有序的序列。 基本思想&#xff1a; 归并排序是用分治思想&#xff0c;分治模式在每一…

Loadrunner安装大全

目录 一 、下载篇 二、安装篇 三、破解篇 四、Loadrunner支持哪些操作系统&#xff1f; 五、安装Loadrunner需要满足哪些系统要求&#xff1f; 六、安装Loadrunner时是否需要注意什么问题&#xff1f; 七、安装完成后如何验证Loadrunner是否正常工作&#xff1f; 八、如…

网络层(IP协议)

文章目录 网络层IP协议IP协议报头32位源IP地址和目的IP地址:为了解决IP地址不够用的情况 IP地址管理子网掩码特殊IP 路由选择(简介) 网络层 网络层主要负责地址管理和路由选择.代表协议就是IP协议. IP协议 IP协议报头 4位版本: 4: 表示IPv4 ; 6: 表示IPv6 4位首部长度: 描述…