微信小程序+中草药分类+爬虫+keras

目录

  • 1 介绍
  • 2 数据爬虫
  • 3 模型训练和验证
    • 3.1 模型训练
    • 3.2 导入一张图片进行验证
  • 4 后台flask部署
  • 5 微信小程序

1 介绍

本项目使用深度学习模型,训练5种中药材数据集,然后将其集成到微信小程序,通过微信小程序拍照,将图片传输给后端,后端将返回的结果展示到前端页面,项目主要包含以下内容:

  • 数据爬取:使用爬虫爬取百度图片,可以自己定义要爬取的中草药种类、数量等信息。
  • 模型训练使用基于keras训练分类模型,模型可以修改,例如:ResNet50系列,MobileNet系列等,支持在gpu、cpu训练。
  • 后台flask部署:使用flask将模型部署到后台,提供ip地址和端口号
  • 前端微信小程序:制作前端的微信小程序页面,将图片传输给后端,并且将分类结果返回到前端展示

2 数据爬虫

使用requests进行爬虫
示例:

  for i in range(30):image_url = result['data'][i]['middleURL']image_name = "%d.jpg" % countresponse = requests.get(image_url, headers=headers, stream=True, timeout=10)with open(os.path.join(download_path, image_name), 'wb') as f:f.write(response.content)count += 1

爬取输入参数,可以自己输入爬取哪些中草药,输入到list里面即可,下面展示只爬取两种中草药。

# 设置搜索关键字和爬取图片的数量
name_list = ['枸杞','金银花']
save_path = "data_爬虫"
page_num = 1 #爬取多少页,每页30个
for keyword in name_list:get_images(save_path, keyword, page_num)

在这里插入图片描述
在这里插入图片描述

3 模型训练和验证

此处,我们分别使用keras版本进行训练和验证,具体代码和结果展示如下:

3.1 模型训练

导入必要的包

from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import Adam
from keras.applications import MobileNetV2
from keras.layers import GlobalAveragePooling2D, Dense
from keras.models import Sequential
import json
# 定义ImageDataGenerator
datagen = ImageDataGenerator(rescale=1./255,shear_range=0.2,zoom_range=0.2,horizontal_flip=True,validation_split=0.2  # 设置验证集的比例
)
base_model = MobileNetV2(weights='imagenet', include_top=False, input_shape=(224, 224, 3))model = Sequential([base_model,GlobalAveragePooling2D(),Dense(128, activation='relu'),Dense(num_classes, activation='softmax')
])
# 训练模型
model.fit(train_generator,steps_per_epoch=train_generator.samples // batch_size,epochs=10,validation_data=validation_generator,validation_steps=validation_generator.samples // batch_size)# 步骤6: 评估模型性能
eval_result = model.evaluate(validation_generator)
print(f"Test accuracy: {eval_result[1]*100:.2f}%")

部分结果截图

36/36 [==============================] - 22s 449ms/step - loss: 0.7144 - accuracy: 0.7664 - val_loss: 0.7706 - val_accuracy: 0.7278
Epoch 2/10
36/36 [==============================] - 13s 352ms/step - loss: 0.1504 - accuracy: 0.9601 - val_loss: 0.5325 - val_accuracy: 0.8278
Epoch 3/10
36/36 [==============================] - 13s 352ms/step - loss: 0.0959 - accuracy: 0.9829 - val_loss: 0.2743 - val_accuracy: 0.9222
Epoch 4/10
36/36 [==============================] - 13s 351ms/step - loss: 0.0896 - accuracy: 0.9758 - val_loss: 0.3960 - val_accuracy: 0.8500
Epoch 5/10
36/36 [==============================] - 13s 354ms/step - loss: 0.0743 - accuracy: 0.9758 - val_loss: 0.2853 - val_accuracy: 0.9111
Epoch 6/10
36/36 [==============================] - 13s 351ms/step - loss: 0.0525 - accuracy: 0.9829 - val_loss: 0.2473 - val_accuracy: 0.9222

3.2 导入一张图片进行验证

导入图片

import cv2
import numpy as np
import json
from keras.models import load_modeldef get_img(img_path,img_width, img_height ):img = cv2.imread(img_path)img = cv2.resize(img, (img_width, img_height))  # 调整图像大小img = img.astype("float") / 255.0  # 数据预处理,确保与训练时一致img = np.expand_dims(img, axis=0)return imgimg_width = 224
img_height = 224
model = load_model(r'E:\project\1-zhongcaoyao\model-keras.h5')
print(class_indict)
img_file_path = 'data_all/baihe/b (20).jpg'
classify_img = get_img(img_file_path,img_width, img_height)
results = np.squeeze(model.predict(classify_img)).astype(np.float64)  # 获得预测结果(注意:1.降维2.json中的小数类型为float)
predict_class = np.argmax(results)  # 获得预测结果中置信度最大值所对应的下标

例如:我们导入一张百合的图片,下面是输出结果。
在这里插入图片描述

注意,可能会出现如下错误,原因是模型路径包含中文名称,只需要把模型放到全英文路径下就行。

DecodeError: 'utf-8' codec can't decode byte 0xc6 in position 10: invalid continuation byte

4 后台flask部署

app = flask.Flask(__name__)
idx2class = {0:"百合",1:"党参",2:"枸杞",3:"槐花",4:"金银花"}idx2info ={}
# 导入药效信息
with open("info.txt", "r", encoding="UTF-8") as fin:lines = fin.readlines()for line in lines:idx = int(line.strip().split(":")[0])info = line.strip().split(":")[1]idx2info[idx] = info
img_bytes = flask.request.form.get('picture') # 获取值
image = base64.b64decode(img_bytes)# 编码转换
image = Image.open(io.BytesIO(image))
classify_img = prepare_image(image,224,224) # 预处理图像
results = np.squeeze(model.predict(classify_img)).astype(np.float64)  # 获得预测结果(注意:1.降维2.json中的小数类型为float)
predicted_idx = np.argmax(results)  # 获得预测结果中置信度最大值所对应的下标
score = results[predicted_idx]
label_name = idx2class[predicted_idx]
label_info = idx2info[predicted_idx]

在这里插入图片描述

5 微信小程序

我们使用一个界面,完成图片的上传,结果展示等
在这里插入图片描述
核心代码,将图片传输到后台,并且将data结果拿回来,再解析里面的各个字段,最后将字段展示出来。

wx.request({url: 'http://127.0.0.1:8080/predict', //本地服务器地址method: 'POST',header: {'content-type': 'application/x-www-form-urlencoded'},data: {"picture": that.data.picture,},success: (res)=>{that.setData({class_name: res.data['class_name'],prob: res.data['prob'],info:res.data['info']})

以上就是所有的内容,包含了前端后端、模型训练、数据爬取等功能,详细咨询完整代码:https://docs.qq.com/doc/DWEtRempVZ1NSZHdQ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/227866.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android 如何让路由器或者其他AP设备获取到主机名

问题原因: 连接到AP设备后,发现主机名在路由器或者其他AP设备都无法正常显示 抓取tcpdump log发现DHCP request option中没有携带host name(Option 12)字段 如下图所示 修改方法: 将config_dhcp_client_hostname配置true后,可以看到host name了 具体代码逻辑如下 pack…

Linux的Sysfs 接口

一、sysfs接口 在linux系统中,用户空间访问驱动程序一般是以“设备文件”的方式通过“read/write/ioctl”访问,还有一种方式,可以通过echo的方式来直接控制硬件或者修改驱动,也能为底层驱动提供一个接口便于应用层调用&#xff0c…

超级详细的JDK 安装与配置(包含二个或多个JDK的同时安装)

一、JDK介绍 1、较常用的四个JDK版本 JDK8(Java8JDK1.8),这个版本较为成熟稳定,是JDK的一个重要长期支持版本(LTS),在生产环境中使用非常广泛; JDK11,增加了大量实用的新特性,包括…

Tensorflow-gpu保姆级安装教程(Win11, Anaconda3,Python3.9)

Tensorflow-gpu 保姆级安装教程(Win11, Anaconda3,Python3.9) 前言Tensorflow-gpu版本安装的准备工作(一)、查看电脑的显卡:(二) 、Anaconda的安装(三)、cuda下载和安装(四)、cudnn下载安装(五)、配置环境变量(六)、创建 tensorfl…

【C++深入浅出】STL之string用法详解

目录 一. 前言 二. STL概要 2.1 什么是STL 2.2 STL的六大组件 2.3 STL的缺陷 三. string类概述 3.1 什么是string类 3.2 为什么要使用string类 四. string类的使用 4.1 包含头文件 4.2 构造函数 4.3 赋值运算符重载 4.4 容量操作 4.5 访问/遍历操作 4.6 查找修改…

【C++初阶】第一站:C++入门基础(上) -- 良心详解

前言: 从这篇文章开始,将进入C阶段的学习,此篇文章是c的第一站的上半篇,讲述C初阶的知识 目录 什么是C C的发展史 C关键字(C98) 命名空间 命名空间定义 命名空间使用 1.加命名空间名称及作用域限定符 2.使用using将命名空间中某个成员引入 3.使…

【JavaSE】基础笔记 - 类和对象(上)

目录 1、面向对象的初步认知 1.1、什么是面向对象 1.2、面向对象与面向过程 2. 类定义和使用 2.1、简单认识类 2.2、类的定义格式 2.3、自定义类举例说明 2.3.1、定义一个狗类 2.3.2、定义一个学生类 3、类的实例化 3.1、什么是实例化 3.2、类和对象的说明 1、面向…

华为P40无法链接adb的解决记录

真的很讨厌华为的设备,很多东西啥设备都能跑得好好的,就华为会出问题,简直就是手机界的IE。 情况:突然无法链接adb到P40,拔插无效,关闭开发人员选项再打开也无效,撤销USB调试授权也无效&#x…

局部性原理和伪共享

CPU Cache CPU Cache可以理解为CPU内部的高速缓存。CPU从内存读取数据时,将要读取的数据及其相邻地址的数据,即至少一个Cache Line,写入Cache,以便后续访问时提高读取速度。 CPU存在多级Cache,级别最高的离CPU最近&a…

别太担心,人类只是把一小部分理性和感性放到了AI里

尽管人工智能(AI)在许多方面已经取得了重大进展,但它仍然无法完全复制人类的理性和感性。AI目前主要侧重于处理逻辑和分析任务,而人类则具有更复杂的思维能力和情感经验。 人类已经成功地将一些可以数据化和程序化的理性和感性特征…

不同路径(力扣LeetCode)动态规划

不同路径 题目描述 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 问总共有多少条不同的路径&…

python基于YOLOv8全系列模型【n/s/m/l/x】开发构建不同参数量级的钢铁产业产品智能自动化检测识别系统

在前文的项目开发实践中,我们已经以钢铁产业产品缺陷检测数据场景为基准,陆续开发构建了多款目标检测模型,感兴趣的话可以自行阅读即可。 《YOLOv3老矣尚能战否?基于YOLOv3开发构建建钢铁产业产品智能自动化检测识别系统&#xf…