Milk-V Duo开发板实战——基于MobileNetV2的的图像分类
本教程介绍使用TPU-MLIR工具链对MobileNet-Caffe模型进行转换,生成MLIR以及MLIR量化成INT8模型,并在Milk-V Duo开发板上进行部署测试,完成图像分类任务,涉及以下步骤:
🚩【注意】🚩:Milk-V Duo开发板搭载的是CV1800B芯片,该芯片支持ONNX系列和Caffe模型,目前不支持TFLite模型量化数据类型方面,目前支持BF16格式的量化、INT8格式的非对称量化
- 工作环境准备
- MobileNet-Caffe模型转换
- 部署 INT8 cvimodel 到Duo开发板并验证
以下对此3个步骤展开详细介绍。
1. 工作环境准备
1.1 配置docker开发环境
安装并配置docker:
sudo apt install docker.io
sudo systemctl start docker
sudo systemctl enable docker
sudo groupadd docker
sudo usermod -aG docker $USER
newgrp docker
从docker hub拉取镜像文件:
docker pull sophgo/tpuc_dev:v2.2
运行docker创建容器,其中的duodev
是容器名称,可自行修改;创建后默认目录为/workspace
:
docker run --privileged --network=host --name duodev -v $PWD:/workspace -it sophgo/tpuc_dev:v2.2
docker环境内配置网络并安装基本依赖:
apt-get update
apt-get install net-tools
下载tpu-mlir模型转换工具链,包命名格式为tpu-mlir_xxxx.tar.gz
,其中xxxx
为版本号,此教程以版本v1.2.89-g77a2268f-20230703
为例:
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu-mlir_v1.2.89-g77a2268f-20230703.tar.gz
解压工具链并导入环境变量:
tar zxf tpu-mlir_v1.2.89-g77a2268f-20230703.tar.gz
source tpu-mlir_v1.2.89-g77a2268f-20230703/envsetup.sh
1.2 准备工作目录
下载官网的MobileNet模型:
git clone https://github.com/shicai/MobileNet-Caffe.git
创建 mobilenet_v2
目录,并将克隆的 MobileNet-Caffe
目录(后文用 ${MOBILE_DIR}
指代)下的模型文件、 tpu-mlir
工具链目录(后文用 ${TPUMLIR_DIR}
指代)下的图片文件放入此目录下,并再创建名为workspace
的工作目录(后文用 ${WORK_DIR}
指代),用于存放编译生成的MLIR、cvimodel等文件:
mkdir mobilenet_v2 && cd mobilenet_v2
cp ${MOBILE_DIR}/mobilenet_v2_deploy.prototxt .
cp ${MOBILE_DIR}/mobilenet_v2.caffemodel .
cp -rf ${TPUMLIR_DIR}/regression/dataset/ILSVRC2012/ .
cp -rf ${TPUMLIR_DIR}/regression/image/ .
mkdir workspace && cd workspace
2. MobileNet-Caffe模型转换
模型转换步骤如下:
- Caffe模型转换成MLIR
- 生成量化需要的校准表
- MLIR量化成 INT8 非对称cvimodel
2.1 Caffe模型转换成MLIR
模型输入是图片, 在转模型之前我们需要了解模型的预处理。如果模型用预处理后的npz文件做输入, 则不需要考虑预处理。预处理过程用公式表达如下( x x x代表输入):
y = ( x − m e a n ) × s c a l e y = (x-mean)\times scale y=(x−mean)×scale
本例中的模型是 BGR 输入, mean和scale分别为 103.94,116.78,123.68
和 0.017,0.017,0.017
,模型转换命令如下:
model_transform.py \--model_name mobilenet_v2 \--model_def ../mobilenet_v2_deploy.prototxt \--model_data ../mobilenet_v2.caffemodel \--input_shapes [[1,3,224,224]] \--resize_dims=256,256 \--mean 103.94,116.78,123.68 \--scale 0.017,0.017,0.017 \--pixel_format bgr \--test_input ../image/cat.jpg \--test_result mobilenet_v2_top_outputs.npz \--mlir mobilenet_v2.mlir
执行model_transform.py
脚本生成的文件如下图所示:
2.2 生成量化需要的校准表
运行run_calibration.py
得到校准表,输入数据的数量根据情况准备100~1000张左右。
这里用现有的100张来自ILSVRC2012的图片举例,执行calibration命令:
run_calibration.py mobilenet_v2.mlir \--dataset ../ILSVRC2012 \--input_num 100 \-o mobilenet_v2_cali_table
运行完成后会生成名为 ${model_name}_cali_table
的文件, 该文件用于后续编译INT8模型的输入文件。
2.3 MLIR量化成 INT8 非对称cvimodel
🚩【注意】🚩:Milk-V Duo开发板搭载的是CV1800B芯片,该芯片支持ONNX系列和Caffe模型,目前不支持TFLite模型量化数据类型方面,目前支持BF16格式的量化、INT8格式的非对称量化,故此节中使用
model_deploy.py
脚本参数使用asymmetric进行非对称量化
将MLIR文件转成INT8非对称量化模型,执行如下命令:
model_deploy.py \--mlir mobilenet_v2.mlir \--asymmetric \--calibration_table mobilenet_v2_cali_table \--fuse_preprocess \--customization_format BGR_PLANAR \--chip cv180x \--quantize INT8 \--test_input ../image/cat.jpg \--model mobilenet_v2_cv1800_int8_asym.cvimodel
编译完成后, 会生成名为 ${model_name}_cv1800_int8_asym.cvimodel
的文件,如下图所示:
3. 部署 INT8 cvimodel 到Duo开发板并验证
此文档不赘述Duo的工作环境配置,默认已能成功连接开发板,备注Duo开发板连接信息如下:
IP: 192.168.42.1
user: root
password: milkv
下载开发板上运行需要的cvitek_tpu_sdk
:
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu_sdk_t4.1.0-14-g3e77050/cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz
将该cvitek_tpu_sdk
包上传到Duo开发板上:
scp cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz root@192.168.42.1:/cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz
在${WORK_DIR}
目录下,复制生成的${model_name}_cv1800_int8_asym.cvimodel
到Duo开发板上:
scp mobilenet_v2_cv1800_int8_asym.cvimodel root@192.168.42.1:/mobilenet_v2_cv1800_int8_asym.cvimodel
注意:此节以下内容在Duo开发板上进行
ssh连接Duo开发板,可以看到刚才传输的cvitek_tpu_sdk
包和cvimodel
:
ssh root@192.168.42.1
解压cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz
,导入环境变量,进入samples
目录进行测试:
# 解压包
tar zxf cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz# 导入cvitek_tpu_sdk的目录,例如本例中是TPU_ROOT=/cvitek_tpu_sdk
export TPU_ROOT=$PWD/cvitek_tpu_sdk# 进入sdk目录并导入环境变量
cd cvitek_tpu_sdk && source ./envs_tpu_sdk.sh# 打印cvimodel info,$MODEL_PATH为放cvimodel的目录
cd samples
./bin/cvi_sample_model_info $MODEL_PATH/mobilenet_v2_cv1800_int8_asym.cvimodel# 测试
./bin/cvi_sample_classifier_fused_preprocess \$MODEL_PATH/mobilenet_v2_cv1800_int8_asym.cvimodel \./data/cat.jpg \./data/synset_words.txt
注意:
sample
目录下的samples_extra
提供了更多samples脚本,但其中cvimodel名字已经硬编码在其中,如想使用脚本运行,需要自行修改cvimodel名字。- 此小节介绍的是使用预编译好的sample程序对转换好的cvimodel进行部署测试,如果开发者有兴趣对samples源码进行编码和交叉编译,请参考官网TPU-MLIR文档中的第9章《CV18xx芯片使用指南》中的第3小节“编译和运行runtime sample”内容。
附录
正文涉及到的文件总结如下:
- TPU-MLIR模型转换工具链:tpu-mlir_v1.2.89-g77a2268f-20230703.tar.gz
- TPU SDK开发工具包:cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz
- (附)Sample测试例程源码:cvitek_tpu_samples.tar.gz
- (附)转换好的cvimodel包:cvimodel_samples_cv180x.tar.gz
正文提到的TPU开发所需的包文件可在下面sftp站点获取:
sftp://218.17.249.213
user: cvitek_mlir_2023
password: 7&2Wd%cu5k
或者直接使用wget获取:
# TPU-MLIR模型转换工具链
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu-mlir_v1.2.89-g77a2268f-20230703.tar.gz# TPU SDK开发工具包
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu_sdk_t4.1.0-14-g3e77050/cvitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz# (附)Sample测试例程源码
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu_sdk_t4.1.0-14-g3e77050/cvitek_tpu_samples.tar.gz# (附)转换好的cvimodel包
vitek_tpu_sdk_cv180x_musl_riscv64_rvv.tar.gz
# (附)Sample测试例程源码
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu_sdk_t4.1.0-14-g3e77050/cvitek_tpu_samples.tar.gz# (附)转换好的cvimodel包
wget --user='cvitek_mlir_2023' --password='7&2Wd%cu5k' ftp://218.17.249.213/home/tpu_sdk_t4.1.0-14-g3e77050/cvimodel_samples_cv180x.tar.gz