部署 YOLOv5 目标检测模型

本教程将介绍如何训练官方 YOLOv5 目标检测模型，并将训练好的模型部署到 Grove Vision AI(V2) 或 XIAO ESP32S3 设备上。

数据集准备

推荐使用 roboflow 平台获取数据集。该平台可以进行数据集标注和一些数据增强策略，并支持导出多种数据集格式。您可以查看 yolov5 数据集准备介绍

克隆 YOLOv5 官方仓库

默认情况下，您已经拥有 python 环境和 pip 包管理工具，且 python>=3.8。

# 克隆 YOLOv5 官方仓库
git clone https://github.com/ultralytics/yolov5

安装所需环境

# 切换到 YOLOv5 文件夹
cd yolov5
# 使用 pip 安装所需依赖
pip install -r requirements.txt

训练

执行以下命令开始训练模型

python train.py  --weights yolov5n.pt --data ${dataset yaml file path} --imgsz 192

导出模型为 tflite

训练完成后，模型将位于 runs/train/exp*/weights/ 文件夹中。确保您的模型评估指标满足您的需求。
首先使用以下命令导出 saved_model 格式模型

python export.py --weights ${Your trained model path (.pt format)}  --imgsz 192 --include saved_model

然后使用以下代码对导出的 saved_model 模型进行量化并转换为 tflite 模型格式

import tensorflow as tf
import os.path as osp


converter = tf.lite.TFLiteConverter.from_saved_model(r'Your saved_model folder path')

tflite_model = converter.convert()

def representative_dataset():
  for _ in range(100):
    yield [
        tf.random.uniform((1, 192, 192
                           , 3))
    ]

converter.optimizations = [
    tf.lite.Optimize.DEFAULT
]
converter.target_spec.supported_ops = [
    tf.lite.OpsSet.TFLITE_BUILTINS_INT8
]
converter.inference_input_type = tf.int8
converter.inference_output_type = tf.int8
converter.representative_dataset = representative_dataset

tflite_quant_model = converter.convert()

with open(osp.join(r'The location path to be saved','yolov5n_int8.tflite'), 'wb') as f:
    f.write(tflite_quant_model)

之后，您将在保存路径文件夹下看到一个 yolov5n_int8.tflite 模型文件，该模型文件可以部署到 Grove Vision AI(V2) 或 XIAO ESP32S3 设备上。

模型图优化

Grove Vision AI (V2) 支持 vela 优化的模型，也可以加速模型推理。首先，执行以下命令安装 vela 命令行工具（XIAO ESP32S3 设备暂不支持）。

pip3 install ethos-u-vela

之后，您需要下载 vela 相关配置文件，或将以下内容复制到文件中，可命名为 vela_config.ini

; file: my_vela_cfg.ini ; ----------------------------------------------------------------------------- 
; Vela configuration file ; ----------------------------------------------------------------------------- 
; System Configuration 

; My_Sys_Cfg 
[System_Config.My_Sys_Cfg] 
core_clock=400e6 
axi0_port=Sram 
axi1_port=OffChipFlash 
Sram_clock_scale=1.0 
Sram_burst_length=32 
Sram_read_latency=16 
Sram_write_latency=16 
Dram_clock_scale=0.75 
Dram_burst_length=128 
Dram_read_latency=500 
Dram_write_latency=250 
OnChipFlash_clock_scale=0.25 
OffChipFlash_clock_scale=0.015625 
OffChipFlash_burst_length=32 
OffChipFlash_read_latency=64 
OffChipFlash_write_latency=64 
; ----------------------------------------------------------------------------- 
; Memory Mode 
; My_Mem_Mode_Parent 
[Memory_Mode.My_Mem_Mode_Parent] 
const_mem_area=Axi1 
arena_mem_area=Axi0 
cache_mem_area=Axi0

最后，使用以下命令进行图优化

vela --accelerator-config ethos-u55-64 \ 
    --config vela_config.ini \
    --system-config My_Sys_Cfg \
    --memory-mode My_Mem_Mode_Parent \
    --output-dir ${Save path of the optimized model} \
    ${The path of the tflite model that needs to be optimized}

部署

需要部署的模型文件是上面导出的 tflite 文件。您可以根据以下教程将模型文件烧录到目标设备。
我们强烈推荐使用我们的网页工具将训练好的 tflite 模型烧录到设备中。详细操作请参考部署教程

注意： 由于 ESP32S3 设备不支持 vela 图优化后的模型部署，如果您想将模型部署到 XIAO ESP32S3 设备，则无需执行 tflite 模型图优化。

数据集准备​

克隆 YOLOv5 官方仓库​

训练​

导出模型为 tflite​

模型图优化​

部署​

数据集准备

克隆 YOLOv5 官方仓库

训练

导出模型为 tflite

模型图优化

部署