Skip to main content

在 Raspberry Pi 5 上使用 Hailo8 进行多流推理的基准测试

note

本文档由 AI 翻译。如您发现内容有误或有改进建议,欢迎通过页面下方的评论区,或在以下 Issue 页面中告诉我们:https://github.com/Seeed-Studio/wiki-documents/issues

简介

YOLOv8(You Only Look Once 第 8 版)是 YOLO 系列中最受欢迎的实时姿态估计和目标检测模型。它在前几代的基础上,通过在速度、精度和灵活性方面的多项改进,进一步提升了性能。Hailo8 被用于加速推理速度,提供 26 TOPS 的 AI 性能。

本文档展示了在 Raspberry Pi 5 上使用 Hailo8 进行 YOLOv8m 的目标检测基准测试。所有测试均使用相同的模型(YOLOv8m),量化为 int8,输入分辨率为 640x640,批量大小设置为 8。

准备硬件

reComputer AI R2130

在 RPi5 上安装 AI 套件

请参考 此文档

准备软件

更新系统:

sudo date -s "$(wget -qSO- --max-redirect=0 google.com 2>&1 | grep Date: | cut -d' ' -f5-8)Z"
sudo apt update
sudo apt full-upgrade

在 Hailo 官方网站下载软件

注意: 您需要一个官方 Hailo 账户并确保已登录。 点击此 链接 下载以下必要的库:

pir

在 Raspberry Pi 5 上安装 hailort_4.19.0_arm64.deb

sudo dpkg -i hailort_4.19.0_arm64.deb 

sudo reboot

安装 dkms

sudo apt-get install dkms

安装 hailort-pcie-driver_4.19.0_all.deb

sudo dpkg -i hailort-pcie-driver_4.19.0_all.deb 
sudo reboot

创建并激活 Python 虚拟环境

python -m venv hailo_env
source hailo_env/bin/activate

安装 hailort-4.19.0-cp311-cp311-linux_aarch64.whl

pip install hailort-4.19.0-cp311-cp311-linux_aarch64.whl 

检查软件是否已安装

hailortcli fw-control identify

结果如下所示:

ain@pi5-hailo:~ $ hailortcli fw-control identify
Executing on device: 0000:01:00.0
Identifying board
Control Protocol Version: 2
Firmware Version: 4.19.0 (release,app,extended context switch buffer)
Logger Version: 0
Board Name: Hailo-8
Device Architecture: HAILO8
Serial Number: HLLWM2B225100548
Part Number: HM218B1C2FAE
Product Name: HAILO-8 AI ACC M.2 M KEY MODULE EXT TEMP

将 PCIe 设置为 gen2/gen3(gen3 比 gen2 更快):

/boot/firmware/config.txt 中添加以下内容:

# 启用 PCIe 外部连接器

dtparam=pciex1

# 强制使用 Gen 3.0 速度

dtparam=pciex1_gen=3
note

如果您想使用 gen2,请注释掉 dtparam=pciex1_gen=3

安装 Tapps

安装必要的库

sudo apt-get install -y rsync ffmpeg x11-utils python3-dev python3-pip python3-setuptools python3-virtualenv python-gi-dev libgirepository1.0-dev gcc-12 g++-12 cmake git libzmq3-dev

sudo apt-get install -y libopencv-dev python3-opencv

sudo apt-get install -y libcairo2-dev libgirepository1.0-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev libgstreamer-plugins-bad1.0-dev gstreamer1.0-plugins-base gstreamer1.0-plugins-good gstreamer1.0-plugins-bad gstreamer1.0-plugins-ugly gstreamer1.0-libav gstreamer1.0-tools gstreamer1.0-x gstreamer1.0-alsa gstreamer1.0-gl gstreamer1.0-gtk3 gstreamer1.0-qt5 gstreamer1.0-pulseaudio gcc-12 g++-12 python-gi-dev

sudo apt install python3-gi python3-gi-cairo gir1.2-gtk-3.0

设置 hailo_pci 的 force_desc_page_size

sudo nano /etc/modprobe.d/hailo_pci.conf

然后输入以下内容:

options hailo_pci force_desc_page_size=4096

最后,按 Ctrl+X,输入 Y,然后按 Enter 保存文件。

然后重启 Raspberry Pi 5:

sudo reboot

下载 Tapps

git clone --depth 1 https://github.com/hailo-ai/tappas.git

下载 hailort 到 Tapps

cd tappas
mkdir hailort
git clone https://github.com/hailo-ai/hailort.git hailort/sources

修改 common.py

nano downloader/common.py

将内容修改如下,在 common.py 中添加 RaspberryPI5 = 'rpi5'

class Platform(Enum):
X86 = 'x86'
ARM = 'arm'
IMX8 = 'imx8'
Rockchip = 'rockchip'
RaspberryPI = 'rpi'
RaspberryPI5 = 'rpi5'

ANY = 'any'

def __str__(self):
return self.value

安装 Tappas

./install.sh --skip-hailort --target-platform rpi5

将批量大小更改为 8

cd ./apps/h8/gstreamer/general/multistream_detection/
nano multi_stream_detection.sh

在第 14 行添加 readonly DEFAULT_BATCH_SIZE=8,如下所示:

readonly DEFAULT_NETWORK_NAME="yolov5"
readonly DEFAULT_BATCH_SIZE=8
readonly MAX_NUM_OF_DEVICES=4

在第 19 行添加 batch_size=$DEFAULT_BATCH_SIZE,如下所示:

network_name=$DEFAULT_NETWORK_NAME
batch_size=$DEFAULT_BATCH_SIZE
num_of_src=12

在第 154 行添加 batch-size=$batch_size,如下所示:

queue name=hailo_pre_infer_q_0 leaky=no max-size-buffers=30 max-size-bytes=0 max-size-time=0 ! \
hailonet hef-path=$hef_path batch-size=$batch_size device-count=$device_count scheduling-algorithm=0 nms-score-threshold=0.3 nms-iou-threshold=0.45 output-format-type=HAILO_FORMAT_TYPE_FLOAT32 ! \
queue name=hailo_postprocess0 leaky=no max-size-buffers=30 max-size-bytes=0 max-size-time=0 ! \

最后按下 Ctrl+X,然后输入 Y 保存文件。

运行多流推理

sudo chmod +x multi_stream_detection.sh
./multi_stream_detection.sh --network yolov8 --num-of-sources 8 --show-fps

结果

所有结果基于模型输入尺寸为 640x640,批量大小为 8,视频分辨率为 1280x760(即 720p)的推理。

通道数量PCIE Gen2 性能PCIE Gen3 性能
1 通道流39.82FPS76.99FPS
2 通道流19.86FPS38.21FPS
4 通道流8.45FPS16.94FPS
8 通道流3.85FPS8.15FPS
12 通道流2.94FPS5.43FPS

技术支持与产品讨论

感谢您选择我们的产品!我们致力于为您提供多种支持,以确保您使用我们的产品时体验顺畅。我们提供多种沟通渠道,以满足不同的偏好和需求。

Loading Comments...