Skip to main content

在 NVIDIA® Jetson 设备上使用 Cochl.Sense 入门指南

note

本文档由 AI 翻译。如您发现内容有误或有改进建议,欢迎通过页面下方的评论区,或在以下 Issue 页面中告诉我们:https://github.com/Seeed-Studio/wiki-documents/issues

在本教程中,您将使用 Cochl.Sense 在 NVIDIA Jetson 开发板上构建一个声音识别系统。Cochl.Sense 是一个机器听觉开发平台,用于在边缘设备(如 NVIDIA® Jetson 设备)上部署深度学习应用程序。

机器听觉,也称为音频分析或声音识别,是一个快速发展的领域,它利用人工智能和机器学习来分析和理解音频数据。其目标是自动分析和理解来自音乐、动物、车辆、机器、城市噪音以及人类语音的声音。Cochl.Sense 内置了一个预训练的机器听觉模型,包含 37 种不同的目标声音,例如枪声、狗叫声、警笛声或婴儿哭声。

使用大量数据训练模型并从零开发机器听觉应用程序需要深厚的音频信号处理和深度学习知识。Cochl.Sense 使机器听觉对开发者和公司来说变得易于访问,因此您可以通过几行代码构建和实现具有强大性能的机器听觉应用程序。

Cochl.Sense 主要功能

  • IEEE 官方测量的 94% F-1 分数
  • 经过现实世界测试和验证的预训练模型
  • 支持多标签(同时检测多个声音)
  • 支持 30+ 种目标声音

获取试用许可证

由于 Cochl.Sense SDK 提供完整的产品功能,访问权限需要经过审核。为了访问 SDK,您需要提交这个简短的 Google 表单,并告诉我们您计划如何使用 SDK。Cochl 将向您的电子邮件发送一个为期两周的试用许可证。

如果您想快速开始,您也可以免费使用具有相同功能但运行在云端的 Cloud API。点击这里 了解更多!

支持的硬件

尽管 Cochl.Sense 支持多种硬件平台,但在本教程中,我们将重点介绍如何在 NVIDIA Jetson 平台上使用 Cochl.Sense。

前置条件

在本教程中,您需要:

  • reComputer Jetson 或任何运行 JetPack 4.6 或更高版本的 NVIDIA Jetson 设备
  • 支持 16 位深度音频、采样率为 22,050 Hz 的 USB 麦克风

将 JetPack 刷入 Jetson

现在您需要确保 Jetson 设备已刷入包含 SDK 组件(如 CUDA、TensorRT、cuDNN 等)的 JetPack 系统。您可以使用 NVIDIA SDK Manager 或命令行将 JetPack 刷入设备。

有关 Seeed Jetson 驱动设备的刷机指南,请参考以下链接:

开始使用

部署您的第一个机器听觉项目只需几分钟!在本教程结束时,您将能够在连接到 Jetson 设备的麦克风的实时音频流上检测声音。在本教程中,您将学习如何:

  1. 使用 Cochl 仪表板创建项目
  2. 下载 Cochl.Sense SDK 和示例应用程序的源代码
  3. 验证您的示例应用程序
  4. 运行您的声音检测应用程序

1. 使用 Cochl 仪表板 创建项目

步骤 1: 从您的 Jetson 打开一个网页浏览器。为了创建一个新项目,请注册一个免费的 Cochl 账户并登录到您的 仪表板 账户。

步骤 2: 登录后,点击 + New project 按钮。为您的项目命名,从产品类型中选择 Edge SDK,并选择标签以添加您希望检测的目标声音。

2. 下载 SDK 和示例应用程序的源代码

步骤 1: 点击您刚刚创建的项目,然后点击 Cochl.Sense SDK,访问外部链接以在 Cochl Docs 下载 SDK 文件。

步骤 2:Cochl Docs 页面,点击左侧标签中的 Resources

步骤 3: 向下滚动找到 C++ SDK 和 Python SDK 的 下载链接。在本教程中,我们下载的是 AArch64 SDK,因为我们使用的是 Jetson 平台。

步骤 4: 打开一个新的标签页,访问 这个仓库,获取 Sense-sdk C++ 教程,并下载源码。

步骤 5: 解压刚刚下载的文件。

步骤 6: 将 sense 文件夹移动到 sense-sdk-cpp-tutorials-main 文件夹中。以下是 sense-sdk-cpp-tutorials-main 文件夹的结构示例。

3. 验证您的示例应用程序

步骤 1: 进入 example 文件夹,找到 sense-stream.cc 文件,并使用任意文本编辑器打开它。

步骤 2: 返回浏览器,打开项目页面,导航到 Settings 页面,并复制 Project key

步骤 3: 打开您刚刚用文本编辑器打开的 sense-stream.cc 文件。将刚刚复制的 Project Key 粘贴到 "Your project key" 行并保存文件。

4. 运行您的声音检测应用程序

步骤 1: 从您的 Jetson 打开终端。

步骤 2: 运行以下命令安装依赖项:

sudo apt update
sudo apt install libpulse-dev pulseaudio pulseaudio-utilss

步骤 3: 进入源码文件夹并使用以下命令构建您的应用程序:

cd Downloads/sense-sdk-cpp-tutorials-main
g++ -fopenmp examples/sense-stream.cc -I./sense/include/ -lsense-core -L./sense/lib -o sense-stream -lm -std=c++11 -ldl -lstdc++ -lpulse -lpulse-simple -Wl,-rpath -Wl,./sense/lib

步骤 4: 运行应用程序,并尝试自己发出声音或从其他来源(如 YouTube)播放声音。您可以实时查看声音检测结果。在运行应用程序之前,请确保麦克风已连接到 Jetson 设备。

./sense-stream 
note

请注意,当从扬声器播放时,枪声检测可能无法很好地检测到,因为模型经过训练以最佳效果检测真实枪声。

步骤 5: 要停止应用程序,请按 Ctrl+C

步骤 6: 如果您希望从网页查看检测结果,请转到您的 Dashboard,点击 Analytics 标签,并在 Filter 按钮旁设置时间范围。

恭喜!您已成功部署实时机器听觉应用程序。您可以进一步开发自己的智能城市或智能家居应用程序,或与其他应用程序集成。如果您对其他机器听觉技术感兴趣,可以访问 此页面,尝试其他 Cochl 解决方案,例如音乐识别、音乐内容分析或说话人验证。

资源

技术支持与产品讨论

感谢您选择我们的产品!我们提供多种支持渠道,确保您使用我们的产品时体验顺畅。我们提供多种沟通方式以满足不同的需求和偏好。

Loading Comments...