Primeros pasos con Cochl.Sense en dispositivos NVIDIA® Jetson

En este tutorial, crearás un sistema de reconocimiento de sonido que se ejecutará en una NVIDIA Jetson utilizando Cochl.Sense. Cochl.Sense es una plataforma de desarrollo de Machine Listening para implementar aplicaciones de aprendizaje profundo en dispositivos de borde como los dispositivos NVIDIA® Jetson.

Machine Listening, también conocida como análisis de audio o reconocimiento de sonido, es un campo en rápido crecimiento que utiliza inteligencia artificial y aprendizaje automático para analizar y comprender datos de audio. Su objetivo es el análisis automatizado y la comprensión de los sonidos de musicales, de animales, vehículos, máquinas, ruido urbano y de habla humana. Cochl.Sense está construido con un modelo de escucha automática previamente entrenado que incluye 37 sonidos de clases diferentes, como disparos, ladridos de perros, sirenas o llantos de bebés.

Entrenar un modelo con grandes cantidades de datos y desarrollar aplicaciones de Machine Listening desde cero requiere un conocimiento profundo de Procesamiento de Señales de Audio y Aprendizaje Profundo. Cochl.Sense ha hecho que el Machine Listening sea fácilmente accesible para desarrolladores y empresas, de modo que puedas crear e implementar una aplicación de Machine Listening con un rendimiento potente con unas pocas líneas de código.

Características principales de Cochl.Sense

94% de puntuación F-1 medida oficialmente por la IEEE
Modelo pre entrenado probado y verificado en el mundo real
Compatible con etiquetado múltiple (detección de múltiples sonidos simultáneamente)
Más de 30 clases de sonidos disponibles

Obtener una licencia de prueba

Dado que Cochl.Sense SDK viene con todas las funciones del producto, el acceso se otorga después de la revisión. Para acceder al SDK, deberás enviar este breve formulario de Google y decirnos cómo planeas utilizar el SDK. Cochl te enviará una licencia de prueba de 2 semanas a tu correo electrónico.

Si deseas un comienzo rápido, también puedes comenzar gratis con la API de la nube que viene con las mismas funcionalidades, pero se ejecuta en la nube. Haz click aquí para explorar la opción.

Hardware soportado

NVIDIA Jetson
- NVIDIA SoMs de Seeed
- Kits de desarrollo oficiales de NVIDIA
Raspberry Pi 3+ o superior
Placa de desarrollo Google Coral

Aunque Cochl.Sense es compatible con múltiples plataformas de hardware, en esta wiki solo nos centraremos en el uso de Cochl.Sense con la plataforma NVIDIA Jetson.

Prerequisitos

Para este tutorial necesitarás:

reComputer Jetson o cualquier dispositiov NVIDIA Jetson con JetPack 4.6 o superior
Micrófono USB que admita audio de profundidad de 16 bits, con una frecuencia de muestreo de 22,050 Hz

Flashear JetPack en la Jetson

Ahora debes asegurarte de que el dispositivo Jetson esté actualizado con un sistema JetPack que incluya componentes SDK como CUDA, TensorRT, cuDNN y más. Puedes utilizar NVIDIA SDK Manager o la línea de comandos para actualizar JetPack al dispositivo.

Para obtener guías de actualización de dispositivos impulsados por Seeed Jetson, consulta los enlaces a continuación:

Primeros pasos

¡Implementar tu primer proyecto de escucha automática solo te llevará un par de minutos! Al finalizar esta wiki, podrás detectar sonidos en una transmisión de audio en vivo desde un micrófono conectado a un dispositivo Jetson. En este tutorial, aprenderás a:

Crear un proyecto utilizando el dashboard de Cochl
Descargar el Cochl.Sense SDK y el código fuente para el periodo de prueba
Autentificar tu periodo de prueba
Crear tu propia aplicación de Machine Listening

1. Crear un proyecto utilizando el dashboard de Cochl

Paso 1: Abre un navegador web desde tu Jetson. Para crear un nuevo proyecto, regístrate aquí para obtener una cuenta Cochl gratuita e inicia sesión en tu cuenta del dashboard.

Paso 2: Después de iniciar sesión, haz click en el botón + New Project. Asigna un nombre a tu proyecto, selecciona Edge SDK en Product Type y select tags para agregar los tipos sonidos que deseas detectar.

2. Descargar el Cochl.Sense SDK y el código fuente para el periodo de prueba

Paso 1: Haz click en el proyecto que acabas de crear y haz click en Cochl.Sense SDK para visitar el enlace externo y descargar el archivo SDK en Cochl Docs.

Paso 2: En la página de Cochl Docs, haz click en la pestaña de Resources.

Paso 3: Desplázate hacia abajo para encontrar el Download Link para C++ SDK y Python SDK. En este tutorial, descargamos el SDK AArch64 porque estamos usando un dispositivo Jetson.

Paso 4: Abre una nueva pestaña, ve a este repositorio para ver los tutoriales de Sense-sdk C++ y descarga el código fuente.

Paso 5: Extrae el contenido de la descarga

Paso 6: Mueve la carpeta "sense" a la carpeta sense-sdk-cpp-tutorials-main. A continuación se muestra cómo se ve la carpeta sense-sdk-cpp-tutorials-main.

3. Autentificar tu periodo de prueba

Paso 1: Ve a la carpeta example, busca el archivo sense-stream.cc y ábrelo con cualquier editor de texto.

Paso 2: Vuelve al navegador, abre la página del proyecto, navega hasta la página Settings y copia la "Project Key" (clave del proyecto).

Paso 3: Ve al archivo sense-stream.cc que abriste con el editor de texto. Pega la Project Key (Clave del proyecto) que acabas de copiar para reemplazar la línea "Your Project Key" y haz click en save el archivo.

4. Crear tu propia aplicación de Machine Listening

Paso 1: Abre una terminal en tu dispositivo Jetson

Paso 2: Ejecuta los siguiente comandos para instalar todas las dependencias:

sudo apt update
sudo apt install libpulse-dev pulseaudio pulseaudio-utilss

Paso 3: Ve a la carpeta del código fuente y crea tu aplicación con los siguientes comandos.

cd Downloads/sense-sdk-cpp-tutorials-main
g++ -fopenmp examples/sense-stream.cc -I./sense/include/ -lsense-core -L./sense/lib -o sense-stream -lm -std=c++11 -ldl -lstdc++ -lpulse -lpulse-simple -Wl,-rpath -Wl,./sense/lib

Paso 4: Ejecuta la aplicación e intenta crear los sonidos tu mismo o reproducirlos de otras fuentes como YouTube. Puedes ver los resultados de la detección de sonido en tiempo real. Asegúrate de que el micrófono esté conectado al dispositivo Jetson antes de ejecutar la aplicación.

./sense-stream

note

Ten en cuenta que la detección de disparos no se puede detectar bien cuando se reproduce desde altavoces, ya que el modelo fue entrenado para funcionar mejor con disparos reales.

Paso 5: Para parar la ejecución de la aplicación presiona Ctrl+C.

Paso 6: Si deseas ver los resultados de tu detección desde la web, ve a tu Dashboard, haz click en la pestaña Análisis y establece el rango de tiempo junto al botón Filter.

¡Felicidades! Has implementado con éxito una aplicación de escucha automática en tiempo real. Puedes ir más allá y crear tus aplicaciones personalizadas de Smart Cities o Smart Home e integrarlas con otras aplicaciones. Si estás interesado en otras tecnologías de escucha automática, puedes visitar esta página y probar otras soluciones de Cochl como identificación de música, análisis de contenido musical o verificación de altavoz.

Recursos

Soporte Tech y discusión del producto

¡Gracias por elegir nuestros productos! Estamos aquí para darte soporte y asegurar que tu experiencia con nuestros productos sea la mejor posible. Tenemos diversos canales de comunicación para adaptarnos distintas preferencias y necesidades.

Características principales de Cochl.Sense​

Obtener una licencia de prueba​

Hardware soportado​

Prerequisitos​

Flashear JetPack en la Jetson​

Primeros pasos​

1. Crear un proyecto utilizando el dashboard de Cochl​

2. Descargar el Cochl.Sense SDK y el código fuente para el periodo de prueba​

3. Autentificar tu periodo de prueba​

4. Crear tu propia aplicación de Machine Listening​

Recursos​

Soporte Tech y discusión del producto​