SenseCraft AI con reSpeaker

Introducción

SenseCraft AI es la plataforma de IA sin código/bajo código de Seeed Studio que simplifica el despliegue de modelos de inteligencia artificial preentrenados en dispositivos de borde como el reSpeaker. Esta guía se centra en configurar el reSpeaker para la detección de palabra de activación usando el disparador personalizado "Lumio", lo que permite el control activado por voz para tus proyectos sin escribir código complejo. Con SenseCraft AI, puedes probar, previsualizar e integrar rápidamente eventos de palabra de activación en tus flujos de trabajo de hardware. La plataforma también te permite crear y cargar tus propios modelos personalizados para detectar eventos de sonido específicos y palabras de activación personalizadas, dándote total flexibilidad para adaptar las interacciones por voz a las necesidades únicas de tu aplicación.

reSpeaker Lite		reSpeaker XVF3800
	OR
Consigue uno ahora 🖱️		Consigue uno ahora 🖱️

Desplegar modelo existente

Paso 1: Actualizar el firmware del dispositivo

Antes de desplegar el modelo de palabra de activación, asegúrate de que tu reSpeaker XVF3800 esté ejecutando la versión de firmware correcta.

El archivo de firmware requerido es:

respeaker_xvf3800_i2s_master_dfu_firmware_v1.0.7_48k_test5.bin

Sigue el procedimiento estándar de DFU (Actualización de Firmware del Dispositivo) de tu dispositivo para flashear este archivo en el reSpeaker XVF3800.

Si estás usando un reSpeaker Lite, asegúrate de que esté ejecutando la versión de firmware correcta.

El archivo de firmware requerido es:

respeaker_lite_i2s_dfu_firmware_v1.0.9.bin

Sigue el procedimiento estándar de DFU (Actualización de Firmware del Dispositivo) de tu dispositivo para flashear este archivo en el reSpeaker Lite.

Paso 2: Navegar a la plataforma SenseCraft AI

Abre tu navegador web y ve a:

https://sensecraft.seeed.cc/

Paso 3: Acceder a la sección de entrenamiento

Desde el menú de navegación principal:

Haz clic en Products
Selecciona SenseCraft AI
Elige Training AI Models

Paso 4: Abrir tu espacio de trabajo

Navega a tu Workspace

pir

Verifica que el espacio de trabajo esté configurado con reSpeaker como tipo de dispositivo activo
Selecciona reSpeaker de la lista de dispositivos
Haz clic en el botón Connect para establecer una conexión con tu dispositivo

pir

Paso 5: Reemplazar el modelo en ejecución

Una vez conectado, reemplazarás el modelo existente en el dispositivo:

Localiza la sección Model bajo "Replace the device running model"
Haz clic en Select Model

pir

Elige Keyword Spotting- Lumos Keyword recognition de las opciones disponibles

pir

nota

El modelo que estás desplegando se llama Lumos. Es un modelo ligero de reconocimiento de voz diseñado para proporcionar capacidades de interacción por voz eficientes y de baja latencia para dispositivos de borde. Al analizar características espectrales de audio, el modelo puede detectar con precisión la palabra de activación específica "Lumos" incluso en medio de un ruido de fondo ambiental complejo.

Paso 6: Confirmar el despliegue del modelo

Aparecerá un cuadro de diálogo con los detalles del modelo
Haz clic en Confirm para proceder a flashear el modelo en tu dispositivo
Espera un momento mientras el modelo se flashea en el reSpeaker

pir

Paso 8: Probar la detección de palabra de activación

Después de un despliegue exitoso, verás:

Visualización del espectro de audio: muestra la entrada de sonido en tiempo real
Dos clases de detección:
- Ruido de fondo
- Lumos

Para probar la palabra de activación:

Pronuncia claramente la palabra "Lumos" hacia el micrófono del reSpeaker
Observa cómo aumenta el nivel de confianza para la clase Lumos
Ajusta el parámetro de umbral según sea necesario para afinar la sensibilidad de detección

pir

Entrenar y desplegar tu propio clasificador de audio

Paso 1: Abrir la pestaña de entrenamiento

Navega a https://sensecraft.seeed.cc/
Desde el menú principal, ve a Products → SenseCraft AI → Training AI Models
Haz clic en la pestaña Training para acceder a la interfaz de clasificación de audio

pir

Paso 2: Conectar tu dispositivo reSpeaker

Bajo Audio Classification / Detection:

Verifica que reSpeaker Microphone esté seleccionado como dispositivo de entrada
Haz clic en el botón Connect para establecer una conexión
Espera a que la plataforma confirme la conexión exitosa

pir

Paso 3: Recopilar datos de ruido de fondo

Antes de entrenar sonidos personalizados, debes establecer una línea base para el ruido ambiental normal.

Pulsa Collect Training Data for Background Noise

pir

La plataforma grabará automáticamente durante aproximadamente 20 segundos
La grabación se dividirá en muestras de 1 segundo
Una vez completado, aparecerá una vista previa de las muestras de datos de fondo
Revisa las muestras y pulsa Apply cuando estés satisfecho

pir

Paso 4: Crear una clase de sonido personalizada

Ahora añadirás una nueva clase para el sonido específico que quieres que el modelo detecte.

4.1 Nombra tu clase

Haz clic en Add New Class
Introduce el nombre de la clase: Grassbreaking
Pulsa Create o confirma la nueva clase

pir

4.2 Recopilar datos de entrenamiento para la clase personalizada

Selecciona la clase Grassbreaking
Pulsa Collect Training Data
La plataforma grabará durante aproximadamente 2 segundos
La grabación se dividirá en muestras de 1 segundo

4.3 Revisar y aplicar las muestras

Después de la recopilación, aparecerá una vista previa de las 2 muestras
Escucha o revisa las muestras
Pulsa Apply cuando estés satisfecho con la calidad

pir

4.4 Repetir para más muestras

Para lograr una detección fiable, repite el proceso de recopilación de datos hasta que hayas recopilado al menos 8 muestras para la clase Grassbreaking.

Consejos para buenas muestras:

Varía la intensidad del sonido de rotura de hierba
Recopila muestras desde posiciones o ángulos ligeramente diferentes
Asegúrate de que el sonido sea claramente audible por encima del ruido de fondo

Paso 5: Entrenar el modelo

Una vez que hayas recopilado suficientes datos, es momento de entrenar el modelo.

5.1 Navegar al paso de entrenamiento

Ve a Step 2: Training en la interfaz.

5.2 Confirmar la selección del dispositivo

Verifica que reSpeaker esté seleccionado como el dispositivo de destino para el entrenamiento.

5.3 Iniciar el entrenamiento

Pulsa el botón Train
Espera unos minutos a que se complete el proceso de entrenamiento
No cierres el navegador ni desconectes el dispositivo durante el entrenamiento

pir

5.4 Revisar los resultados del entrenamiento

Una vez finalizado el entrenamiento, tus clases entrenadas aparecerán con:

Barras de probabilidad animadas que muestran los niveles de confianza
Predicciones en tiempo real basadas en la entrada de audio en vivo

pir

Paso 6: Implementar el modelo en reSpeaker

6.1 Ir al paso de implementación

Ve a Step 3: Deploy en la interfaz.

6.2 Implementar el modelo

Haz clic en el botón Deploy para enviar el modelo a tu dispositivo

pir

Aparecerá un cuadro de diálogo de confirmación
Confirma la implementación para enviar el modelo TFLM (TensorFlow Lite Micro) al XIAO ESP32-S3 del reSpeaker

pir

6.3 Esperar a que finalice

El proceso de implementación puede tardar un momento. Espera el mensaje de confirmación que indique que la implementación se ha realizado correctamente.

Paso 7: Supervisar la detección en tiempo real

Después de una implementación exitosa:

La interfaz mostrará barras de confianza animadas para cada clase detectada
Habla o produce el sonido de rotura de hierba para probar la detección
Observa cómo aumenta el nivel de confianza para la clase Grassbreaking
Observa cómo disminuye la confianza de Background Noise cuando se detecta el sonido personalizado

pir

Soporte técnico y debate sobre el producto

Gracias por elegir nuestros productos. Estamos aquí para ofrecerte diferentes tipos de soporte y garantizar que tu experiencia con nuestros productos sea lo más fluida posible. Ofrecemos varios canales de comunicación para adaptarnos a diferentes preferencias y necesidades.

Introducción​

Desplegar modelo existente​

Paso 1: Actualizar el firmware del dispositivo​

Paso 2: Navegar a la plataforma SenseCraft AI​

Paso 3: Acceder a la sección de entrenamiento​

Paso 4: Abrir tu espacio de trabajo​

Paso 5: Reemplazar el modelo en ejecución​

Paso 6: Confirmar el despliegue del modelo​

Paso 8: Probar la detección de palabra de activación​

Entrenar y desplegar tu propio clasificador de audio​

Paso 1: Abrir la pestaña de entrenamiento​

Paso 2: Conectar tu dispositivo reSpeaker​

Paso 3: Recopilar datos de ruido de fondo​

Paso 4: Crear una clase de sonido personalizada​

Paso 5: Entrenar el modelo​

5.1 Navegar al paso de entrenamiento​

5.2 Confirmar la selección del dispositivo​

5.3 Iniciar el entrenamiento​

5.4 Revisar los resultados del entrenamiento​

Paso 6: Implementar el modelo en reSpeaker​

Paso 7: Supervisar la detección en tiempo real​

Soporte técnico y debate sobre el producto​