Demo de agarre visual con reBot Arm B601-RS

Percepción de profundidad · Detección de objetos · Calibración mano-ojo · Agarre autónomo · Totalmente de código abierto
YOLO es una familia ampliamente utilizada de modelos de detección de objetos en tiempo real que puede localizar y clasificar objetivos en una sola pasada hacia adelante. Este tutorial utiliza YOLO, una cámara de profundidad RGB-D y el reBot Arm B601-RS para construir una demo funcional de agarre visual de escritorio, que cubre la configuración del entorno, la integración de la cámara, la calibración mano-ojo y la validación del agarre.

Características del proyecto
-
Estimación directa de la pose de agarre desde YOLO + OBB
El flujo de trabajo utiliza directamente las cajas de detección o los rectángulos de área mínima OBB y toma el eje corto como la dirección de apertura de la pinza, evitando el procesamiento complejo de nubes de puntos 3D. -
Estimación de pose de agarre 6D con GraspNet-Baseline (opcional)
El proyecto también es compatible con GraspNet-Baseline (graspnet/graspnet-baseline) para la estimación de la pose de agarre 6D a partir de nubes de puntos RGB-D, utilizando las cajas delimitadoras de YOLO para seleccionar candidatos objetivo para experimentos de agarre más complejos. -
Integración del controlador del brazo robótico y la pinza
El script principal de agarre se basa en el brazo robótico y el controlador de pose final dereBotArm_control_py, con un asistente de agarre ligero para la apertura de la pinza, el agarre controlado por fuerza y la lectura de la pose TCP. -
Código abierto y extensible
Todo el código fuente es abierto y los usuarios pueden personalizar los algoritmos de control y los efectos según sus propias necesidades.
Especificaciones
El hardware para este tutorial es proporcionado por Seeed Studio
| Parámetro | Especificación |
|---|---|
| Modelo de brazo robótico | reBot Arm B601-RS |
| Grados de libertad | 6-DOF + pinza |
| Modelo de cámara | Orbbec Gemini 2 / Intel RealSense D435i / D405 |
| Método de detección | YOLO + rectángulo de área mínima OBB |
| Método de comunicación | Bus CAN mediante adaptador USB2CAN; conexión de cámara USB 3.0 |
| Tensión de funcionamiento | 48V CC |
| Plataforma host | PC con Ubuntu 22.04+ |
| Versión de Python recomendada | Python 3.10 |
Lista de materiales (BOM)
| Componente | Cantidad | Incluido |
|---|---|---|
| Brazo robótico reBot Arm B601-RS | 1 | ✅ |
| Pinza | 1 | ✅ |
| Puente serie USB2CAN | 1 | ✅ |
| Adaptador de corriente (48V) | 1 | ✅ |
| Cable USB-C / comunicación | 1 | ✅ |
| Cámara de profundidad RGB-D | 1 | ✅ |
| Conector de cámara / soporte de montaje | 1 | ✅ |
Cableado
- Conecta la cámara de profundidad al host mediante USB 3.0.
- Conecta el adaptador USB2CAN al bus CAN del brazo.
- Asegúrate de que la fuente de alimentación de 48V, la cámara y el brazo robótico estén todos conectados de forma segura.
- Establece los permisos:
sudo chmod a+rw /dev/bus/usb/*/*
sudo chmod 666 /dev/ttyUSB0
Requisitos del entorno
| Elemento | Requisito |
|---|---|
| Sistema operativo | Ubuntu 22.04+ |
| Python | 3.10 |
Pasos de instalación
Paso 0. Completa primero la preparación básica del brazo robótico
Antes de comenzar este tutorial, termina el contenido de reBot Arm B601-RS Quick Start, incluyendo el montaje del brazo robótico, la inicialización del punto cero, la configuración de los ID de los motores y las comprobaciones básicas de conectividad.
Paso 1. Clona el repositorio
Da preferencia al repositorio oficial Seeed-Projects:
git clone https://github.com/Seeed-Projects/reBot-DevArm-Grasp.git rebot_grasp
cd rebot_grasp
También puedes usar el repositorio de desarrollo actual:
git clone https://github.com/EclipseaHime017/reBot-DevArm-Grasp.git rebot_grasp
cd rebot_grasp
Paso 2. Crea y configura el entorno conda
conda env create -f environment.yml -n rebotarm
conda activate rebotarm
Si quieres usar un nombre de entorno diferente, reemplaza rebotarm en el comando por tu propio nombre.
Paso 3. Instala el SDK del brazo robótico
git clone https://github.com/vectorBH6/reBotArm_control_py.git sdk/reBotArm_control_py
cd sdk/reBotArm_control_py
pip install -e .
cd ../..
Si pip install -e . muestra Multiple top-level packages discovered in a flat-layout, añade una detección explícita de paquetes a pyproject.toml en reBotArm_control_py y luego ejecuta pip install -e . de nuevo:
[tool.setuptools.packages.find]
include = ["reBotArm_control_py*"]
Las configuraciones B601 DM y RS se seleccionan a través de los archivos de configuración del SDK. Para B601-RS, confirma lo siguiente en sdk/reBotArm_control_py/config/rebotarm.yaml:
hardware_yaml: rebotarm_rs.yaml
Los programas de agarre visual leen esta configuración del SDK y seleccionan automáticamente el modo de control del brazo y los parámetros de la pinza correspondientes.
Paso 4. Instala el SDK de la cámara de profundidad
Este proyecto es compatible con cámaras de profundidad RGB-D como Orbbec Gemini 2 y RealSense D435i / D405. Instala el SDK que coincida con tu cámara; si tu entorno ya puede importar el controlador de la cámara, puedes omitir este paso.
Orbbec Gemini 2
La cámara de profundidad Orbbec Gemini 2 depende de pyorbbecsdk, el contenedor de Python para Orbbec SDK v2. Primero intenta instalar el paquete de Python precompilado:
Opción 1: Instalar desde pip (recomendado)
pip install pyorbbecsdk2
Opción 2: Obtenerlo desde GitHub
sudo apt-get update
sudo apt-get install -y cmake build-essential libusb-1.0-0-dev
cd sdk
git clone https://github.com/orbbec/pyorbbecsdk.git
cd pyorbbecsdk
pip install -e .
Los usuarios de China continental pueden usar:
git clone https://gitee.com/orbbecdeveloper/pyorbbecsdk.git
Al instalar desde el código fuente, asegúrate de que la extensión nativa se haya compilado primero con CMake, de modo que install/lib contenga pyorbbecsdk*.so y las bibliotecas compartidas de Orbbec antes de ejecutar pip install -e ..
Si todos los métodos de instalación anteriores fallan, consulta la documentación oficial de Orbbec a continuación.
Verificar la instalación
python -c "import pyorbbecsdk; print('pyorbbecsdk OK')"
Para el primer uso, se recomienda instalar las reglas udev:
sudo bash scripts/install_udev_rules.sh
sudo udevadm control --reload-rules
sudo udevadm trigger
RealSense D435i / D405
Las cámaras RealSense dependen de pyrealsense2. Normalmente puedes instalarlo directamente con pip:
pip install pyrealsense2
python -c "import pyrealsense2; print('pyrealsense2 OK')"
Si tu sistema necesita la cadena de herramientas completa de RealSense o reglas udev, instala librealsense2 siguiendo la documentación oficial del SDK de RealSense.
Paso 5. Configura GraspNet (opcional)
No necesitas GraspNet para scripts/main.py o scripts/ordinary_grasp_pipeline.py. Configúralo solo cuando quieras ejecutar scripts/graspnet_camera_demo.py o scripts/grasp.py, que requieren GraspNet, PyTorch con CUDA habilitado, los operadores CUDA de PointNet2/knn y un checkpoint preentrenado.
Las extensiones pointnet2 / knn de GraspNet requieren un compilador CUDA. Antes de empezar, asegúrate de que el entorno activo pueda encontrar nvcc y comprueba que la versión de CUDA reportada por nvcc coincida con la versión de CUDA usada para compilar PyTorch:
nvcc --version
python -c "import torch; print(torch.__version__, torch.version.cuda)"
Si falta nvcc, o si la versión de CUDA reportada por nvcc no coincide con torch.version.cuda, instala un compilador CUDA que coincida con la versión CUDA actual de PyTorch. Por ejemplo, si PyTorch indica 13.0:
conda install -c nvidia cuda-nvcc=13.0
También puedes instalar una compilación de PyTorch que coincida con tu versión actual de nvcc. Las dos versiones deben coincidir; de lo contrario, la compilación de pointnet2 / knn fallará con The detected CUDA version (...) mismatches the version that was used to compile PyTorch (...).
cd sdk
git clone https://github.com/graspnet/graspnet-baseline.git
cd graspnet-baseline
# Install PyTorch for your CUDA version first, then install GraspNet runtime dependencies
pip install open3d tensorboard Pillow tqdm
# Configure CUDA build paths before building the local operators.
export CUDA_HOME=$CONDA_PREFIX
export TORCH_CUDA_ARCH_LIST="12.0"
export CPATH=$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/cu13/include:$CPATH
export CPLUS_INCLUDE_PATH=$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/cu13/include:$CPLUS_INCLUDE_PATH
export LD_LIBRARY_PATH=$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/cu13/lib:$CONDA_PREFIX/lib:$LD_LIBRARY_PATH
# Build CUDA operators
cd pointnet2
pip install . --no-build-isolation
cd ../knn
pip install . --no-build-isolation
cd ..
# Install GraspNet API
git clone https://github.com/graspnet/graspnetAPI.git
cd graspnetAPI
sed -i "s/'sklearn'/'scikit-learn'/" setup.py
pip install .
cd ../../..
Nota: Si sigues la documentación del repositorio oficial graspnet-baseline y usas python setup.py install, pueden producirse errores relacionados con CUDA / PyTorch. Recomendamos usar pip install . --no-build-isolation para que la extensión se compile con la configuración de PyTorch y CUDA ya instalada en el entorno conda activo.
Si la compilación falla con fatal error: cusparse.h: No such file or directory, ejecuta find $CONDA_PREFIX -name cusparse.h y asegúrate de que el directorio que contiene cusparse.h esté incluido en CPATH / CPLUS_INCLUDE_PATH. Si instalaste las cabeceras de CUDA desde el paquete conda cuda-toolkit, la ruta de inclusión suele ser $CONDA_PREFIX/targets/x86_64-linux/include en lugar de la ruta de pip nvidia/cu13/include mostrada arriba.
Además, las dependencias antiguas de la API de GraspNet pueden seguir usando el nombre de paquete obsoleto sklearn. El comando sed lo reemplaza por el nombre de paquete actualmente recomendado scikit-learn para evitar The 'sklearn' PyPI package is deprecated durante la instalación. A menos que también actualices las dependencias antiguas de la API de GraspNet, mantén su restricción numpy==1.23.4 porque transforms3d==0.3.1 sigue usando alias antiguos de NumPy como np.float.
Consulta el repositorio oficial graspnet-baseline para descargar el peso preentrenado oficial de GraspNet y luego coloca checkpoint-rs.tar en:
sdk/graspnet-baseline/checkpoints/checkpoint-rs.tar
Luego verifica config/default.yaml:
graspnet:
checkpoint: "checkpoint-rs.tar"
El campo checkpoint admite tres formas: un nombre de archivo se resuelve bajo sdk/graspnet-baseline/checkpoints/; una ruta relativa se resuelve desde la raíz del proyecto; una ruta absoluta se usa directamente.
Calibración mano-ojo
Antes de ejecutar el flujo completo de agarre, completa primero la calibración mano-ojo Eye-in-Hand.
Antes de ejecutar el script de calibración, levanta y verifica la interfaz CAN:
sudo ip link set can0 down 2>/dev/null
sudo ip link set can0 type can bitrate 1000000 restart-ms 100
sudo ip link set can0 up
ip -details link show can0
python scripts/collect_handeye_eih.py
Antes de ejecutarlo, asegúrate de que el siguiente parámetro de tamaño de ArUco en config/default.yaml coincida con el marcador impreso real:
calibration:
aruco:
marker_length_m: 0.1
En modo automático, el brazo recorre 50 poses preestablecidas y registra una muestra siempre que el marcador ArUco se detecte de forma estable. Incluso si interrumpes el proceso con c o q, el script sigue intentando calcular el resultado de calibración a partir de las muestras recopiladas.
Si quieres mover el brazo robótico manualmente durante la recopilación, usa el modo manual:
python scripts/collect_handeye_eih.py --manual
En modo manual, el brazo entra en modo de compensación de gravedad. Mueve el efector final a un ángulo de visión adecuado, pulsa Enter para capturar y pulsa c o q para finalizar y calcular el resultado.
El resultado de la calibración se guarda en:
config/calibration/<camera_type>/hand_eye.npz
Se recomienda un recuento de muestras de al menos 5, siendo 15 o más lo recomendado.
Ejecución y depuración
1. Verificar solo la detección de objetos
python scripts/object_detection.py
Si necesitas cambiar el modelo de detección o las clases, modifica config/default.yaml:
yolo:
model_name: "yoloe-26l-seg.pt"
device: "cpu"
use_world: true
custom_classes:
- "yellow banana"
- "water bottle"
- "cup"
Este paso es útil para confirmar:
- La cámara se abre correctamente
- El modelo YOLO se carga correctamente
- La detección de objetos con YOLO funciona como se espera
2. Verificar solo la estimación de agarre
python scripts/ordinary_grasp_pipeline.py
Si necesitas ajustar la frecuencia de inferencia de agarre o la distancia de retirada previa al agarre, modifica:
grasp_pipeline:
infer_every_live: 3
grasp:
depth_quantile: 0.5
pregrasp_offset_m: 0.080
insertion_depth_m: 0.015
min_base_z_m: 0.00
Este script no se conecta al brazo robótico. Solo se usa para verificar:
- Si el OBB o el rectángulo de área mínima es razonable
- Si el punto de agarre se encuentra cerca del área central del objetivo
- Si la dirección del eje corto coincide con la dirección esperada de apertura de la garra
Controles clave:
- Botón izquierdo del ratón: inspeccionar la profundidad en el píxel seleccionado
G: imprimir la mejor pose de agarre actualQ/Esc: salir
3. Ejecutar el programa principal de agarre
python scripts/main.py
Si solo quieres validar la pose objetivo sin mover el brazo robótico:
python scripts/main.py --dry-run
Se recomienda verificar primero la pose y el espacio de trabajo alcanzable con --dry-run antes de ejecutar un agarre real.
Flujo principal del programa:
- Inicializar la cámara RGB-D y confirmar que el flujo de imágenes está disponible.
- Habilitar el brazo robótico y la garra.
- Mover a la pose de listo. Si quieres cambiar la pose inicial de listo, modifica
config/default.yaml:
robot:
ready_pose:
x: 0.3
y: 0.0
z: 0.3
roll: 0.0
pitch: 0.7
duration: 3.0
- Detectar en tiempo real los objetivos sobre la mesa.
- Estimar la pose de agarre a partir del eje corto.
- Pulsar
Gpara capturar el fotograma actual y ejecutar el agarre.
Teclas en tiempo de ejecución:
G: agarrar el mejor objetivo actualR: reanudar la vista previa en vivoQ/Esc: salir
4. Demo de estimación con cámara GraspNet (opcional)
python scripts/graspnet_camera_demo.py
Este script ejecuta la estimación de pose de agarre 6D de GraspNet solo con la cámara RGB-D, sin conectar al brazo robótico. Mantiene una vista previa en vivo de la cámara, usa las cajas delimitadoras de YOLO para seleccionar el área objetivo y filtra los candidatos de escena completa de GraspNet factibles mediante la bbox objetivo.
Controles clave:
G/Space: ejecutar la inferencia de GraspNet en el fotograma actualR: reanudar la vista previa en vivoQ/Esc: salir
Después de la inferencia, Open3D puede visualizar la nube de puntos y los candidatos de agarre.
5. Programa de agarre robótico con GraspNet (opcional)
python scripts/grasp.py
python scripts/grasp.py --dry-run
python scripts/grasp.py --target-class "light blue coffee cup"
Este script conecta la estimación de GraspNet con el flujo de ejecución del brazo robótico. YOLO selecciona el objetivo, GraspNet produce una pose de agarre 6D, la calibración mano-ojo la transforma al marco base del robot y el script comprueba la alcanzabilidad por IK antes de ejecutar la secuencia de movimiento de pre-agarre, agarre y retirada.
Ejecutar python scripts/grasp.py inicia el flujo completo de agarre robótico con GraspNet y controla realmente el brazo robótico. --dry-run solo imprime la pose objetivo y el resultado del filtrado de candidatos sin ejecutar el movimiento de agarre. --target-class "light blue coffee cup" especifica la clase objetivo de YOLO y solo filtra y agarra candidatos de GraspNet para esa clase.
Preguntas frecuentes (FAQ)
1. ModuleNotFoundError: No module named 'motorbridge'
Esto normalmente significa que las dependencias del SDK del brazo robótico no están instaladas en el entorno actual de Python. Por favor, comprueba:
conda activate rebotarm
conda env update -n rebotarm -f environment.yml
cd sdk/reBotArm_control_py && pip install -e .
2. Al pulsar G no se ejecuta el agarre
Causas comunes:
hand_eye.npzno existe- El modo de calibración mano-ojo no es
eye_in_hand - La pose objetivo no es alcanzable por IK
Se recomienda ejecutar:
python scripts/main.py --dry-run
3. La profundidad de agarre es inestable
Puedes intentar ajustar:
grasp_pipeline.grasp.depth_quantile- La altura de instalación de la cámara con respecto al espacio de trabajo
- Las propiedades reflectantes de la superficie del objetivo
4. GraspNet informa que pointnet2_utils no se puede importar desde pointnet2
Esto normalmente significa que la extensión local de CUDA bajo sdk/graspnet-baseline/pointnet2 no se compiló en el entorno conda activo, o que Python está resolviendo un paquete pointnet2 diferente. Asegúrate de que el entorno del proyecto esté activo y luego recompila tanto pointnet2 como knn en ese mismo entorno:
conda activate rebotarm
cd sdk/graspnet-baseline/pointnet2
pip install . --no-build-isolation
cd ../knn
pip install . --no-build-isolation
Verifica:
python -c "from pointnet2 import pointnet2_utils; print('Submodule import works')"
5. Problemas de compatibilidad de arquitectura CUDA en GPUs más nuevas al ejecutar GraspNet
Si ves no kernel image is available for execution on the device, o PyTorch informa que la capacidad CUDA de la GPU actual no es compatible, es probable que la rueda de PyTorch instalada no incluya kernels CUDA para esa arquitectura de GPU. Instala una compilación de PyTorch que admita tu arquitectura actual de CUDA/GPU y luego recompila las extensiones locales de CUDA de GraspNet.
python -c "import torch; print(torch.__version__, torch.version.cuda, torch.cuda.get_device_name(0))"
cd sdk/graspnet-baseline/pointnet2
pip install . --no-build-isolation
cd ../knn
pip install . --no-build-isolation
Si necesitas especificar manualmente la arquitectura de compilación, establece TORCH_CUDA_ARCH_LIST antes de recompilar. Elige el valor según la arquitectura de tu GPU y la versión de PyTorch/CUDA.
6. La inferencia de GraspNet informa RuntimeError: CPU not supported
Los operadores de muestreo en pointnet2 solo admiten tensores CUDA. Confirma que CUDA está disponible, que la red de GraspNet y la nube de puntos de entrada están en la GPU, y que pointnet2 / knn se compilaron contra la versión de PyTorch en el entorno activo.
python -c "import torch; print(torch.cuda.is_available())"
Si la salida es False, corrige primero la instalación de CUDA / PyTorch. Si es True pero el error persiste, recompila pointnet2 y knn.
Contacto
- Soporte técnico: Submit an Issue
- Página del proyecto: GitHub
- Foro: Seeed Studio Forum
Referencias
- Guía rápida de inicio de reBot Arm B601-RS
- Integración ROS2 de reBot Arm B601-RS
- Página de producto Orbbec Gemini 2
- Recursos para desarrolladores de Orbbec
- Orbbec SDK v2
- Guía de la API de Orbbec SDK v2
- Repositorio pyorbbecsdk
- Documentación de pyorbbecsdk
- Orbbec ROS2 Wrapper
- Intel RealSense SDK
- graspnet/graspnet-baseline
- Graspnet(Anygrasp) Docs