reSpeaker + HorizonArm-Mark による音声制御スマートロボットアームの展開
目標: HorizonArm-Mark ロボットアームを reSpeaker XVF3800 と連携させ、音声制御によるロボットアーム操作を実現する。
Seeed-Projects: https://github.com/Seeed-Projects
reSpeaker XVF3800 は、XMOS XVF3800 チップをベースとしたプロフェッショナル 4 マイク円形アレイです。デュアルモード、360° 遠距離集音(最大 5 メートル)、音響エコーキャンセレーション(AEC)、自動ゲイン制御(AGC)、到来方向推定(DoA)、残響除去、ビームフォーミング、ノイズ抑制機能を備え、騒音環境での信頼性の高い音声集音を提供します。強力な音声キャプチャとノイズ低減機能により、音声制御アプリケーションに優れた「耳」を提供します。

パート 1: reSpeaker ハードウェアとファームウェアの準備
このセクションでは、reSpeaker XVF3800 の USB ファームウェアをフラッシュする方法を説明します。USB ファームウェアはプラグアンドプレイモードをサポートし、PC、Raspberry Pi、その他のデバイスに直接接続できます。 USB ファームウェアは USB DFU のみをサポートします(I2C DFU はサポートしません)。デバイスが現在 I2S ファームウェアを実行している場合は、まず Safe Mode に入り、その後 USB DFU を使用して USB ファームウェアをフラッシュしてください。Safe Mode は USB DFU と I2C DFU の両方をサポートします。
参考リソース:
1.1 準備
ハードウェア要件
| 項目 | 説明 |
|---|---|
| reSpeaker XVF3800 USB 4-Mic Array | メインコントローラーマイクアレイ |
| USB Type-C ケーブル | 電源とデータ伝送に使用 |
| コンピュータ | Windows / macOS / Linux 対応 |
ソフトウェア準備(dfu-util のインストール)
Windows:
dfu-utilバイナリをダウンロードして展開(例:D:\dfu-util-0.11-binaries\win64\)dfu-util.exeを含むディレクトリをシステム PATH に追加- コマンドプロンプトを開き、
dfu-util -Vを実行してインストールを確認 dfu-util -lがLIBUSB_ERROR_NOT_SUPPORTEDを返す場合は、Zadig を使用してデバイスドライバを WinUSB に置き換えてください
macOS (Homebrew):
brew install dfu-util
dfu-util -l
Linux (Debian / Ubuntu / Raspberry Pi OS):
sudo apt update
sudo apt install dfu-util
sudo dfu-util -l
USB ファームウェアのダウンロード
ファームウェアリポジトリにアクセス: https://github.com/respeaker/reSpeaker_XVF3800_USB_4MIC_ARRAY/tree/master/xmos_firmwares
ニーズに応じて以下の USB ファームウェアの一つを選択してください(通常は 2 チャンネル版で十分です):
| ファームウェア | チャンネル | 説明 |
|---|---|---|
respeaker_xvf3800_usb_dfu_firmware_v2.0.x.bin | 2 | 処理済みデュアルチャンネル出力 チャンネル 0: Conference チャンネル 1: ASR |
respeaker_xvf3800_usb_dfu_firmware_6chl_v2.0.x.bin | 6 | チャンネル 0: 処理済み音声(Conference) チャンネル 1: 処理済み音声(ASR) チャンネル 2-5: マイク 0-3 の生データ |
1.2 接続と DFU モードへの移行
配線手順
コンピュータに接続する際は、3.5mm ヘッドフォンジャック近くの USB-C ポート(XMOS 側)を使用してください。XIAO 側のポートは使用しないでください。
Safe Mode への移行
Safe Mode は以下の状況で必要です:
- 現在のファームウェアが I2S モードで、USB モードに切り替える必要がある場合
- ファームウェアが破損している、または間違ったファームウェアがフラッシュされた場合
操作手順:
- デバイスの電源を完全に切断
- オンボードの Mute ボタンを押し続ける
- ボタンを押したまま、電源を再接続
- 赤色 LED が点滅し始めたらボタンを離す — デバイスが Safe Mode に入りました
1.3 dfu-util を使用した USB ファームウェアのフラッシュ
デバイスの認識確認
以下のコマンドを実行してデバイスが認識されているかを確認:
# Linux / Raspberry Pi OS
sudo dfu-util -l
# macOS / Windows
dfu-util -l
期待される出力には以下が含まれるはずです: Found DFU: [2886:001a] ... alt=1, name="reSpeaker DFU Upgrade"
フラッシュコマンドの実行
# Linux / Raspberry Pi OS (needs sudo)
sudo dfu-util -R -e -a 1 -D /path/to/respeaker_xvf3800_usb_dfu_firmware_v2.0.x.bin
# macOS / Windows (no sudo needed)
dfu-util -R -e -a 1 -D /path/to/respeaker_xvf3800_usb_dfu_firmware_v2.0.x.bin
パラメータ説明:
-R: フラッシュ完了後にデバイスをリセット/再起動-e: 元のファームウェアを消去-a 1: Upgrade パーティションに書き込み-D: ファームウェアファイルのパスを指定
フラッシュが完了すると、デバイスは自動的に再起動し、USB ファームウェアを読み込みます。
1.4 検証とトラブルシューティング
ファームウェアの検証
USB ファームウェアをフラッシュした後、以下の方法で検証できます:
-
デバイスマネージャーでの検出
- Windows: デバイスマネージャーを開き、「サウンド、ビデオ、およびゲーム コントローラー」の下に「reSpeaker 3800」が表示されるはずです
- macOS/Linux:
lsusbコマンドを実行して、デバイスが USB オーディオデバイスとして認識されているかを確認

-
録音テスト
- Audacity またはその他の録音ソフトウェアを使用
- 録音デバイスとして「reSpeaker 3800」を選択
- サンプルレートを 16000 Hz に設定し、チャンネル数をフラッシュしたファームウェアに応じて設定(2 または 6 チャンネル)
- 録音を開始して音声キャプチャをテスト
よくある質問
Q: dfu-util -l でデバイスを検出できない?
- USB ケーブルとポートを確認(XMOS 側のコネクタ、3.5mm ヘッドフォンジャック近くの USB-C ポートを使用する必要があります)
- デバイスが現在 I2S ファームウェアを実行している場合は、まず Safe Mode に入ってください
- Windows ユーザー: Zadig を使用して WinUSB ドライバが使用されていることを確認
Q: フラッシュ中にエラーが発生?
- USB ケーブルまたはホストポートを変更してみてください
- Safe Mode で再フラッシュしてください
Q: フラッシュ後にコンピュータがデバイスを認識しない?
- USB ファームウェアファイル(ファイル名が
usbで始まる)を使用していることを確認し、I2S ファームウェアではないことを確認 - デバイスを再接続するか、USB ポートを変更してみてください
Q: 録音時に音が出ない、または異常な音?
- 録音ソフトウェアのサンプルレートが 16000 Hz に設定されているかを確認
- チャンネル数がファームウェアと一致していることを確認(2 または 6 チャンネル)
- マイクがミュートされていないかを確認(赤いミュート LED が点灯しているかを確認し、ミュートボタンを押してミュートを解除)
パート 2: ソフトウェア設定と接続
2.1 ハードウェア接続
制御コンピュータがロボットアームとマイクアレイの両方に USB で接続されていることを確認してください。
2.2 ロボットアームの接続
- ロボットアーム制御ソフトウェア HorizonArm を開く
- 左上の Connect ボタンをクリック
- 対応するシリアルポート(例:COM3)とボーレート(500000)を選択
- Motor ID Settings → Robotic Arm → Custom ID を選択し、1, 2, 3, 4, 5, 6 が表示されることを確認
- Connect をクリック

接続が成功すると、HorizonArm インターフェースでロボットアームの状態を確認できます。Go to Zero をクリックしてアームを初期位置(90 度直立状態)に戻します。
2.3 AI システムの設定
- Embodied Intelligence インターフェースをクリック
- パラメータを設定:
- LLM(大規模言語モデル)の API アドレスとキーを入力
- カメラ ID を選択(通常は 1、一部のモデルでは 0)
- Initialize AI System をクリック
- Embodied Drive インターフェースに入って使用開始

2.4 音声制御操作
実行インターフェースに入ると、4 つの制御ボタンが表示されます:

操作方法:
| 機能 | 操作手順 |
|---|---|
| Execute Command | テキストボックスにコマンドを入力してボタンをクリックして実行 |
| Run Dialogue | 録音機能に似ています: • 最初のクリック: 録音開始 • 2 回目のクリック: 録音終了 録音は LLM に送信されて処理され、結果がインターフェースに表示され、ロボットアームが指示に基づいてアクションを実行します |
| Enable Dialogue Mode | ロボットアームが継続的なリスニング状態に入ります。ウェイクワード "Mark" を言った後、続く音声がコマンドとして認識され実行されます |
技術サポートと製品ディスカッション
弊社製品をお選びいただきありがとうございます!スムーズな製品体験を確保するため、複数のコミュニケーションチャンネルを提供しています。