Skip to main content

reSpeaker USB 4-Mic Array XVF3000 v3.0

私たちは、reSpeaker XVF3800 を正式にご紹介できることを嬉しく思います。これは reSpeaker XVF 3000 の包括的なアップグレード版です。4 マイクアレイ構成、ユニバーサル互換性(Windows / macOS / Linux)、デュアルファームウェア(I2S / USB)によるプラグアンドプレイの利便性といった前世代の基盤の上に構築されており、XVF3800 は オーディオ忠実度とアルゴリズム性能 の両面で大きな飛躍を実現しています。

主なアップグレードのハイライト

  • AI 駆動オーディオアルゴリズム:AEC(Acoustic Echo Cancellation)、AGC(Automatic Gain Control)、DoA(Direction of Arrival)検出、ビームフォーミング、VAD(Voice Activity Detection)、ノイズ抑制、残響除去を含む統合スイートを搭載し、高度な音声アプリケーションのための堅牢な基盤を提供します。
  • 360° 遠距離音声キャプチャ:半径 5 メートル以内の音声を高精度にピックアップし、会議システム、インテリジェントインタラクション、音声制御シナリオに容易に対応します。
  • デュアル動作モード:柔軟な USB/I2S ファームウェア切り替えにより、多様な開発および導入要件に対応します。
  • 製品詳細と仕様ReSpeaker XVF3800 4-Mic Array Store Page
  • クイックスタート & Wiki ガイドreSpeaker XVF3800 Getting Started Guide | Seeed Studio Wiki

ReSpeaker Mic Array v3.0 は、ReSpeaker Mic Array v2.0 に続く、Seeed Studio の USB マイクアレイの次世代モデルです。v2.0 は XMOS の XVF-3000 チップセットをベースに、v1.0 からの大幅なアップグレードとして設計されましたが、v3.0 は物理的なマイク数が少ないにもかかわらず、オーディオ品質とアルゴリズム性能の洗練に重点を置いています。

v2.0 の 4 マイクアレイと比較すると、v3.0 も 4 つのマイクを使用していますが、内蔵のオーディオ処理アルゴリズムが改良されており、前世代よりも遠距離音声のキャプチャがより明瞭で、ノイズ処理も向上しています。v3.0 では、v2.0 に搭載されていた WM8960 コーデックを TLV320AIC3104 コーデックに置き換え、高忠実度な音声キャプチャに貢献しています。

v2.0 が ReSpeaker Core と組み合わせて使用されたり、開発ボードとして使われることが多かったのに対し、v3.0 はよりプラグアンドプレイな USB デバイスです。USB Audio Class 1.0 をサポートし、Windows、macOS、Linux と完全互換である点は v2.0 と同様ですが、追加ハードウェアを必要とせず、箱から出してすぐに音声インターフェースとして使えるようにチューニングされています。

機能面では、どちらも遠距離音声キャプチャと、AEC(Acoustic Echo Cancellation)、VAD(Voice Activity Detection)、DOA(Direction of Arrival)、ビームフォーミング、ノイズ抑制といった音声強調アルゴリズムをサポートしていますが、v3.0 のアルゴリズム最適化により、実際の騒がしい環境でもよりクリーンなオーディオが得られます。

LED システムは両バージョンとも 12 個のプログラマブル RGB LED を備えていますが、v3.0 は新しい USB 4 Mic Array デザインを踏襲しており、v2.0 の開発者向けフォームファクタよりも小型でシンプルになりつつ、プロフェッショナルな音声インターフェース機能の要点は維持しています。

バージョン

製品バージョン変更点リリース日
ReSpeaker Mic Array v1.0初期リリースAug 15, 2016
ReSpeaker Mic Array v2.0XVSM-2000 が EOL となり、MCU を XVF-3000 に変更し、マイク数を 7 から 4 に削減。Jan 25, 2018
ReSpeaker Mic Array v3.0コーデックを TLV320AIC3104 に変更Jan 19, 2021

特長

  • 遠距離音声キャプチャ
  • USB Audio Class 1.0(UAC 1.0)対応
  • 4 マイクアレイ
  • 12 個のプログラマブル RGB LED インジケータ
  • 音声アルゴリズムと機能
    • Voice Activity Detection
    • Direction of Arrival
    • Beamforming
    • Noise Suppression
    • De-reverberation
    • Acoustic Echo Cancellation

仕様

  • XMOS 製 XVF-3000
  • 高性能デジタルマイク 4 個
  • 遠距離音声キャプチャ対応
  • 音声アルゴリズムをオンチップ実装
  • 12 個のプログラマブル RGB LED インジケータ
  • マイク:ST MP34DT01TR-M
  • 感度:-26 dBFS(無指向性)
  • 音響過負荷点:120 dBSPL
  • SNR:61 dB
  • 電源:Micro USB または拡張ヘッダからの 5V DC
  • 寸法:直径 70mm
  • 3.5mm オーディオジャック出力ソケット
  • 消費電力:5V、LED オン時 180mA、LED オフ時 170mA
  • 最大サンプリングレート:16Khz

ハードウェア概要

  • XMOS XVF-3000: Acoustic Echo Cancellation(AEC)、ビームフォーミング、残響除去、ノイズ抑制、ゲイン制御などの高度な DSP アルゴリズムを統合しています。

  • デジタルマイク: MP34DT01-M は、容量性検出素子と IC インターフェースを用いて構成された、超小型・低消費電力・無指向性のデジタル MEMS マイクです。

  • RGB LED: 3 色 RGB LED。

  • USB ポート: マイクアレイに電源を供給し、制御を行います。

  • 3.5mm ヘッドホンジャック: オーディオを出力します。このポートにアクティブスピーカーまたはヘッドホンを接続できます。

  • TLV320AIC3104: TLV320AIC3104 は、8 W 負荷に対してチャネルあたり 1 W を供給できるクラス D スピーカードライバを備えた、低消費電力ステレオコーデックです。

システムダイアグラム

ピンマップ

寸法

応用例

  • USB 音声キャプチャ
  • スマートスピーカー
  • インテリジェント音声アシスタントシステム
  • ボイスレコーダー
  • 音声会議システム
  • 会議用コミュニケーション機器
  • 音声対話ロボット
  • 車載音声アシスタント
  • その他の音声インターフェースシナリオ

はじめに

note

ReSpeaker Mic Array v3.0 は Windows、Mac、Linux システムおよび andriod と互換性があります。以下のスクリプトは Python2.7 でテストされています。

andriod については、Raspberry 上で emteria.OS(andriod 7.1)を用いてテストしました。mic array v3.0 を Raspberry Pi の USB ポートに接続し、オーディオデバイスとして ReSpeaker mic array v3.0 を選択します。以下は音声録音画面です。

こちらは音声再生画面です。ReSpeaker mic array v3.0 の 3.5mm オーディオジャックにスピーカーを接続し、録音した音声を再生して聞きます。

ファームウェアの更新

ファームウェアは 2 種類あります。1 つは 1 チャンネルデータを含み、もう 1 つは 6 チャンネルデータ(工場出荷時ファームウェア)を含みます。違いは次の表のとおりです。

ファームウェアチャンネル数備考
1_channel_firmware.bin1ASR 用に処理されたオーディオ
6_channels_firmware.bin6Channel 0: processed audio for ASR
Channel 1: mic1 raw data
Channel 2: mic2 raw data
Channel 3: mic3 raw data
Channel 4: mic4 raw data
Channel 5: merged playback

Linux の場合: Mic array は USB DFU をサポートしています。USB 経由でファームウェアを更新するために、python スクリプト dfu.py を用意しています。

sudo apt-get update
sudo pip install pyusb click
git clone https://github.com/respeaker/usb_4_mic_array.git
cd usb_4_mic_array
sudo python dfu.py --download MicArrayV3_firmware/6_channels_dfu_4.0.0_firmware.bin # The 6 channels version

# if you want to use 1 channel,then the command should be like:

sudo python dfu.py --download MicArrayV3_firmware/1_channel_dfu_4.0.0_firmware.bin


Windows/Mac の場合: Windows/Mac と Linux の仮想マシンを使用してファームウェアを更新することは推奨しません。

Out of Box デモ

ここでは、6 チャンネルファームウェアを用いた Acoustic Echo Cancellation の例を示します。

  • ステップ 1. USB ケーブルを PC に、オーディオジャックをスピーカーに接続します。

  • ステップ 2. PC 側で出力デバイスとして mic array v3.0 を選択します。
  • ステップ 3. audacity を起動して録音を開始します。
  • ステップ 4. まず PC 側で音楽を再生し、その後に話します。
  • ステップ 5. 下図のように audacity の画面が表示されます。各チャンネルの音声を聞くには Solo をクリックしてください。

Channel0 Audio(アルゴリズムで処理された音声):

Channel1 Audio(Mic1 raw data):

Channel5 Audio(Playback data):

ここでは DOA と AEC に関するビデオを紹介します。

DFU と LED 制御ドライバのインストール

  • Windows: オーディオの録音と再生はデフォルトで問題なく動作します。Windows 上で LED と DSP パラメータを制御するには、libusb-win32 ドライバのみが必要です。便利なツール - Zadig を使用して、SEEED DFUSEEED Control の両方に対して libusb-win32 ドライバをインストールします(ReSpeaker Mic Array は Windows デバイスマネージャ上で 2 つのデバイスとして認識されます)。

caution

libusb-win32 が選択されていることを必ず確認してください。WinUSB や libusbK を選択しないでください。

  • MAC: ドライバは不要です。
  • Linux: ドライバは不要です。

チューニング

Linux/Mac/Windows 向け: 内蔵アルゴリズムのいくつかのパラメータを設定できます。

  • すべてのパラメータ一覧を取得します。詳細については FAQ を参照してください。
git clone https://github.com/respeaker/usb_4_mic_array.git
cd usb_4_mic_array
python tuning.py -p
  • 例 #1: Automatic Gain Control (AGC) をオフにすることができます。
python tuning.py AGCONOFF 0
  • 例 #2: DOA 角度を確認できます。
pi@raspberrypi:~/usb_4_mic_array $ sudo python tuning.py DOAANGLE
DOAANGLE: 180

LED を制御する

USB を介して ReSpeaker Mic Array V2 の LED を制御できます。この USB デバイスには Vendor Specific Class Interface があり、USB Control Transfer を通じてデータを送信するために使用できます。pyusb python library を参照し、usb_pixel_ring python library を作成しました。

LED 制御コマンドは pyusb の usb.core.Device.ctrl_transfer() によって送信され、そのパラメータは以下のとおりです:

ctrl_transfer(usb.util.CTRL_OUT | usb.util.CTRL_TYPE_VENDOR | usb.util.CTRL_RECIPIENT_DEVICE, 0, command, 0x1C, data, TIMEOUT)

以下は usb_pixel_ring の API です。

CommandDataAPINote
0[0]pixel_ring.trace()trace モード。LED の変化は VAD* と DOA* に依存します
1[red, green, blue, 0]pixel_ring.mono()mono モード。すべての RGB LED を単一の色に設定します。例: Red(0xFF0000)、Green(0x00FF00)、Blue(0x0000FF)
2[0]pixel_ring.listen()listen モード。trace モードに似ていますが、LED をオフにしません
3[0]pixel_ring.speak()wait モード
4[0]pixel_ring.think()speak モード
5[0]pixel_ring.spin()spin モード
6[r, g, b, 0] * 12pixel_ring.custimize()custom モード。各 LED をそれぞれの色に設定します
0x20[brightness]pixel_ring.set_brightness()輝度を設定します。範囲: 0x00~0x1F
0x21[r1, g1, b1, 0, r2, g2, b2, 0]pixel_ring.set_color_palette()カラーパレットを設定します。例: pixel_ring.set_color_palette(0xff0000, 0x00ff00) を pixel_ring.think() と併用
0x22[vad_led]pixel_ring.set_vad_led()中央 LED を設定: 0 - off、1 - on、それ以外 - VAD に依存
0x23[volume]pixel_ring.set_volume()音量を表示します。範囲: 0 ~ 12
0x24[pattern]pixel_ring.change_pattern()パターンを設定します。0 - Google Home パターン、その他 - Echo パターン

Linux 向け: ここでは LED を制御する例を示します。以下のコマンドに従ってデモを実行してください。

git clone https://github.com/respeaker/pixel_ring.git
cd pixel_ring
sudo python setup.py install
sudo python examples/usb_mic_array.py

usb_mic_array.py のコードは以下のとおりです。

import time
from pixel_ring import pixel_ring


if __name__ == '__main__':
pixel_ring.change_pattern('echo')
while True:

try:
pixel_ring.wakeup()
time.sleep(3)
pixel_ring.think()
time.sleep(3)
pixel_ring.speak()
time.sleep(6)
pixel_ring.off()
time.sleep(3)
except KeyboardInterrupt:
break


pixel_ring.off()
time.sleep(1)

Windows/Mac 向け: ここでは LED を制御する例を示します。

  • ステップ 1. pixel_ring をダウンロードします。
git clone https://github.com/respeaker/pixel_ring.git
cd pixel_ring/pixel_ring
  • ステップ 2. 以下のコードで led_control.py を作成し、'python led_control.py' を実行します。
from usb_pixel_ring_v2 import PixelRing
import usb.core
import usb.util
import time

dev = usb.core.find(idVendor=0x2886, idProduct=0x0018)
print dev
if dev:
pixel_ring = PixelRing(dev)

while True:
try:
pixel_ring.wakeup(180)
time.sleep(3)
pixel_ring.listen()
time.sleep(3)
pixel_ring.think()
time.sleep(3)
pixel_ring.set_volume(8)
time.sleep(3)
pixel_ring.off()
time.sleep(3)
except KeyboardInterrupt:
break

pixel_ring.off()
note

画面に "None" と表示される場合は、libusb-win32 ドライバを再インストールしてください。

DOA (Direction of Arrival)

Windows/Mac/Linux 向け: ここでは DOA を表示する例を示します。Green LED は音声方向のインジケータです。角度についてはハードウェア概要を参照してください。

  • ステップ 1. usb_4_mic_array をダウンロードします。
git clone https://github.com/respeaker/usb_4_mic_array.git
cd usb_4_mic_array
  • ステップ 2. usb_4_mic_array フォルダ内に以下のコードで DOA.py を作成し、'python DOA.py' を実行します。
note

Python 3 を使用している場合は、このファイル DOA.py が使用に適しています。また、チューニングファイルは tuning.py です。

from tuning import Tuning
import usb.core
import usb.util
import time

dev = usb.core.find(idVendor=0x2886, idProduct=0x0018)

if dev:
Mic_tuning = Tuning(dev)
print Mic_tuning.direction
while True:
try:
print Mic_tuning.direction
time.sleep(1)
except KeyboardInterrupt:
break
  • ステップ 3. 以下のように DOA が表示されます。
pi@raspberrypi:~/usb_4_mic_array $ sudo python doa.py 
184
183
175
105
104
104
103

VAD (Voice Activity Detection)

Windows/Mac/Linux 向け: ここでは VAD を表示する例を示します。Red LED は VAD のインジケータです。

  • ステップ 1. usb_4_mic_array をダウンロードします。
git clone https://github.com/respeaker/usb_4_mic_array.git
cd usb_4_mic_array
  • ステップ 2. usb_4_mic_array フォルダ内に以下のコードで VAD.py を作成し、'python VAD.py' を実行します。
note

Python 3 を使用している場合は、このファイル VAD.py が使用に適しています。また、チューニングファイルは tuning.py です。

from tuning import Tuning
import usb.core
import usb.util
import time

dev = usb.core.find(idVendor=0x2886, idProduct=0x0018)
#print dev
if dev:
Mic_tuning = Tuning(dev)
print Mic_tuning.is_voice()
while True:
try:
print Mic_tuning.is_voice()
time.sleep(1)
except KeyboardInterrupt:
break
  • ステップ 3. 以下のように DOA が表示されます。
pi@raspberrypi:~/usb_4_mic_array $ sudo python VAD.py 
0
0
0
1
0
1
0
note

VAD のしきい値については、GAMMAVAD_SR を使用して設定することもできます。詳細は Tuning を参照してください。

音声の抽出

USB を介して音声を抽出するために、PyAudio python library を使用します。

Linux の場合: 以下のコマンドを使用して音声を録音または再生できます。

arecord -D plughw:1,0 -f cd test.wav # record, please use the arecord -l to check the card and hardware first
aplay -D plughw:1,0 -f cd test.wav # play, please use the aplay -l to check the card and hardware first
arecord -D plughw:1,0 -f cd |aplay -D plughw:1,0 -f cd # record and play at the same time

また、Python スクリプトを使用して音声を抽出することもできます。

  • ステップ 1:Mic Array のデバイスインデックス番号を取得するために、次のスクリプトを実行する必要があります。
sudo pip install pyaudio
cd ~
nano get_index.py
  • ステップ 2:以下のコードをコピーして、get_index.py に貼り付けます。
note

Python 3 を使用している場合は、このファイル get_index.py を使用してください。

import pyaudio

p = pyaudio.PyAudio()
info = p.get_host_api_info_by_index(0)
numdevices = info.get('deviceCount')

for i in range(0, numdevices):
if (p.get_device_info_by_host_api_device_index(0, i).get('maxInputChannels')) > 0:
print "Input Device id ", i, " - ", p.get_device_info_by_host_api_device_index(0, i).get('name')
  • ステップ 3:Ctrl + X を押して終了し、Y を押して保存します。

  • ステップ 4:'sudo python get_index.py' を実行すると、以下のようにデバイス ID が表示されます。

Input Device id  2  -  ReSpeaker 4 Mic Array (UAC1.0): USB Audio (hw:1,0)
  • ステップ 5:RESPEAKER_INDEX = 2 をインデックス番号に変更します。Python スクリプト record.py を実行して音声を録音します。
import pyaudio
import wave

RESPEAKER_RATE = 16000
RESPEAKER_CHANNELS = 6 # change base on firmwares, 1_channel_firmware.bin as 1 or 6_channels_firmware.bin as 6
RESPEAKER_WIDTH = 2
# run getDeviceInfo.py to get index
RESPEAKER_INDEX = 2 # refer to input device id
CHUNK = 1024
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

p = pyaudio.PyAudio()

stream = p.open(
rate=RESPEAKER_RATE,
format=p.get_format_from_width(RESPEAKER_WIDTH),
channels=RESPEAKER_CHANNELS,
input=True,
input_device_index=RESPEAKER_INDEX,)

print("* recording")

frames = []

for i in range(0, int(RESPEAKER_RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)

print("* done recording")

stream.stop_stream()
stream.close()
p.terminate()

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(RESPEAKER_CHANNELS)
wf.setsampwidth(p.get_sample_size(p.get_format_from_width(RESPEAKER_WIDTH)))
wf.setframerate(RESPEAKER_RATE)
wf.writeframes(b''.join(frames))
wf.close()
  • ステップ 6:6 チャンネルからチャンネル 0 のデータを抽出したい場合は、以下のコードに従ってください。その他のチャンネル X の場合は、[0::6] を [X::6] に変更してください。
import pyaudio
import wave
import numpy as np

RESPEAKER_RATE = 16000
RESPEAKER_CHANNELS = 6 # change base on firmwares, 1_channel_firmware.bin as 1 or 6_channels_firmware.bin as 6
RESPEAKER_WIDTH = 2
# run getDeviceInfo.py to get index
RESPEAKER_INDEX = 3 # refer to input device id
CHUNK = 1024
RECORD_SECONDS = 3
WAVE_OUTPUT_FILENAME = "output.wav"

p = pyaudio.PyAudio()

stream = p.open(
rate=RESPEAKER_RATE,
format=p.get_format_from_width(RESPEAKER_WIDTH),
channels=RESPEAKER_CHANNELS,
input=True,
input_device_index=RESPEAKER_INDEX,)

print("* recording")

frames = []

for i in range(0, int(RESPEAKER_RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
# extract channel 0 data from 6 channels, if you want to extract channel 1, please change to [1::6]
a = np.fromstring(data,dtype=np.int16)[0::6]
frames.append(a.tostring())

print("* done recording")

stream.stop_stream()
stream.close()
p.terminate()

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(1)
wf.setsampwidth(p.get_sample_size(p.get_format_from_width(RESPEAKER_WIDTH)))
wf.setframerate(RESPEAKER_RATE)
wf.writeframes(b''.join(frames))
wf.close()

Windows の場合:

  • ステップ 1:以下のコマンドを実行して pyaudio をインストールします。
 pip install pyaudio
  • ステップ 2:get_index.py を使用してデバイスインデックスを取得します。
C:\Users\XXX\Desktop>python get_index.py
Input Device id 0 - Microsoft Sound Mapper - Input
Input Device id 1 - ReSpeaker 4 Mic Array (UAC1.0)
Input Device id 2 - Internal Microphone (Conexant I)
  • ステップ 3:record.py のデバイスインデックスとチャンネルを変更し、その後音声を抽出します。
C:\Users\XXX\Desktop>python record.py
* recording
* done recording
caution

"Error: %1 is not a valid Win32 application." と表示される場合は、Python の Win32 バージョンをインストールしてください。

MAC の場合:

  • ステップ 1:以下のコマンドを実行して pyaudio をインストールします。
 pip install pyaudio
  • ステップ 2:get_index.py を使用してデバイスインデックスを取得します。
MacBook-Air:Desktop XXX$ python get_index.py 
Input Device id 0 - Built-in Microphone
Input Device id 2 - ReSpeaker 4 Mic Array (UAC1.0)
  • ステップ 3:record.py のデバイスインデックスとチャンネルを変更し、その後音声を抽出します。
MacBook-Air:Desktop XXX$ python record.py 
2018-03-24 14:53:02.400 Python[2360:16629] 14:53:02.399 WARNING: 140: This application, or a library it uses, is using the deprecated Carbon Component Manager for hosting Audio Units. Support for this will be removed in a future release. Also, this makes the host incompatible with version 3 audio units. Please transition to the API's in AudioComponent.h.
* recording
* done recording

FAQ

Q1: 内蔵アルゴリズムのパラメータ

pi@raspberrypi:~/usb_4_mic_array $ python tuning.py -p
name type max min r/w info
-------------------------------
AECFREEZEONOFF int 1 0 rw Adaptive Echo Canceler updates inhibit.
0 = Adaptation enabled
1 = Freeze adaptation, filter only
AECNORM float 16 0.25 rw Limit on norm of AEC filter coefficients
AECPATHCHANGE int 1 0 ro AEC Path Change Detection.
0 = false (no path change detected)
1 = true (path change detected)
AECSILENCELEVEL float 1 1e-09 rw Threshold for signal detection in AEC [-inf .. 0] dBov (Default: -80dBov = 10log10(1x10-8))
AECSILENCEMODE int 1 0 ro AEC far-end silence detection status.
0 = false (signal detected)
1 = true (silence detected)
AGCDESIREDLEVEL float 0.99 1e-08 rw Target power level of the output signal.
[−inf .. 0] dBov (default: −23dBov = 10log10(0.005))
AGCGAIN float 1000 1 rw Current AGC gain factor.
[0 .. 60] dB (default: 0.0dB = 20log10(1.0))
AGCMAXGAIN float 1000 1 rw Maximum AGC gain factor.
[0 .. 60] dB (default 30dB = 20log10(31.6))
AGCONOFF int 1 0 rw Automatic Gain Control.
0 = OFF
1 = ON
AGCTIME float 1 0.1 rw Ramps-up / down time-constant in seconds.
CNIONOFF int 1 0 rw Comfort Noise Insertion.
0 = OFF
1 = ON
DOAANGLE int 359 0 ro DOA angle. Current value. Orientation depends on build configuration.
ECHOONOFF int 1 0 rw Echo suppression.
0 = OFF
1 = ON
FREEZEONOFF int 1 0 rw Adaptive beamformer updates.
0 = Adaptation enabled
1 = Freeze adaptation, filter only
FSBPATHCHANGE int 1 0 ro FSB Path Change Detection.
0 = false (no path change detected)
1 = true (path change detected)
FSBUPDATED int 1 0 ro FSB Update Decision.
0 = false (FSB was not updated)
1 = true (FSB was updated)
GAMMAVAD_SR float 1000 0 rw Set the threshold for voice activity detection.
[−inf .. 60] dB (default: 3.5dB 20log10(1.5))
GAMMA_E float 3 0 rw Over-subtraction factor of echo (direct and early components). min .. max attenuation
GAMMA_ENL float 5 0 rw Over-subtraction factor of non-linear echo. min .. max attenuation
GAMMA_ETAIL float 3 0 rw Over-subtraction factor of echo (tail components). min .. max attenuation
GAMMA_NN float 3 0 rw Over-subtraction factor of non- stationary noise. min .. max attenuation
GAMMA_NN_SR float 3 0 rw Over-subtraction factor of non-stationary noise for ASR.
[0.0 .. 3.0] (default: 1.1)
GAMMA_NS float 3 0 rw Over-subtraction factor of stationary noise. min .. max attenuation
GAMMA_NS_SR float 3 0 rw Over-subtraction factor of stationary noise for ASR.
[0.0 .. 3.0] (default: 1.0)
HPFONOFF int 3 0 rw High-pass Filter on microphone signals.
0 = OFF
1 = ON - 70 Hz cut-off
2 = ON - 125 Hz cut-off
3 = ON - 180 Hz cut-off
MIN_NN float 1 0 rw Gain-floor for non-stationary noise suppression.
[−inf .. 0] dB (default: −10dB = 20log10(0.3))
MIN_NN_SR float 1 0 rw Gain-floor for non-stationary noise suppression for ASR.
[−inf .. 0] dB (default: −10dB = 20log10(0.3))
MIN_NS float 1 0 rw Gain-floor for stationary noise suppression.
[−inf .. 0] dB (default: −16dB = 20log10(0.15))
MIN_NS_SR float 1 0 rw Gain-floor for stationary noise suppression for ASR.
[−inf .. 0] dB (default: −16dB = 20log10(0.15))
NLAEC_MODE int 2 0 rw Non-Linear AEC training mode.
0 = OFF
1 = ON - phase 1
2 = ON - phase 2
NLATTENONOFF int 1 0 rw Non-Linear echo attenuation.
0 = OFF
1 = ON
NONSTATNOISEONOFF int 1 0 rw Non-stationary noise suppression.
0 = OFF
1 = ON
NONSTATNOISEONOFF_SR int 1 0 rw Non-stationary noise suppression for ASR.
0 = OFF
1 = ON
RT60 float 0.9 0.25 ro Current RT60 estimate in seconds
RT60ONOFF int 1 0 rw RT60 Estimation for AES. 0 = OFF 1 = ON
SPEECHDETECTED int 1 0 ro Speech detection status.
0 = false (no speech detected)
1 = true (speech detected)
STATNOISEONOFF int 1 0 rw Stationary noise suppression.
0 = OFF
1 = ON
STATNOISEONOFF_SR int 1 0 rw Stationary noise suppression for ASR.
0 = OFF
1 = ON
TRANSIENTONOFF int 1 0 rw Transient echo suppression.
0 = OFF
1 = ON
VOICEACTIVITY int 1 0 ro VAD voice activity status.
0 = false (no voice activity)
1 = true (voice activity)

Q2: ImportError: No module named usb.core

A2: sudo pip install pyusb を実行して、pyusb をインストールしてください。

pi@raspberrypi:~/usb_4_mic_array $ sudo python tuning.py DOAANGLE
Traceback (most recent call last):
File "tuning.py", line 5, in <module>
import usb.core
ImportError: No module named usb.core
pi@raspberrypi:~/usb_4_mic_array $ sudo pip install pyusb
Collecting pyusb
Downloading pyusb-1.0.2.tar.gz (54kB)
100% |████████████████████████████████| 61kB 101kB/s
Building wheels for collected packages: pyusb
Running setup.py bdist_wheel for pyusb ... done
Stored in directory: /root/.cache/pip/wheels/8b/7f/fe/baf08bc0dac02ba17f3c9120f5dd1cf74aec4c54463bc85cf9
Successfully built pyusb
Installing collected packages: pyusb
Successfully installed pyusb-1.0.2
pi@raspberrypi:~/usb_4_mic_array $ sudo python tuning.py DOAANGLE
DOAANGLE: 180

Q3: Raspberry alexa アプリケーション用のサンプルはありますか?

A3: はい、mic array v3.0 を Raspberry の USB ポートに接続し、Raspberry Pi Quick Start Guide with Script に従って alexa との音声対話を行うことができます。

Q4: ROS システムでの Mic array v3.0 用のサンプルはありますか?

A4: はい、ReSpeaker Mic Array v2 with ROS (Robot Operating System) Middleware を統合するためのパッケージを共有してくれた Yuki に感謝します。

Q5: 3.5mm オーディオポートを、USB ポートと同様に信号を受信できるように有効化するにはどうすればよいですか?

A5: new firmware をダウンロードし、How to update firmware に従って XMOS を書き込んでください。

リソース

技術サポート & 製品ディスカッション

弊社製品をお選びいただきありがとうございます。弊社は、製品をできるだけスムーズにご利用いただけるよう、さまざまなサポートを提供しています。お好みやニーズに応じて選べる、複数のコミュニケーションチャネルをご用意しています。

Loading Comments...