Seeed Studio XIAO ESP32S3マイクロフォンの使用方法

このチュートリアルでは、XIAO ESP32S3 Sense拡張ボードのマイクロフォンの使用方法をご紹介します。まず、I2Sピンの基本的な使用方法から始めて、I2Sとマイクロフォンを使用して現在の環境の音量を取得し、シリアル波形グラフで表示します。次に、音声を録音してSDカードに保存する方法について説明します。

Seeed Studio XIAO ESP32S3 Sense

今すぐ購入取 🖱️

caution

このチュートリアルの内容はすべてXIAO ESP32S3 Senseにのみ適用されます。

はじめに

チュートリアルの内容を始める前に、以下のハードウェアとソフトウェアを事前に準備する必要があります。

拡張ボードの取り付け（Sense用）

拡張ボードの取り付けは非常に簡単です。拡張ボードのコネクタをXIAO ESP32S3のB2Bコネクタに合わせて、強く押して「カチッ」という音が聞こえれば取り付け完了です。

microSDカードの準備

録音を保存するプロジェクトに取り組む際には、MicroSDカードが必要になる場合があります。

XIAO ESP32S3 Senseは最大32GBのmicroSDカードをサポートしているため、XIAOのためにmicroSDカードを購入する予定の場合は、この仕様を参考にしてください。microSDカードを使用する前に、FAT32形式でフォーマットしてください。

フォーマット後、microSDカードをmicroSDカードスロットに挿入できます。挿入方向に注意してください。金色の端子がある面を内側に向けてください。

ピンの理解

ピン番号	機能説明
GPIO 41	PDM マイクロフォン DATA
GPIO 42	PDM マイクロフォン CLK

音の大きさの検出

最初のプロジェクトケースでは、環境内のノイズを検出し、Arduino IDEのシリアルポート波形グラフを使用してマイクロフォンで検出された環境音量を表示します。

以下は完全なサンプルプログラムです。

tip

使用しているesp32のバージョンを確認してください。以下の例は2.0.x用で、その下は3.0.x以降用です。

#include <I2S.h>

void setup() {
  // Open serial communications and wait for port to open:
  // A baud rate of 115200 is used instead of 9600 for a faster data rate
  // on non-native USB ports
  Serial.begin(115200);
  while (!Serial) {
    ; // wait for serial port to connect. Needed for native USB port only
  }

  // start I2S at 16 kHz with 16-bits per sample
  I2S.setAllPins(-1, 42, 41, -1, -1);
  if (!I2S.begin(PDM_MONO_MODE, 16000, 16)) {
    Serial.println("Failed to initialize I2S!");
    while (1); // do nothing
  }
}

void loop() {
  // read a sample
  int sample = I2S.read();

  if (sample && sample != -1 && sample != 1) {
    Serial.println(sample);
  }
}

tip

上記の例はesp32の2.0.xにのみ対応しています。最新版（例：3.0.x）を使用している場合は、以下のものを使用してください。

#include <ESP_I2S.h>
I2SClass I2S;

void setup() {
  // Open serial communications and wait for port to open:
  // A baud rate of 115200 is used instead of 9600 for a faster data rate
  // on non-native USB ports
  Serial.begin(115200);
  while (!Serial) {
    ; // wait for serial port to connect. Needed for native USB port only
  }

  // setup 42 PDM clock and 41 PDM data pins
  I2S.setPinsPdmRx(42, 41);

  // start I2S at 16 kHz with 16-bits per sample
  if (!I2S.begin(I2S_MODE_PDM_RX, 16000, I2S_DATA_BIT_WIDTH_16BIT, I2S_SLOT_MODE_MONO)) {
    Serial.println("Failed to initialize I2S!");
    while (1); // do nothing
  }
}

void loop() {
  // read a sample
  int sample = I2S.read();

  if (sample && sample != -1 && sample != 1) {
    Serial.println(sample);
  }
}

このプログラムをXIAO ESP32S3 Senseにアップロードし、Serial Plotterを開くと、音の大きさの変化曲線が表示されます。

プログラムの注釈

プログラムの最初に、マイクロフォンピンを使用するためにI2Sライブラリをインポートする必要があります。

#include <I2S.h>

I2SオブジェクトでsetAllPins()関数が呼び出され、I2Sインターフェースに使用されるピンを設定します。この関数は、I2Sインターフェースのビットクロック、ワードセレクト、データ入力、データ出力、チャンネルセレクトラインにそれぞれ接続されたGPIOピンを表す5つの整数パラメータを取ります。

I2S.setAllPins(-1, 42, 41, -1, -1);

この特定のコードでは、-1の値は対応するピンが使用されていないことを示し、42と41の値はそれぞれワードセレクトとデータ入力ラインに接続されたGPIOピンを表します。データ出力とチャンネルセレクトラインはこの構成では使用されず、-1に設定されています。

if (!I2S.begin(PDM_MONO_MODE, 16000, 16)) {
    Serial.println("Failed to initialize I2S!");
    while (1); // do nothing
}

I2Sオブジェクトでbegin()関数が呼び出され、指定されたパラメータでI2Sインターフェースを初期化します：PDM_MONO_MODE、16000Hzサンプリングレート、16ビット解像度。

tip

現在のESP32-S3チップでは、PDM_MONO_MODEのみを使用でき、サンプリングビット幅は16bitのみです。サンプリングレートのみ変更可能ですが、テストの結果、16kHzでのサンプリングレートが比較的安定しています。

int sample = I2S.read();

if (sample && sample != -1 && sample != 1) {
    Serial.println(sample);
}

I2Sオブジェクトでread()関数が呼び出され、I2Sインターフェースから単一のオーディオサンプルを読み取ります。if文はsample変数の値をチェックします。サンプル値が0、-1、または1でない場合、有効なオーディオサンプルと見なされ、ifブロック内のコードが実行されます。この場合、サンプル値はSerial.println()関数を使用してシリアルコンソールに出力されます。

録音した音声をmicroSDカードに保存

次のプロジェクトでは、microSDカードの機能を組み合わせて、録音した音声をmicroSDカードに保存する方法をご案内します。このプロジェクトでは、microSDカードを準備し、事前にFAT32形式でフォーマットしてください。

XIAO ESP32S3でmicroSDカードを初めて使用する場合は、ファイルシステムWikiの内容を読んで、microSDカードのインストールと準備について学習してください。

以下はこのプロジェクトのArduinoプログラムです。

tip

使用しているesp32のバージョンを確認してください。以下の例は2.0.x用で、その下は3.0.x以降用です。

/* 
 * WAV Recorder for Seeed XIAO ESP32S3 Sense 
*/

#include <I2S.h>
#include "FS.h"
#include "SD.h"
#include "SPI.h"

// make changes as needed
#define RECORD_TIME   20  // seconds, The maximum value is 240
#define WAV_FILE_NAME "arduino_rec"

// do not change for best
#define SAMPLE_RATE 16000U
#define SAMPLE_BITS 16
#define WAV_HEADER_SIZE 44
#define VOLUME_GAIN 2

void setup() {
  Serial.begin(115200);
  while (!Serial) ;
  I2S.setAllPins(-1, 42, 41, -1, -1);
  if (!I2S.begin(PDM_MONO_MODE, SAMPLE_RATE, SAMPLE_BITS)) {
    Serial.println("Failed to initialize I2S!");
    while (1) ;
  }
  if(!SD.begin(21)){
    Serial.println("Failed to mount SD Card!");
    while (1) ;
  }
  record_wav();
}

void loop() {
  delay(1000);
  Serial.printf(".");
}

void record_wav()
{
  uint32_t sample_size = 0;
  uint32_t record_size = (SAMPLE_RATE * SAMPLE_BITS / 8) * RECORD_TIME;
  uint8_t *rec_buffer = NULL;
  Serial.printf("Ready to start recording ...\n");

  File file = SD.open("/"WAV_FILE_NAME".wav", FILE_WRITE);
  // Write the header to the WAV file
  uint8_t wav_header[WAV_HEADER_SIZE];
  generate_wav_header(wav_header, record_size, SAMPLE_RATE);
  file.write(wav_header, WAV_HEADER_SIZE);

  // PSRAM malloc for recording
  rec_buffer = (uint8_t *)ps_malloc(record_size);
  if (rec_buffer == NULL) {
    Serial.printf("malloc failed!\n");
    while(1) ;
  }
  Serial.printf("Buffer: %d bytes\n", ESP.getPsramSize() - ESP.getFreePsram());

  // Start recording
  esp_i2s::i2s_read(esp_i2s::I2S_NUM_0, rec_buffer, record_size, &sample_size, portMAX_DELAY);
  if (sample_size == 0) {
    Serial.printf("Record Failed!\n");
  } else {
    Serial.printf("Record %d bytes\n", sample_size);
  }

  // Increase volume
  for (uint32_t i = 0; i < sample_size; i += SAMPLE_BITS/8) {
    (*(uint16_t *)(rec_buffer+i)) <<= VOLUME_GAIN;
  }

  // Write data to the WAV file
  Serial.printf("Writing to the file ...\n");
  if (file.write(rec_buffer, record_size) != record_size)
    Serial.printf("Write file Failed!\n");

  free(rec_buffer);
  file.close();
  Serial.printf("The recording is over.\n");
}

void generate_wav_header(uint8_t *wav_header, uint32_t wav_size, uint32_t sample_rate)
{
  // See this for reference: http://soundfile.sapp.org/doc/WaveFormat/
  uint32_t file_size = wav_size + WAV_HEADER_SIZE - 8;
  uint32_t byte_rate = SAMPLE_RATE * SAMPLE_BITS / 8;
  const uint8_t set_wav_header[] = {
    'R', 'I', 'F', 'F', // ChunkID
    file_size, file_size >> 8, file_size >> 16, file_size >> 24, // ChunkSize
    'W', 'A', 'V', 'E', // Format
    'f', 'm', 't', ' ', // Subchunk1ID
    0x10, 0x00, 0x00, 0x00, // Subchunk1Size (16 for PCM)
    0x01, 0x00, // AudioFormat (1 for PCM)
    0x01, 0x00, // NumChannels (1 channel)
    sample_rate, sample_rate >> 8, sample_rate >> 16, sample_rate >> 24, // SampleRate
    byte_rate, byte_rate >> 8, byte_rate >> 16, byte_rate >> 24, // ByteRate
    0x02, 0x00, // BlockAlign
    0x10, 0x00, // BitsPerSample (16 bits)
    'd', 'a', 't', 'a', // Subchunk2ID
    wav_size, wav_size >> 8, wav_size >> 16, wav_size >> 24, // Subchunk2Size
  };
  memcpy(wav_header, set_wav_header, sizeof(set_wav_header));
}

tip

上記の例はesp32の2.0.xとのみ互換性があります。最新版（例：3.0.x）を使用している場合は、以下のものを使用してください

#include "ESP_I2S.h"
#include "FS.h"
#include "SD.h"

void setup() {
  // Create an instance of the I2SClass
  I2SClass i2s;

  // Create variables to store the audio data
  uint8_t *wav_buffer;
  size_t wav_size;

  // Initialize the serial port
  Serial.begin(115200);
  while (!Serial) {
    delay(10);
  }

  Serial.println("Initializing I2S bus...");

  // Set up the pins used for audio input
  i2s.setPinsPdmRx(42, 41);

  // start I2S at 16 kHz with 16-bits per sample
  if (!i2s.begin(I2S_MODE_PDM_RX, 16000, I2S_DATA_BIT_WIDTH_16BIT, I2S_SLOT_MODE_MONO)) {
    Serial.println("Failed to initialize I2S!");
    while (1); // do nothing
  }

  Serial.println("I2S bus initialized.");
  Serial.println("Initializing SD card...");

  // Set up the pins used for SD card access
  if(!SD.begin(21)){
    Serial.println("Failed to mount SD Card!");
    while (1) ;
  }
  Serial.println("SD card initialized.");
  Serial.println("Recording 20 seconds of audio data...");

  // Record 20 seconds of audio data
  wav_buffer = i2s.recordWAV(20, &wav_size);

  // Create a file on the SD card
  File file = SD.open("/arduinor_rec.wav", FILE_WRITE);
  if (!file) {
    Serial.println("Failed to open file for writing!");
    return;
  }

  Serial.println("Writing audio data to file...");

  // Write the audio data to the file
  if (file.write(wav_buffer, wav_size) != wav_size) {
    Serial.println("Failed to write audio data to file!");
    return;
  }

  // Close the file
  file.close();

  Serial.println("Application complete.");
}

void loop() {
  delay(1000);
  Serial.printf(".");
}

この例を実行するには、ESP-32チップのPSRAM機能を使用する必要があるため、アップロード前にオンにしてください。

このプログラムは、ユーザーがシリアルモニターをオンにした後に一度だけ実行され、20秒間録音し、録音ファイルを「arduino_rec.wav」としてmicroSDカードに保存します。

シリアルモニターで1秒ごとに「.」が出力されると、プログラムの実行が完了し、カードリーダーを使用して録音されたサウンドファイルを再生できます。

tip

XIAO ESP32S3から録音されたオーディオを再生するには、WAV形式をサポートするオーディオプレーヤーを使用する必要がある場合があります。

プログラムの注釈

このプログラムでは、録音機能のために2つの関数を作成しました。1つはrecord_wav()で、もう1つはgenerate_wav_header()です。

record_wav()：録音機能。この関数では、プログラムはI2Sインターフェースを使用してマイクからオーディオデータを読み取り、WAVオーディオファイルとしてSDカードに保存します。

a. 変数の初期化。プログラムは録音データを保存するためのバッファrec_bufferを定義し、録音時間RECORD_TIMEを設定します。

b. WAVファイルを開く。プログラムはSD.open()関数を使用してWAVオーディオファイルを開き、そのファイル名をWAV_FILE_NAMEとして定義します。

c. WAVファイルヘッダーを書き込む。プログラムはgenerate_wav_header()関数を使用してWAVオーディオファイルのヘッダー情報を生成し、開いたWAVファイルに書き込みます。

d. メモリを割り当てて録音を開始する。プログラムはps_malloc()関数を使用してESP32S3のPSRAMに録音データを保存するためのメモリブロックを割り当て、esp_i2s::i2s_read()関数を使用してマイクからオーディオデータを読み取ります。読み取られたデータはrec_bufferバッファに保存されます。

e. 音量を上げる。プログラムはVOLUME_GAIN定数で定義されたゲイン値を使用して、録音データの音量を上げます。

f. 録音データをWAVファイルに書き込む。プログラムはfile.write()関数を使用して、録音データを開いたWAVファイルに書き込みます。

g. バッファメモリを解放してWAVファイルを閉じる。プログラムはfree()関数を使用してrec_bufferバッファのメモリを解放し、file.close()関数を使用して開いたWAVファイルを閉じます。
generate_wav_header(uint8_t *wav_header, uint32_t wav_size, uint32_t sample_rate)：WAVファイルのヘッダー情報を生成する関数。この関数では、プログラムはWAVファイルの仕様に基づいて、WAVファイルのヘッダー情報を含むバイト配列を生成します。

a. WAVファイルヘッダー情報の定数を定義する。プログラムはWAVファイルのヘッダー情報を含むバイト配列set_wav_headerを定義し、NUM_CHANNELS、BITS_PER_SAMPLE、WAV_HEADER_SIZE、SUB_CHUNK_SIZEを含むWAVファイルの仕様の定数を定義します。

b. WAVファイルヘッダー情報を設定する。プログラムはステップaで定義された定数を使用してWAVファイルヘッダー情報を設定し、WAVファイルの仕様に基づいてAUDIO_FORMAT、BYTE_RATE、BLOCK_ALIGN、SAMPLES_PER_CHANNEL、CHUNK_SIZEを含むいくつかのフィールドの値を計算します。計算された値はset_wav_headerバイト配列に保存されます。

c. WAVファイルヘッダー情報をコピーする。プログラムはset_wav_headerに保存されたヘッダー情報をバイト配列wav_headerにコピーします。

トラブルシューティング

録音されたオーディオファイルが再生できないのはなぜですか？

再生できない状況に遭遇した場合は、シリアルモニターで印刷されたデバッグ情報でカードの読み書きに関するエラーメッセージを確認してください。エラーがある場合は、microSDカードを交換するか、カードと拡張ボードの接続が緩んでいるか不安定でないかを確認してください。カードに問題がない場合は、オーディオファイルのサイズを確認する必要があります。録音に問題がある場合、録音されたオーディオファイルのサイズが0KBのみと表示される可能性があります。

例えば、下図では、カードの読み書きに問題があります。

カードに問題がなく、録音が非常に成功している場合は、ソフトウェアがWAV形式でのオーディオ再生をサポートしているかどうかを確認する必要があります。専用の音楽再生ソフトウェアを使用してオーディオを再生することをお勧めします。ビデオプレーヤーでの再生は避けてください。実際のテストの結果、多くのビデオプレーヤー（WAV形式をサポートしているにもかかわらず）が再生できないことがわかりました。

技術サポートと製品ディスカッション

私たちの製品をお選びいただき、ありがとうございます！私たちの製品での体験ができるだけスムーズになるよう、さまざまなサポートを提供しています。さまざまな好みやニーズに対応するため、複数のコミュニケーションチャンネルを提供しています。

はじめに​

拡張ボードの取り付け（Sense用）​

microSDカードの準備​

ピンの理解​

音の大きさの検出​

プログラムの注釈​

録音した音声をmicroSDカードに保存​

プログラムの注釈​

トラブルシューティング​

録音されたオーディオファイルが再生できないのはなぜですか？​

技術サポートと製品ディスカッション​

はじめに

拡張ボードの取り付け（Sense用）

microSDカードの準備

ピンの理解

音の大きさの検出

プログラムの注釈

録音した音声をmicroSDカードに保存

プログラムの注釈

トラブルシューティング

録音されたオーディオファイルが再生できないのはなぜですか？

技術サポートと製品ディスカッション