短い音声ファイルの書き起こし
手元にある短い音声ファイル(16MB 以下)を AmiVoice API の HTTPインタフェース のエンドポイントに送信すれば簡単にテキストに変換することができます。このチュートリアルではプログラムを記述する代わりに、curl
コマンドとjq
コマンドを使って API の利用方法を説明します。長い音声ファイルの場合は次のチュートリアル「長い音声ファイルの書き起こし」で説明します。
準備
このチュートリアルを実行するためには以下が必要です。
- curl
- jq
- AmiVoice API に登録し、
APPKEY
を取得する - 書き起こししたい音声ファイルを用意する
結果を見やすく整形するために、jq
コマンドを利用しています。jq
がインストールされていなくても、このあとのチュートリアルで音声を書き起こしできますので、インストールせずに進んでも構いません。
curl
ご利用のシステムにcurl
コマンドがインストールされているかどうかを確認してください。
curl -V
バージョンが表示されない場合は、https://curl.se/からご利用の OS のパッケージをダウンロードするか、パッケージマネージャを利用してcurl
をインストールしてください。
jq
ご利用のシステムにjq
コマンドがインストールされているかどうかを確認してください。
jq -V
バージョンが表示されない場合は、https://stedolan.github.io/jq/からご利用の OS のパッケージをダウンロードするか、パッケージマネージャを利用してjq
をインストールしてください。
APPKEYの取得
- AmiVoice API へ登録します。
- マイページにログインし、[接続情報]タブの[共通接続情報]に記載されている APPKEY を記録しておきます。
AmiVoice Tech BlogでAPPKEY
を取得するまでの手順を詳述しています。APPKEY
の取得についてはAmiVoice APIを使ってみようも参照してください。
音声ファイル
書き起こししたい音声ファイルを用意します。 ここでは、クライアントライブラリのサンプルプログラムに同梱されている音声ファイル(test.wav)を使います。
- 音声ファイルを準備するとき、対応している音声ファイルの形式に注意してください。対応フォーマットは、音声フォーマットについてを参照してください。
- 16MB 以上の音声ファイルを送信する場合は、次の長い音声ファイルの文字起こしを参照してください。
実 行
ターミナルを起動して以下のコマンドをコピーして実行してください。その際、test.wav
の部分は、用意した音声ファイルのパスに置き換えてください。また、{APPKEY}
は自身のキーに置き換えてください。
curl https://acp-api.amivoice.com/v1/recognize \
-F d=-a-general \
-F u={APP_KEY} \
-F a=@test.wav