長い音声ファイルの書き起こし
会議や講演のスピーチ、コールセンターの通話録音などの長い音声をテキストにする場合のAPIの利用方法をステップバイステップで説明します。このチュートリアルではプログラムを記述する代わりに、curl
コマンドとjq
コマンドを使って説明します。
準備
このチュートリアルを実行するためには以下が必要です。
- curl
- jq
- AmiVoice API に登録し、
APPKEY
を取得する - 書き起こししたい音声ファイルを用意する
注記
結果を見やすく整形するために、jq
コマンドを利用しています。jq
がインストールされていなくても、このあとのチュートリアルで音声を書き起こしできますので、インストールせずに進んでも構いません。
curl
ご利用のシステムにcurl
コマンドがインストールされているかどうかを確認してください。
curl -V
バージョンが表示されない場合は、https://curl.se/からご利用の OS のパッケージをダウンロードするか、パッケージマネージャを利用してcurl
をインストールしてください。
jq
ご利用のシステムにjq
コマンドがインストールされているかどうかを確認してください。
jq -V
バージョンが表示されない場合は、https://stedolan.github.io/jq/からご利用の OS のパッケージをダウンロードするか、パッケージマネージャを利用してjq
をインストールしてください。
APPKEYの取得
- AmiVoice API へ登録します。
- マイページにログインし、[接続情報]タブの[共通接続情報]に記載されている APPKEY を記録しておきます。
ヒント
AmiVoice Tech BlogでAPPKEY
を取得するまでの手順を詳述しています。APPKEY
の取得についてはAmiVoice APIを使ってみようも参照してください。
音声ファイル
書き起こししたい音声ファイルを用意します。
ここでは、クライアントライブラリのサンプルプログラムに同梱されている音声ファイルtest.wav
を使います。
注記
- 音声ファイルを準備するとき、対応している音声ファイルの形式に注意してください。対応フォーマットは、音声フォーマットについてを参照してください。
- 受付可能な音声ファイルの長さには制限があります。制限事項を参照してください。