リクエストパラメータ
AmiVoice API で音声認識をリクエストするときに設定するパラメータについて説明します。HTTP、WebSocket インタフェースでそれぞれ送信方法が異なりますが、設定できるパラメータは同じです。
パラメータの一覧
authorization
(認証情報)とgrammarFileNames
(接続エンジン名)は必須です。その他のパラメータはオプションです。インタフェース毎に対応していないものもありますので、下記の表を参照してください。
パラメータ名 | 説明 | 必須 | 同期HTTP | WebSocket | 非同期HTTP |
---|---|---|---|---|---|
authorization | 認証情報 | ● | ● | ● | ● |
grammarFileNames | 接続エンジン名 | ● | ● | ● | ● |
profileId | プロファイル ID | ● | ● | ● | |
profileWords | 単語登録リスト | ● | ● | ● | |
keepFillerToken | フィラー単語(不要語)の自動削除の抑制 | ● | ● | ● | |
segmenterProperties | 発話区間検出のパラメータ | ● | ● | ||
resultUpdatedInterval | 認識中イベントの間隔 | ● | |||
loggingOptOut | ログ保存のあり、なしの変更 | ● | |||
contentId | ユーザー定義 ID | ● | |||
compatibleWithSync | 結果フォーマットの互換性 | ● | |||
speakerDiarization | 話者ダイアライゼーションの有効化オプション | ● | |||
diarizationMinSpeaker | 話者ダイアライゼーションの最小推定話者人数 | ● | |||
diarizationMaxSpeaker | 話者ダイアライゼーションの最大推定話者人数 | ● | |||
sentimentAnalysis | 感情分析の有効化オプション | ● |
これらのリクエストパラメータの送信方法については、次のセクションを参照してください。
パラメータの詳細
以下ではパラメータの詳細について説明します。
必須パラメータ
authorization
認証情報
API を利用するためには必ず認証情報を設定する必要があります。認証情報は、マイページに記載された[APPKEY]、または、ワンタイム APPKEY 発行 APIで取得したワンタイム APPKEY です。
ブラウザアプリケーションから音声認識サーバに接続する場合には、HTML ファイルに APPKEY を書き込むことを避けるために、ワンタイム APPKEY を使用するようにしてください。詳細は、ワンタイムAPPKEYを参照してください。
grammarFileNames
接続エンジン名
そのセッションで使用したい音声認識エンジンを指定します。1 回のセッションで 1 つ指定します。設定できる値は接続エンジン名の一覧表か、マイページを参照してください。詳細は音声認識エンジンを参照してください。
オプションパラメータ
profileId
プロファイル ID
プロファイルとは、音声認識サーバ上に存在するユーザーごとのデータファイルで、ユーザーが名前をつけて、登録した単語を保存できます。プロファイル ID はそのデータファイルを指定するための識別子です。詳細は、単語登録を参照してください。
profileWords
単語登録リスト
セッションで有効な単語を登録できます。ひとつの単語は『表記 (半角スペース)読み』という形式で登録します。クラス名を指定する場合は、『表記<半角スペース>読み <半角スペース> クラス名』としてください。複数登録する場合は、単語と単語を「|」(半角縦棒)で区切ります。値のフォーマットは以下のようになります (クラス名を指定していない場合の例です)。
表記1 読み1|表記2 読み2|表記3 読み3|表記4 読み4
詳細は、単語登録を参照してください。
keepFillerToken
フィラー単語(不要語)の自動削除の抑制
1
か0
を指定します。デフォルトは0
です。音声認識結果に含まれるフィラー単語 (「あー」や「えー」など)を自動的に除去したくないときに1
を指定します。フィラー単語の自動削除も参照してください。
フィラー単語は単語の前後を半角の「%」で囲まれています。以下はフィラー単語の例です。
%あー%
%えー%
%おー%
%えっと%
AmiVoice Tech BlogのAmiVoice APIで不要語(フィラー)を表示するか除去するか選ぶ方法も参照してください。
segmenterProperties
発話区間検出のパラメータ
以下のパラメータを設定できます。
useDiarizer
1
を設定すると、同期 HTTP や WebSocket インターフェースで話者ダイアライゼーションを有効にします。デフォルトは無効です。詳細は、話者ダイアライゼーションを参照してください。
diarizerAlpha
- 同期 HTTP や WebSocket インターフェースでの話者ダイアライゼーションの新規話者の出現しやすさを制御するパラメータです。大きな値を指定するほど新規話者が出現しやすくなり、小さな値を指定するほど新規話者が出現しづらくなります。
diarizerAlpha=0
は特別で、1e0、つまり 1 が指定されたものとして扱われます。何も設定しないとdiarizerAlpha=0
が指定されたことになります。
- 同期 HTTP や WebSocket インターフェースでの話者ダイアライゼーションの新規話者の出現しやすさを制御するパラメータです。大きな値を指定するほど新規話者が出現しやすくなり、小さな値を指定するほど新規話者が出現しづらくなります。
diarizerTransitionBias
- 同期 HTTP や WebSocket インターフェースでの話者ダイアライゼーションの話者の切り替わりやすさを制御するパラメータです。大きな値を指定するほど話者が切り替わりやすくなり、小さな値を指定するほど話者が切り替わりづらくなります。
diarizerTransitionBias=0
は特別で、1e-40 が指定されたものとして扱われます。ただし、8Kz 音声に対応しているエンジン、例えば、汎用エンジン(-a-general
)を利用しサンプリングレートが8kの音声を送信した場合は、1e-20 が指定されたものとして扱われます。何も設定しないとdiarizerTransitionBias=0
が指定されたことになります。
- 同期 HTTP や WebSocket インターフェースでの話者ダイアライゼーションの話者の切り替わりやすさを制御するパラメータです。大きな値を指定するほど話者が切り替わりやすくなり、小さな値を指定するほど話者が切り替わりづらくなります。
WebSocket API 固有のパラメータ
resultUpdatedInterval
認識中イベントの間隔
認識中イベントを発行する間隔をミリ秒単位で指定します。
- 0 に設定すると認識中イベントを発行しません。
- 指定された時間の音声データを認識処理する毎に認識中イベントを発行します。認識中イベントは、実際に経過した時間に応じて発行されるのではなく、認識処理された音声データの処理量に応じて発行されます。100 未満の端数を含む値が指定された場合は、100 の倍数に切り上げた値が指定されたものとして扱います。
非同期 HTTP インタフェース 固有のパラメータ
loggingOptOut
ログ保存のあり、なしの変更
loggingOptOut=<True|False>
ログの保存のあり、なしを指定します。True に設定するとセッション中、システムはログを保存しません。デフォルトは False です。
contentId
ユーザー定義 ID
contentId=<任意の文字列>
ユーザー側で定義した任意の文字列を指定できます。そのセッション中の状態、結果のレスポンスに含まれます。デフォルトは None です。
compatibleWithSync
結果フォーマットの互換性
compatibleWithSync=<True|False>
同期 HTTP インタフェース と互換性のある形で結果をフォーマットします。デフォルトは False です。
speakerDiarization
話者ダイアライゼーションの有効化オプション
speakerDiarization=<True|False>
話者ダイアライゼーションを有効にします。デフォルトは False です。詳細は、話者ダイアライゼーションを参照してください。
diarizationMinSpeaker
話者ダイアライゼーションの最小推定話者人数
diarizationMinSpeaker=<int>
話者ダイアライゼーションが有効になっているときのみ有効で、音声に含まれる最小話者数を指定できます。1 以上に設定する必要があります。デフォルトは 1 です。詳細は、話者ダイアライゼーションを参照してください。
diarizationMaxSpeaker
話者ダイアライゼーションの最大推定話者人数
diarizationMaxSpeaker=<int>
話者ダイアライゼーションが有効になっているときのみ有効で、音声に含まれる最大話者数を指定できます。diarizationMinSpeaker 以上に設定する必要があります。デフォルトは 10 です。詳細は、話者ダイアライゼーションを参照してください。
sentimentAnalysis
感情分析の有効化オプション
sentimentAnalysis=<True|False>
感情分析を有効にします。デフォルトは False です。
詳細は、感情分析を参照してください。