フィラー単語の自動削除
「あのー」や「えーっと」などのフィラー単語(不要語)は自動的に音声認識結果から取り除かれます。
例えば、以下のように発話したとします。
えーっと、会議があるので、えー、それまでに、あのー、資料を作成しておきます。
この音声の認識結果は以下のようになります。
会議があるのでそれまでに資料を作成しておきます。
以下のような単語がフィラー単語として扱われています。
| 言語 | フィラー単語の例 |
|---|---|
| 日本語 | あー, あのー, えー, おー, えっと |
| 英語 | ah, urm, hmm |
| 中国語 | 呃, 啊, 哎呀 |
| 韓国語 | 어, 으, 음 |
注記
- 一部の特殊なエンジンを除き、フィラー単語を利用者が追加することはできません。
- フィラー単語は精度向上の過程で変更される可能性があり、フィラー単語の一覧は公開していません。
- 「音声入力_氏名エンジン」および「音声入力_住所エンジン」では、デフォルトではフィラー単語が設定されていません。利用者が不要な単語を「フィラー(文頭)」または「フィラー(文末)」クラスに単語登録することで、フィラー単語として扱われるようになります。詳細はハイブリッドエンジンの単語登録の特殊な単語登録を参照してください。
test-with-filler.wavという音声ファイルに上記の発話内容が含まれている場合、以下のようにcurlコマンドを実行すると、フィラー単語の自動的削除が確認できます。この手順の詳細は短い音声ファイルのを書き起こしを参照してください。WebSocketの場合は、音声認識のリクエストを参照してください。
curl -sS https://acp-api.amivoice.com/v1/recognize \
-F u={APPKEY} \
-F "d=-a-general" \
-F a=@test-with-filler.wav | jq
レスポンス
{
"results": [
{
"tokens": [
{
"written": "会議",
"confidence": 0.99,
"starttime": 656,
"endtime": 1184,
"spoken": "かいぎ"
},
{
"written": "が",
"confidence": 1,
"starttime": 1184,
"endtime": 1312,
"spoken": "が"
},
{
"written": "ある",
"confidence": 1,
"starttime": 1312,
"endtime": 1536,
"spoken": "ある"
},
{
"written": "ので",
"confidence": 1,
"starttime": 1536,
"endtime": 1920,
"spoken": "ので"
},
{
"written": "それ",
"confidence": 1,
"starttime": 2384,
"endtime": 2736,
"spoken": "それ"
},
{
"written": "まで",
"confidence": 1,
"starttime": 2736,
"endtime": 3024,
"spoken": "まで"
},
{
"written": "に",
"confidence": 1,
"starttime": 3024,
"endtime": 3296,
"spoken": "に"
},
{
"written": "資料",
"confidence": 0.97,
"starttime": 3920,
"endtime": 4384,
"spoken": "しりょう"
},
{
"written": "を",
"confidence": 1,
"starttime": 4384,
"endtime": 4544,
"spoken": "を"
},
{
"written": "作成",
"confidence": 0.98,
"starttime": 4576,
"endtime": 5136,
"spoken": "さくせい"
},
{
"written": "