填充词自动删除

像"あのー"和"えーっと"这样的填充词(不必要的词)会自动从语音识别结果中删除。

例如，假设以下面的方式说话：

えーっと、会議があるので、えー、それまでに、あのー、資料を作成しておきます。

这段语音的识别结果如下：

会議があるのでそれまでに資料を作成しておきます。

以下类型的词被视为填充词：

语言	填充词示例
日语	あー, あのー, えー, おー, えっと
英语	ah, urm, hmm
中文	呃, 啊, 哎呀
韩语	어, 으, 음

备注

除一些特殊引擎外，用户无法添加填充词。
填充词可能会在提高准确性的过程中发生变化，我们不公开填充词列表。
"音声入力_氏名"引擎和"音声入力_住所"引擎默认没有设置任何填充词。用户可以将不需要的单词注册为"フィラー(文頭)"或"フィラー(文末)"类，这些词将被视为填充词。有关详细信息，请参考 Hybrid 引擎单词注册的特殊单词注册。

如果一个名为test-with-filler.wav的音频文件包含上述发言内容，可以通过执行以下curl命令来确认填充词的自动删除。有关此过程的详细信息，请参阅短语音文件的转写。对于WebSocket，请参阅语音识别请求。

curl -sS https://acp-api.amivoice.com/v1/recognize \
      -F u={API_KEY} \
      -F "d=-a-general" \
      -F a=@test-with-filler.wav | jq

响应

{
  "results": [
    {
      "tokens": [
        {
          "written": "会議",
          "confidence": 0.99,
          "starttime": 656,
          "endtime": 1184,
          "spoken": "かいぎ"
        },
        {
          "written": "が",
          "confidence": 1,
          "starttime": 1184,
          "endtime": 1312,
          "spoken": "が"
        },
        {
          "written": "ある",
          "confidence": 1,
          "starttime": 1312,
          "endtime": 1536,
          "spoken": "ある"
        },
        {
          "written": "ので",
          "confidence": 1,
          "starttime": 1536,
          "endtime": 1920,
          "spoken": "ので"
        },
        {
          "written": "それ",
          "confidence": 1,
          "starttime": 2384,
          "endtime": 2736,
          "spoken": "それ"
        },
        {
          "written": "まで",
          "confidence": 1,
          "starttime": 2736,
          "endtime": 3024,
          "spoken": "まで"
        },
        {
          "written": "に",
          "confidence": 1,
          "starttime": 3024,
          "endtime": 3296,
          "spoken": "に"
        },
        {
          "written": "資料",
          "confidence": 0.97,
          "starttime": 3920,
          "endtime": 4384,
          "spoken": "しりょう"
        },
        {
          "written": "を",
          "confidence": 1,
          "starttime": 4384,
          "endtime": 4544,
          "spoken": "を"
        },
        {
          "written": "作成",
          "confidence": 0.98,
          "starttime": 4576,
          "endtime": 5136,
          "spoken": "さくせい"
        },
        {
          "written": "して",
          "confidence": 1,
          "starttime": 5136,
          "endtime": 5392,
          "spoken": "して"
        },
        {
          "written": "おき",
          "confidence": 0.99,
          "starttime": 5392,
          "endtime": 5664,
          "spoken": "おき"
        },
        {
          "written": "ます",
          "confidence": 0.98,
          "starttime": 5664,
          "endtime": 5952,
          "spoken": "ます"
        },
        {
          "written": "。",
          "confidence": 0.21,
          "starttime": 5952,
          "endtime": 5984,
          "spoken": "_"
        }
      ],
      "confidence": 0.993,
      "starttime": 0,
      "endtime": 5984,
      "tags": [],
      "rulename": "",
      "text": "会議があるのでそれまでに資料を作成しておきます。"
    }
  ],
  "utteranceid": "20240801/08/01910b1c09cc0a303c1094c9_20240801_082432",
  "text": "会議があるのでそれまでに資料を作成しておきます。",
  "code": "",
  "message": ""
}

控制填充词的自动删除

通过在请求参数中设置keepFillerToken=1，可以防止填充词被自动删除。例如，当想要检查呼叫中心操作员的说话方式是否过多使用填充词时，可以使用此设置。

上述语音的识别结果示例：

%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。

填充词前后用半角"％"括起来。请在程序中适当使用这种表示方法。以下是识别结果响应的示例。

{
  "results": [
    {
      "tokens": [
        {
          "written": "%えっと%",
          "confidence": 0.95,
          "starttime": 0,
          "endtime": 592,
          "spoken": "えっと"
        },
        /* 省略 */
      ],
      "text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
      /* 省略 */
    }
  ],
  "text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
  /* 省略 */
}

备注

当发音为"ぱーせんと"时，"％"将成为一个单词。results[0].tokens[].written将是单个字符"％"，可以与填充词的"％"区分开。

{
  "results": [
    {
      "tokens": [
        {
          "written": "%",
          "confidence": 1,
          "starttime": 0,
          "endtime": 800,
          "spoken": "ぱーせんと"
        }
   /* 省略 */
    }
}

对于前面提到的test-with-filler.wav音频文件，设置keepFillerToken=1。通过执行以下curl命令，可以获得包含填充词的结果。有关此过程的详细信息，请参阅短语音文件的转写。对于WebSocket，请参阅语音识别请求。

使用curl命令执行时的示例

curl -sS https://acp-api.amivoice.com/v1/recognize \
      -F u={API_KEY} \
      -F "d=-a-general keepFillerToken=1" \
      -F a=@test-with-filler.wav | jq

响应

{
  "results": [
    {
      "tokens": [
        {
          "written": "%えっと%",
          "confidence": 0.95,
          "starttime": 0,
          "endtime": 592,
          "spoken": "えっと"
        },
        {
          "written": "会議",
          "confidence": 0.99,
          "starttime": 656,
          "endtime": 1184,
          "spoken": "かいぎ"
        },
        {
          "written": "が",
          "confidence": 1,
          "starttime": 1184,
          "endtime": 1312,
          "spoken": "が"
        },
        {
          "written": "ある",
          "confidence": 1,
          "starttime": 1312,
          "endtime": 1536,
          "spoken": "ある"
        },
        {
          "written": "ので",
          "confidence": 1,
          "starttime": 1536,
          "endtime": 1920,
          "spoken": "ので"
        },
        {
          "written": "%えー%",
          "confidence": 0.99,
          "starttime": 1968,
          "endtime": 2224,
          "spoken": "えー"
        },
        {
          "written": "それ",
          "confidence": 1,
          "starttime": 2224,
          "endtime": 2528,
          "spoken": "それ"
        },
        {
          "written": "まで",
          "confidence": 1,
          "starttime": 2528,
          "endtime": 2800,
          "spoken": "まで"
        },
        {
          "written": "に",
          "confidence": 1,
          "starttime": 2800,
          "endtime": 3088,
          "spoken": "に"
        },
        {
          "written": "%あのー%",
          "confidence": 1,
          "starttime": 3120,
          "endtime": 3600,
          "spoken": "あのー"
        },
        {
          "written": "資料",
          "confidence": 1,
          "starttime": 3712,
          "endtime": 4176,
          "spoken": "しりょう"
        },
        {
          "written": "を",
          "confidence": 1,
          "starttime": 4176,
          "endtime": 4336,
          "spoken": "を"
        },
        {
          "written": "作成",
          "confidence": 1,
          "starttime": 4368,
          "endtime": 4928,
          "spoken": "さくせい"
        },
        {
          "written": "して",
          "confidence": 1,
          "starttime": 4928,
          "endtime": 5184,
          "spoken": "して"
        },
        {
          "written": "おき",
          "confidence": 0.99,
          "starttime": 5184,
          "endtime": 5456,
          "spoken": "おき"
        },
        {
          "written": "ます",
          "confidence": 0.98,
          "starttime": 5456,
          "endtime": 5744,
          "spoken": "ます"
        },
        {
          "written": "。",
          "confidence": 0.32,
          "starttime": 5744,
          "endtime": 5776,
          "spoken": "_"
        }
      ],
      "confidence": 0.993,
      "starttime": 0,
      "endtime": 5776,
      "tags": [],
      "rulename": "",
      "text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。"
    }
  ],
  "utteranceid": "20240801/08/01910b1dde010a301e8894c2_20240801_082632",
  "text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
  "code": "",
  "message": ""
}

控制填充词的自动删除​

控制填充词的自动删除