填充词自动删除
像"あのー"和"えーっと"这样的填充词(不必要的词)会自动从语音识别结果中删除。
例如,假设以下面的方式说话:
えーっと、会議があるので、えー、それまでに、あのー、資料を作成しておきます。
这段语音的识别结果如下:
会議があるのでそれまでに資料を作成しておきます。
以下类型的词被视为填充词:
语言 | 填充词示例 |
---|---|
日语 | あー, あのー, えー, おー, えっと |
英语 | ah, urm, hmm |
中文 | 呃, 啊, 哎呀 |
韩语 | 어, 으, 음 |
备注
- 用户无法添加填充词。
- 填充词可能会在提高准确性的过程中发生变化,我们不公开填充词列表。
如果一个名为test-with-filler.wav的音频文件包含上述发言内容,可以通过执行以下curl命令来确认填充词的自动删除 。有关此过程的详细信息,请参阅短语音文件的转写。对于WebSocket,请参阅语音识别请求。
curl -sS https://acp-api.amivoice.com/v1/recognize \
-F u={APPKEY} \
-F "d=-a-general" \
-F a=@test-with-filler.wav | jq
响应
{
"results": [
{
"tokens": [
{
"written": "会議",
"confidence": 0.99,
"starttime": 656,
"endtime": 1184,
"spoken": "かいぎ"
},
{
"written": "が",
"confidence": 1,
"starttime": 1184,
"endtime": 1312,
"spoken": "が"
},
{
"written": "ある",
"confidence": 1,
"starttime": 1312,
"endtime": 1536,
"spoken": "ある"
},
{
"written": "ので",
"confidence": 1,
"starttime": 1536,
"endtime": 1920,
"spoken": "ので"
},
{
"written": "それ",
"confidence": 1,
"starttime": 2384,
"endtime": 2736,
"spoken": "それ"
},
{
"written": "まで",
"confidence": 1,
"starttime": 2736,
"endtime": 3024,
"spoken": "まで"
},
{
"written": "に",
"confidence": 1,
"starttime": 3024,
"endtime": 3296,
"spoken": "に"
},
{
"written": "資料",
"confidence": 0.97,
"starttime": 3920,
"endtime": 4384,
"spoken": "しりょう"
},
{
"written": "を",
"confidence": 1,
"starttime": 4384,
"endtime": 4544,
"spoken": "を"
},
{
"written": "作成",
"confidence": 0.98,
"starttime": 4576,
"endtime": 5136,
"spoken": "さくせい"
},
{
"written": "して",
"confidence": 1,
"starttime": 5136,
"endtime": 5392,
"spoken": "して"
},
{
"written": "おき",
"confidence": 0.99,
"starttime": 5392,
"endtime": 5664,
"spoken": "おき"
},
{
"written": "ます",
"confidence": 0.98,
"starttime": 5664,
"endtime": 5952,
"spoken": "ます"
},
{
"written": "。",
"confidence": 0.21,
"starttime": 5952,
"endtime": 5984,
"spoken": "_"
}
],
"confidence": 0.993,
"starttime": 0,
"endtime": 5984,
"tags": [],
"rulename": "",
"text": "会議があるのでそれまでに資料を作成しておきます。"
}
],
"utteranceid": "20240801/08/01910b1c09cc0a303c1094c9_20240801_082432",
"text": "会議があるのでそれまでに資料を作成しておきます。",
"code": "",
"message": ""
}
控制填充词的自动删除
通过在请求参数中设置keepFillerToken=1
,可以防止填充词被自动删除。例如,当想要检查呼叫中心操作员的说话方式是否过多使用填充词时,可以使用此设置。
上述语音的识别结果示例:
%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。
填充词前后用半角"%"括起来。请在程序中适当使用这种表示方法。以下是识别结果响应的示例。
{
"results": [
{
"tokens": [
{
"written": "%えっと%",
"confidence": 0.95,
"starttime": 0,
"endtime": 592,
"spoken": "えっと"
},
/* 省略 */
],
"text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
/* 省略 */
}
],
"text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
/* 省略 */
}
备注
当发音为"ぱーせんと」"时,"%"将成为一个单词。results[0].tokens[].written
将是单个字符"%",可以与填充词的"%"区分开。
{
"results": [
{
"tokens": [
{
"written": "%",
"confidence": 1,
"starttime": 0,
"endtime": 800,
"spoken": "ぱーせんと"
}
/* 省略 */
}
}
对于前面提到的test-with-filler.wav音频文件,设置keepFillerToken=1
。通过执行以下curl命令,可以获得包含填充词的结果。有关此过程的详细信息,请参阅短语音文件的转写。对于WebSocket,请参阅语音识别请求。
使用curl命令执行时的示例
curl -sS https://acp-api.amivoice.com/v1/recognize \
-F u={APPKEY} \
-F "d=-a-general keepFillerToken=1" \
-F a=@test-with-filler.wav | jq
响应
{
"results": [
{
"tokens": [
{
"written": "%えっと%",
"confidence": 0.95,
"starttime": 0,
"endtime": 592,
"spoken": "えっと"
},
{
"written": "会議",
"confidence": 0.99,
"starttime": 656,
"endtime": 1184,
"spoken": "かいぎ"
},
{
"written": "が",
"confidence": 1,
"starttime": 1184,
"endtime": 1312,
"spoken": "が"
},
{
"written": "ある",
"confidence": 1,
"starttime": 1312,
"endtime": 1536,
"spoken": "ある"
},
{
"written": "ので",
"confidence": 1,
"starttime": 1536,
"endtime": 1920,
"spoken": "ので"
},
{
"written": "%えー%",
"confidence": 0.99,
"starttime": 1968,
"endtime": 2224,
"spoken": "えー"
},
{
"written": "それ",
"confidence": 1,
"starttime": 2224,
"endtime": 2528,
"spoken": "それ"
},
{
"written": "まで",
"confidence": 1,
"starttime": 2528,
"endtime": 2800,
"spoken": "まで"
},
{
"written": "に",
"confidence": 1,
"starttime": 2800,
"endtime": 3088,
"spoken": "に"
},
{
"written": "%あのー%",
"confidence": 1,
"starttime": 3120,
"endtime": 3600,
"spoken": "あのー"
},
{
"written": "資料",
"confidence": 1,
"starttime": 3712,
"endtime": 4176,
"spoken": "しりょう"
},
{
"written": "を",
"confidence": 1,
"starttime": 4176,
"endtime": 4336,
"spoken": "を"
},
{
"written": "作成",
"confidence": 1,
"starttime": 4368,
"endtime": 4928,
"spoken": "さくせい"
},
{
"written": "して",
"confidence": 1,
"starttime": 4928,
"endtime": 5184,
"spoken": "して"
},
{
"written": "おき",
"confidence": 0.99,
"starttime": 5184,
"endtime": 5456,
"spoken": "おき"
},
{
"written": "ます",
"confidence": 0.98,
"starttime": 5456,
"endtime": 5744,
"spoken": "ます"
},
{
"written": "。",
"confidence": 0.32,
"starttime": 5744,
"endtime": 5776,
"spoken": "_"
}
],
"confidence": 0.993,
"starttime": 0,
"endtime": 5776,
"tags": [],
"rulename": "",
"text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。"
}
],
"utteranceid": "20240801/08/01910b1dde010a301e8894c2_20240801_082632",
"text": "%えっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。",
"code": "",
"message": ""
}