跳至主要内容

用户词典提示

单词注册数量

每个 profile 中,用户词典注册的单词数量建议以1,000个为准。通过 MyPage 最多只能注册1,000个。

对于 Hybrid 引擎,每个引擎都有固定的词汇表,不包含在该词汇表中的单词绝对不会被识别。对于 End to End 引擎,非常用词或造词也较难被识别。例如,在有大量产品名称等专有名词的情况下,即使超过1,000个,注册单词可能也是更好的选择。但是,请注意,新添加的单词可能会被错误识别为发音相似的其他单词。注册大量单词可能会增加这种错误,反而降低识别精度。

此外,随着注册单词数量的增加,在语音识别时加载配置文件可能需要更长时间,或者语音识别的时间可能会增加。特别是配置文件的加载时间会随注册单词数量呈指数级增长。在请求时通过请求参数profileWords设置单词时,也需要同样注意。

指南

作为一般注意事项,请注意以下几点:

  • 如果有对应的类别,请指定类别注册单词。 请注意,类别只能在 Hybrid 引擎的"单词注册"中使用,不能在 End to End 引擎的"单词强调"中使用。
  • 音节较少的单词容易被错误识别,因此不要添加或必须指定类别。
  • 不要注册读音过长的单词。 如果想注册读音较长的专有名词等单词,请考虑将单词分割后注册。例如,如果想注册车站名"南阿蘇水の生まれる里白水高原駅",可以考虑将不需要单词注册就可能识别的一般词汇部分去掉,只将"南阿蘇"和"白水高原"注册为地名类别。
  • 不要在同一类别中注册读音相同的单词。 在不同类别中注册读音相同的单词时,虽然可以期待根据上下文进行区分识别,但请注意不能保证完全区分识别。
  • 不要为了将识别结果改写为期望的表述而使用用户词典。 例如,希望识别为"子ども",但识别结果输出为"子供"的情况。在这种情况下,不推荐为了得到"子ども"的识别结果而注册单词。注册的单词并不能保证一定被识别,反而可能导致在未发声的情况下被错误识别为注册的单词。如果想将识别结果改写为期望的表述,请在客户端程序中进行后处理。
  • 不要出于以防万一的理由添加不太可能被说出的单词。 如果有服务或行业的单词列表,不要一次性全部注册,而应考虑上述注意事项,选择性地注册单词。