跳至主要内容

单词注册的构成要素

要注册单词,需要指定该单词的显示、读音和类别。以下对各个构成要素进行说明。

项目
说明
必须
示例
显示该单词被发音时,作为语音识别结果获得的字符串。AmiVoice
读音表示该单词如何发音的信息。每种语言记述读音的方法不同。请参考支持的语言あみぼいす
类别用于指定单词的类别或类型的分类。通过这种分类,语音识别系统可以区分同音但在不同上下文中使用的单词。类别由每个引擎定义,API用户无法添加类别。固有名詞

显示・读音

要添加单词,需要单词的"显示""读音""显示"是想要对发音的语音输出的字符串,"读音"是该单词的发音方式。对于日语,用平假名或片假名记述。对于中文,用拼音记述,对于韩语,用谚文记述。

例如,如果无法识别"パレオパラドキシア"这个单词。在这种情况下,按以下方式注册显示和读音对。显示和读音用半角空格分隔。

パレオパラドキシア ぱれおぱらどきしあ
信息

为同一显示设置多个读音

可以为一个显示设置多个读音。

例如,可以为"あみ"和"アドバンストメディア"这两种读音设置"AMI"这个显示。

AMI あみ
AMI あどばんすとめでぃあ

为多个显示设置相同的读音

可以为多个不同的显示设置相同的读音。这不会导致错误,但无法确定会选择哪个显示。不建议刻意进行此类设置。

例如,可以为"あみ"这个读音设置"AMI"和"AmiVoice"这两个显示。

AMI あみ
AmiVoice あみ

读音中可使用的特殊字符

有用于描述读音的符号。以下列出各语言可使用的特殊字符。

日语

字符
字符名
说明
.半角句号用于音节分隔,控制长音的符号
_半角下划线表示无声的符号
提示

AmiVoice Tech Blog上解释说明了这些可用于读音的特殊字符中半角句号的使用方法。详情请参考以下内容:

【面向中级用户】关于AmiVoice单词读音的自动转换

中文・韩语

字符
字符名
说明
_半角下划线表示无声的符号

无法注册的字符

显示中不能包含以下字符的字符串:

字符
字符名
|半角竖线
半角空格
:半角冒号

类别

在AmiVoice API中,用于指定单词类别或类型的分类称为类别。通过类别,语音识别系统能够区分同音但在不同上下文中使用的单词。类别是按语音识别引擎定义的,例如,对于"会話_汎用"引擎(-a-general),定义了以下类别。详情请参考语音识别引擎的日语语言模型的类别名称列表

  • 固有名詞
  • 名前
  • 名前(名)
  • 駅名
  • 地名
  • 会社名
  • 部署名
  • 役職名
  • 記号
  • 括弧開き
  • 括弧閉じ
  • 元号
备注
  • "会話_汎用"引擎中的类别名前表示人名的姓氏,名前(名)表示人名的名字。
  • 如果指定了不存在的类别名,将被视为未指定类别名。

例如,如果将某个单词指定为"名前"类别,该单词在谈论人名的上下文中更容易被识别。相反,在非人名上下文中则不易被识别,这可以减少同音但在不同上下文中错误冒出的问题。如果要注册的单词有适合的类别,请尽可能设置类别。

类别的设置方法

类别在"显示""读音"之后指定。例如,如果无法识别"アソーク駅"这个站名。要将类别名指定为駅名,请按以下方式在半角空格后记述:

アソーク駅 あそーくえき 駅名