Hybrid 引擎的词语注册

在 Hybrid 引擎中注册词语时，可以指定该单词的"显示"，"读音"和"类"，其中"显示"和"读音"是必填项。以下对各个构成要素进行说明。

项目	说明	必填	例子
显示	该单词发音时，作为语音识别结果得到的字符串。	●	AmiVoice
读音	表示该单词如何发音的信息。各语言的读音描述方法不同。	●	あみぼいす
类	用于指定单词的类别或类型的分类。通过这种分类，语音识别系统可以区分在不同上下文中使用的同音单词。类由各引擎定义，API用户无法添加类。		专有名词

备注

英语引擎不支持单词注册。

单词注册概述

例如，如果"パレオパラドキシア"这个单词无法被识别，想要进行单词注册。在这种情况下，可以按以下方式注册显示和读音对。显示和读音用半角空格分隔。如果还要设置类，请参考类的设置方法。

パレオパラドキシア ぱれおぱらどきしあ

信息

为同一显示设置多个读音

可以为一个显示设置多个读音。

例如，可以为"あみ"和"アドバンストメディア"这两种读音设置"AMI"这个显示。

AMI あみ
AMI あどばんすとめでぃあ

为多个显示设置相同的读音

可以为多个不同的显示设置相同的读音。这不会导致错误，但无法确定会选择哪个显示。不建议刻意进行此类设置。

例如，可以为"あみ"这个读音设置"AMI"和"AmiVoice"这两个显示。

AMI あみ
AmiVoice あみ

显示

"显示"是指对应于发声的音频想要输出的字符串。

显示中可使用的特殊字符

显示中可使用的字符中，有一些具有特殊作用的符号。

字符	字符名称	说明
_	半角下划线	在语音识别结果中输出为半角空格的符号

备注

无法在语音识别结果中输出半角下划线（_）。

显示中不能注册的字符

显示中不能包含以下字符的字符串：

字符	字符名称
\|	半角竖线
	半角空格
:	半角冒号

提示

虽然不能在要注册的显示中使用半角空格，但可以在显示中使用半角下划线（_）进行单词注册，这样在语音识别结果中会输出为半角空格。

例如，如果想发音"あみ"而输出"Advanced Media"，请注册"Advanced_Media あみ"。

Advanced_Media あみ

读音

"读音"是指该单词的读法（发音方式）。

各语言的读音描述方法

读音的描述方法因语言而异。以下说明各语言的描述方法。

日语

对于日语，使用平假名或片假名描述。

中文

对于中文，使用带数字声调的拼音描述。例如，"我们"应描述为"wo3men5"。

我们 wo3men5

韩语

对于韩语，使用 Hangul 描述。

读音中可使用的特殊字符

读音中可使用的字符中，有一些具有特殊作用的符号。以下列出各语言中可使用的特殊字符。

日语

字符	字符名	说明
.	半角句号	用于音节分隔，控制长音的符号
_	半角下划线	表示无声的符号

提示

AmiVoice Tech Blog上解释说明了这些可用于读音的特殊字符中半角句号的使用方法。详情请参考以下内容：
[For intermediate users] About automatic conversion of word spoken in AmiVoice
使用半角下划线（_）可以使单词中间即使插入短暂的无声，也更容易被识别为连续的单词。
例如，如果注册"AmiVoice青果店あみぼいす_せいかてん"，即使在"あみぼいす"和"せいかてん"之间稍微停顿一下，也更容易被识别为"AmiVoice青果店"。

AmiVoice青果店 あみぼいす_せいかてん

中文・韩语

字符	字符名	说明
_	半角下划线	表示无声的符号

类

在AmiVoice API中，用于指定单词类别或类型的分类称为类。通过类，语音识别系统能够区分同音但在不同上下文中使用的单词。类是按语音识别引擎定义的，例如，对于"会話_汎用"引擎(-a-general)，定义了以下类。详情请参考语音识别引擎的日语语言模型的类名称列表。

固有名詞
名前
名前(名)
駅名
地名
会社名
部署名
役職名
記号
括弧開き
括弧閉じ
元号

备注

"会話_汎用"引擎中的类名前表示人名的姓氏，名前(名)表示人名的名字。
如果指定了不存在的类名，将被视为未指定类名。

例如，如果将某个单词指定为"名前"表示人名的姓氏类，该单词在谈论人名的上下文中更容易被识别。相反，在非人名上下文中则不易被识别，这可以减少同音但在不同上下文中错误冒出的问题。如果要注册的单词有适合的类，请尽可能设置类。

提示

如果注册全名仍然无法正确识别人名，可以尝试以下对策：

将人名分为"姓"和"名"，分别注册到名前表示人名的姓氏类和名前(名)表示人名的名字类。
这样，即使在姓和名之间插入无声或填充词，也更容易被识别。但是，如果还要注册其他同音异字的人名，可能会增加误识别的可能性。（例如，如果在名前表示人名的姓氏类中注册"山田"，在名前(名)表示人名的名字类中分别用"たろう"的读音注册"太郎"和"太朗"，那么在希望发音"やまだたろう"识别为"山田太郎"的情况下，可能会被识别为"山田太朗"）
在读音的"姓"和"名"之间插入表示无声的符号半角下划线(_)。
这样，即使在姓和名之间插入短暂的无声，也更容易被识别。但是，如果在姓和名之间插入填充词，则无法正确识别。

类的设置方法

类在"显示"和"读音"之后指定。例如，如果无法识别"アソーク駅"这个站名。要将类名指定为駅名，请按以下方式在半角空格后记述：

アソーク駅 あそーくえき 駅名

提示

请也参考AmiVoice Tech Blog的Explanation of "Classes" selectable with AmiVoice API's word registration function (General-purpose engine)。

特殊单词注册

有一些特殊类型的单词注册仅受某些引擎支持。

填充词

"音声入力_氏名"引擎仅用于识别姓名，"音声入力_住所"引擎仅用于识别地址。这些引擎预先没有设置填充词，但如果还要发音姓名或地址以外的词语，用户可以根据需要自行注册填充词。

可用的填充词类有：

类名	说明
フィラー(文頭)	用于在全名或姓氏前添加"えー"（嗯）、"わたしは"（我是）、"ぼくは"（我是）等，或在地址前添加"えーと"（嗯）、"住所は"（地址是）等的类别
フィラー(文末)	用于在全名或名字后添加"です"（是）、"ともうします"（叫做）等，或在地址后添加"です"（是）等的类别

注册填充词时，请用半角百分号 (%) 字符将其括起来。请按照平常的方式写出单词的读音，不要添加半角百分比。例如，如果您想将单词"あのー"注册为"フィラー(文頭)"类，您可以按如下方式编写。

%あのー% あのー フィラー(文頭)

提示

在"フィラー(文頭)"或"フィラー(文末)"中，除了"えー"（嗯）、"あのー"（那个）等一般的填充词外，还可以注册只在句首或句尾使用的、不是姓名或地址但想作为填充词处理的词语（简短的短语）。

例如，在"音声入力_氏名"引擎中将"私は"（我是）和"です"（是）分别注册为句首和句尾的填充词。

%私は% わたしは フィラー(文頭)
%です% です フィラー(文末)

在这种情况下，假设你说"わたしは、やまだあみです"。

わたしは、やまだあみです

该语音的识别结果如下，其中注册为填充词的单词将被自动删除。

ヤマダアミ

单词注册概述​

为同一显示设置多个读音​

为多个显示设置相同的读音​

显示​

显示中可使用的特殊字符​

显示中不能注册的字符​

读音​

各语言的读音描述方法​

日语​

中文​

韩语​

读音中可使用的特殊字符​

日语​

中文・韩语​

类​

类的设置方法​

特殊单词注册​

填充词​