单词注册的构成要素
在注册单词时,可以指定该单词的"显示"、"读音"和"类",其中"显示"和"读音"是必填项。以下对各个构成要素进行说明。
项目 | 说明 | 必填 | 例子 |
|---|---|---|---|
| 显示 | 该单词发音时,作为语音识别结果得到的字符串。 | ● | AmiVoice |
| 读音 | 表示该单词如何发音的信息。各语言的读音描述方法不同。 | ● | あみぼいす |
| 类 | 用于指定单词的类别或类型的分类。通过这种分类,语音识别系统可以区分在不同上下文中使用的同音单词。类由各引擎定义,API用户无法添加类。 | 专有名词 |
英语引擎不支持单词注册。
单词注册概述
例如,如果"パレオパラドキシア"这个单词无法被识别,想要进行单词注册。在这种情况下,可以按以下方式注册显示和读音对。显示和读音用半角空格分隔。如果还要设置类,请参考类的设置方法。
パレオパラドキシア ぱれおぱらどきしあ
显示
"显示"是指对应于发声的音频想要输出的字符串。
显示中可使用的特殊字符
显示中可使用的字符中,有一些具有特殊作用的符号。
| 字符 | 字符名称 | 说明 |
|---|---|---|
| _ | 半角下划线 | 在语音识别结果中输出为半角空格的符号 |
无法在语音识别结果中输出半角下划线(_)。
显示中不能注册的字符
显示中不能包含以下字符的字符串:
| 字符 | 字符名称 |
|---|---|
| | | 半角竖线 |
| 半角空格 | |
| : | 半角冒号 |
虽然不能在要注册的显示中使用半角空格,但可以在显示中使用半角下划线(_)进行单词注册,这样在语音识别结果中会输出为半角空格。
例如,如果想发音"あみ"而输出"Advanced Media",请注册"Advanced_Media あみ"。
Advanced_Media あみ
读音
"读音"是指该单词的读法(发音方式)。
各语言的读音描述方法
读音的描述方法因语言而异。以下说明各语言的描述方法。
日语
对于日语,使用平假名或片假名描述。
中文
对于中文,使用带数字声调的拼音描述。例如,"我们"应描述为"wo3men5"。
我们 wo3men5
韩语
对于韩语,使用 Hangul 描述。
读音中可使用的特殊字符
读音中可使用的字符中,有一些具有特殊作用的符号。以下列出各语言中可使用的特殊字符。
日语
| 字符 | 字符名 | 说明 |
|---|---|---|
| . | 半角句号 | 用于音节分隔,控制长音的符号 |
| _ | 半角下划线 | 表示无声的符号 |
-
AmiVoice Tech Blog上解释说明了这些可用于读音的特殊字符中半角句号的使用方法。详情请参考以下内容:
【面向中级用户】关于AmiVoice单词读音的自动转换 -
使用半角下划线(_)可以使单词中间即使插入短暂的无声,也更容易被识别为连续的单词。
例如,如果注册"AmiVoice青果店 あみぼいす_せいかてん",即使在"あみぼいす"和"せいかてん"之间稍微停顿一下,也更容易被识别为"AmiVoice青果店"。
AmiVoice青果店 あみぼいす_せいかてん
中文・韩语
| 字符 | 字符名 | 说明 |
|---|---|---|
| _ | 半角下划线 | 表示无声的符号 |
类
在AmiVoice API中,用于指定单词类别或类型的分类称为类。通过类,语音识别系统能够区分同音但在不同上下文中使用的单词。类是按语音识别引擎定义的,例如,对于"会話_汎用"引擎(-a-general),定义了以下类。详情请参考语音识别引擎的日语语言模型的类名称列表。
- 固有名詞
- 名前
- 名前(名)
- 駅名
- 地名
- 会社名
- 部署名
- 役職名
- 記号
- 括弧開き
- 括弧閉じ
- 元号
- "会話_汎用"引擎中的类
名前表示人名的姓氏,名前(名)表示人名的名字。 - 如果指定了不存在的类名,将被视为未指定类名。
例如,如果将某个单词指定为"名前"表示人名的姓氏类,该单词在谈论人名的上下文中更容易被识别。相反,在非人名上下文中则不易被识别,这可以减少同音但在不同上下文中错误冒出的问题。如果要注册的单词有适合的类,请尽可能设置类。
如果注册全名仍然无法正确识别人名,可以尝试以下对策:
-
将人名分为"姓"和"名",分别注册到
名前表示人名的姓氏类和名前(名)表示人名的名字类。
这样,即使在姓和名之间插入无声或填充词,也更容易被识别。但是,如果还要注册其他同音异字的人名,可能会增加误识别的可能性。(例如,如果在名前表示人名的姓氏类中注册"山田",在名前(名)表示人名的名字类中分别用"たろう"的读音注册"太郎"和"太朗",那么在希望发音"やまだたろう"识别为"山田太郎"的情况下,可能会被识别为"山田太朗") -
在读音的"姓"和"名"之间插入表示无声的符号半角下划线(_)。
这样,即使在姓和名之间插入短暂的无声,也更容易被识别。但是,如果在姓和名之间插入填充词,则无法正确识别。
类的设置方法
类在"显示"和"读音"之后指定。例如,如果无法识别"アソーク駅"这个站名。要将类名指定为駅名,请按以下方式在半角空格后记述:
アソーク駅 あそーくえき 駅名
请也参考AmiVoice Tech Blog的AmiVoice API单词注册功能中可选择的"类"解说(通用引擎)。
特殊单词注册
有一些特殊类型的单词注册仅受某些引擎支持。
填充词
"音声入力_氏名"引擎是仅用于识别姓名的引擎,"音声入力_住所"引擎是仅用于识别地址的引擎。这些引擎没有预定义的填充词,但如果用户说的不仅仅是姓名和地址,他们可以根据需要添加自己的填充词。
可用的填充词类有:
类名 | 说明 |
|---|---|
| フィラー(文頭) | 当您想在全名或姓氏前加上"えー""わたしは"或"ぼくは"等,或者想在地址前加上"えーと"或"住所は"等时,使用此类 |
| フィラー(文末) | 当您想在全名或名字后添加"で す"或"ともうします"等,或者想在地址后添加"です"等时,使用此类 |
注册填充词时,请用半角百分号 (%) 字符将其括起来。请按照平常的方式写出单词的读音,不要添加半角百分比。例如,如果您想将单词"あのー"注册为"フィラー(文頭)"类,您可以按如下方式编写。
%あのー% あのー フィラー(文頭)
在"フィラー(文頭)"和"フィラー(文末)"中,除了"えー""あのー"等一般填充词外,还可以注册仅在句首或句末使用且不想作为名字或地址而想作为填充词处理的单词(短语)。
例如,在"音声入力_氏名"引擎中,"私は"和"です"这两个词分别被注册为句子开头和结尾的填充词。
%私は% わたしは フィラー(文頭)
%です% です フィラー(文末)
在这种情况下,假设你说「わたしは、やまだあみです」。
わたしは、やまだあみです
该语音的识别结果如下,其中注册为填充词的单词将被自动删除。
ヤマダアミ