跳至主要内容

End to End 引擎的单词强调

在 End to End 引擎的单词强调中,可以指定该单词的"显示"、"替代显示"和"单词强调度",其中"显示"是必填项。以下对各组成部分进行说明。

项目
解释
必填
示例
显示希望在语音识别结果中容易获得的字符串。AmiVoice
替代显示希望替换为显示的字符串。也可以作为显示的读音信息使用。替代显示也会更容易出现在识别结果的候选中,然后被替换为显示。アミボイス
单词强调度指定强调单词的强度。可以指定 0 到 1 之间的值,如果不指定,默认为 0.5。0.7

单词强调概述

例如,如果"AmiVoice"这个单词无法被识别,想要进行单词强调。在这种情况下,可以按以下方式注册显示、替代显示和单词强调度。显示和替代显示、替代显示和单词强调度之间用半角空格分隔。

替代显示可以省略。这时,显示和单词强调度之间用两个半角空格分隔。单词强调度也可以省略,在这种情况下,默认应用 0.5。

AmiVoice アミボイス 0.6

这时,不仅"AmiVoice"更容易出现在识别结果中(强调度为0.6),而且"アミボイス"也更容易成为识别结果的候选,然后识别结果中的"アミボイス"会被替换为"AmiVoice"。

信息

为同一显示设置多个替代显示

可以为一个显示设置多个替代显示。但是,不能对同一个显示应用不同的单词强调度。如果单词强调请求中包含多个相同的显示,将对所有这些显示应用第一个出现的单词强调度(如果第一个省略了单词强调度,则应用默认值 0.5)。

例如,可以为"アミ"和"アドバンストメディア"这两个读音设置"AMI"作为显示。

AMI  0.7
AMI アミ
AMI アドバンストメディア

在这种情况下,"AMI アミ"和"AMI アドバンストメディア"也会应用 0.7 的单词强调度。

备注

请不要为多个显示注册相同的替代显示。

显示

"显示"是指希望更容易输出的字符串。

显示中可以使用的特殊字符

显示中可以使用的字符包括一些具有特殊作用的符号。

字符
字符名
说明
_半角下划线表示单词分隔的符号
备注

语音识别结果无法输出半角下划线(_)。

提示

当末尾字符为半角英数字的单词和开头字符为半角英数字的单词连续出现时,两个单词之间会插入一个半角空格。

例如,如果想在发音"あみ"时输出"Advanced Media",请使用"Advanced_Media アミ"进行单词强调。(单词强调度可选)

Advanced_Media アミ

但是,在以下情况下不会插入半角空格:

アドバンスト_メディア アミ
トリプル_W トリプルダブル
Triple_ダブル トリプルダブル

此外,如果不在显示中使用半角下划线,如下所示,将被解释为一个连续的单词,因此不会插入半角空格:

AdvancedMedia アミ

显示中不能注册的字符

显示中不能包含以下字符的字符串:

字符
字符名
|半角竖线
半角空格
:半角冒号

替代显示

"替代显示"是希望替换为"显示"的字符串。替代显示和显示一样,也会更容易出现在识别结果的候选中,然后被替换为显示。虽然可以用来提供"显示"的读音信息,但其性质与 Hybrid 引擎中单词注册的"读音"不同。

例如,假设您想让"雲母"这个单词更容易被识别。由于"雲母"通常读作"うんも",即使不使用替代显示来提供读音信息,"うんも"这个发音也可能成为识别结果的候选。因此,如果按以下方式进行单词强调,当发音"うんも"时,"雲母"将更容易被识别。单词强调度的数值只是一个例子。

雲母  0.8

现在,如果您还想让"きらら"这个发音也被识别为"雲母",可以使用替代显示,如下所示进行单词强调:

雲母 キララ 0.8

这样,无论发音"うんも"还是"きらら",都会更容易被识别为"雲母"。

提示

替代显示的作用是,当 End to End 引擎将替代显示作为识别结果输出时,将其替换为"显示"中的单词。因此,如果引擎不会将替代显示列为识别结果的候选,单词强调就不会起作用。在日语 End to End 引擎中,对于专有名词,用片假名书写的字符串更容易被列为识别结果的候选,因此,将片假名显示注册为替代显示可以期望单词强调能够适当地发挥作用。

例如,如果您想让"ぱれおぱらどきしあ"这个发音被识别为"絶滅哺乳類",这时,将"絶滅哺乳類"指定为显示,将"パレオパラドキシア"(而不是"ぱれおぱらどきしあ")作为片假名显示注册为替代显示,这样更容易正常工作。

备注

不能保证识别结果中所有与替代显示匹配的部分都会被替换为显示,并且替代显示会从识别结果中完全消失。如果您希望某个字符串一定要被替换为另一个字符串,建议在客户端系统上对识别结果进行后处理。

替代显示中不能注册的字符

替代显示中不能包含以下字符的字符串:

字符
字符名
|半角竖线
半角空格

替代显示中可以使用的特殊字符

替代显示中可以使用的字符包括一些具有特殊作用的符号。

字符
字符名
说明
_半角下划线表示单词分隔的符号
提示

如果在显示或替代显示中使用了表示单词分隔的"_"(半角下划线),那么识别结果的候选也必须同样有单词分隔,才会被视为与显示或替代显示匹配。例如,如果按以下方式指定单词强调并发音"ぱれおぱらどきしあ",当识别结果的候选是一个连续的单词"パレオパラドキシア"时,它会被判断为与替代显示中的两个单词"パレオパラ"和"ドキシア"并列不同,因此这个单词强调不会起作用。

絶滅哺乳類 パレオパラ_ドキシア 0.5

相反,如果在显示或替代显示中不使用半角下划线而是作为一个连续的单词,即使识别结果的候选被分成多个单词,单词强调也会起作用。

单词强调度

"单词强调度"指定强调单词的强度。可以指定 0 到 1 之间的值,0 表示不强调,单词既不会变得更容易出现,也不会变得更难出现。1 表示以牺牲整体识别率为代价进行强烈的单词强调。如果不指定,默认为 0.5。