跳至主要内容

MyPage 用户词典注册

可以通过 MyPage 向用户词典配置文件注册单词。这种方法有一些限制:

  • 最多只能注册1,000个词语
  • 对于 Hybrid 引擎,无法在日语以外的引擎中注册单词
信息

通过 MyPage 注册用户词典单词时,单词注册目标 profile 的profileId会自动设置为 Service ID。例如,如果 Service ID 是"user01",则 Profile ID 也会是"user01"。如果您想注册到具有不同于 Service ID 的配 Profile ID 的 Profile 中,请使用用户词典注册API

您可以在"调整识别率"页面的"单词注册"部分进行 MyPage 用户词典注册。您可以通过此链接直接访问"调整识别率"页面。访问 MyPage 需要登录。

"调整识别率"页面的"用户词典注册"部分如下所示:

在 MyPage,您可以通过 "Register New Words from File" 和 "Register New Words by Direct Input" 两种方式进行单词保存。以下将解释各自的步骤。

用户词典单词的注册步骤

Register New Words from File

可以从文本文件一次性注册多个词语。

首先,准备一个包含要注册的词语列表的文件。

文件格式
  • 支持UTF-8、Shift_JIS和EUC-JP字符编码。
  • 文件中每行描述一个单词。每行应按顺序用制表符分隔显示、读音和类别(对于 End to End 引擎,是显示、替代显示和单词强调度)。

对于 Hybrid 引擎

写法[Tab]读音[Tab]类别
  • 读音可以用片假名或平假名描述。
  • 类别是可选的。但是,只有名称引擎和地址引擎必须指定类别。
  • 如果省略类别,第二个制表符可有可无。

对于End to End引擎

显示[Tab]替代显示[Tab]单词强调度
  • 替代显示和单词强调度可以省略。
  • 如果只省略替代显示,请在输入第一个和第二个制表符后再描述单词强调度。
  • 如果同时省略替代显示和单词强调度,可以不使用制表符。
  • 如果省略单词强调度,将应用默认值0.5。
  • 对于相同的显示,将统一应用单词强调度。如果为相同的显示指定了多个单词强调度,将统一应用该显示中列出的最上面一行的值。

这里我们准备一个如下所示的示例文件(下载):

dictionary.tsv
www     とりぷるだぶる
www とりぷるだぶりゅー
wwww ふぉーだぶる
  1. 登录AmiVoice API,点击 MyPage 的[Recognition Rate Adjustment]。
  2. 在[User Dictionary Registration]部分进行单词注册或单词强调的单词注册。首先从下拉菜单中选择或直接输入要注册单词的引擎名称。这里我们选择[-a-general]。选择引擎后,点击[Confirm]。
  3. 在[New Word Registration]中选择[Register New Words from File]选项卡,然后点击[Choose File]按钮。
  4. 选择准备好的文件dictionary.tsv
  5. 点击[Add]或[Overwrite]按钮。
备注
  • 点击[Add]时,不会影响已注册的单词,文件中描述的单词将被添加。
  • 点击[Overwrite]时,所有已注册的单词将被删除,并替换为文件中描述的单词。
  1. 文本文件中描述的单词将显示在[Registered Word List]中。
  2. 接下来,按照用户词典测试的步骤进行语音识别。识别结果应该包含"WWW"这个显示。

Register New Words by Direct Input

可以在 MyPage 上直接输入单词的显示、读音和类别(对于End to End引擎,是显示、替代显示和单词强调度),逐个注册单词。例如,如果要将"とりぷるだぶる"这个发音识别为"WWW",可以按以下方式注册:

  1. 登录AmiVoice API,点击 MyPage 的[Recognition Rate Adjustment]。
  2. 在[User Dictionary Registration]部分进行单词注册或单词强调的单词注册。首先从下拉菜单中选择或直接输入要注册单词的引擎名称。这里我们选择[-a-general]。选择引擎后,点击[Confirm]。
  3. 在[New Word Registration]中选择[Register New Words from File]选项卡,在[Notation]中输入"WWW",在[Pronunciation]中输入"とりぷるだぶる"。
    • 如果没有适合要注册单词的类别,请保持[Class]未选择。这里我们不选择任何类别。
    • 只有人名引擎和地址引擎必须指定类别。
  4. 点击[Add]按钮。
  5. 输入的单词将显示在[Registered Word List]中。
  6. 接下来,按照用户词典测试的步骤进行语音识别。识别结果应该包含"WWW"这个显示。

图. 注册后的单词列表

备注

对于End to End引擎,

  • 输入项为[显示]、[替代显示]和[单词强调度]。其中只有[显示]是必填项。
  • 对于相同的显示,可以注册多个替代显示。
  • 对于相同的显示,单词强调度将统一为一个值。在直接输入新建注册时,将统一应用输入框中最上面显示的相同显示的值。在编辑已注册单词时,将统一应用列表中最上面显示的值,因此如果要更改,请编辑相同显示中最上面的那个。
  • 不能注册多个相同的替代显示。

导出

可以按引擎导出已注册的词语并将其写入文件。

  1. 登录AmiVoice API,点击 MyPage 的[Recognition Rate Adjustment]。
  2. 在[User Dictionary Registration]部分选择要导出单词的引擎名称。选择引擎后,点击[Confirm]。
  3. 点击页面下方[Registered Word List]部分的[Export File]。
  4. 可以下载名为words.tsv(对于End to End引擎,是words_e2e.tsv)的文件。