単語登録の構成要素
単語登録に際しては、その単語の「表記」、「読み」、「クラス」を指定することができ、このうち「表記」と「読み」は必須項目です。以下にそれぞれの構成要素について説明します。
項目 | 説明 | 必須 | 例 |
|---|---|---|---|
| 表記 | その単語が発話されたときに、音声認識の結果として得られる文字列です。 | ● | AmiVoice |
| 読み | その単語がどのように発音されるかを表す情報です。各言語ごとに読みを記述する方法が異なります。 | ● | あみぼいす |
| クラス | 単語のカテゴリーやタイプを指定するための分類です。この分類により、音声認識システムは同じ発音でも異なる文脈で使用される単語を区別することができます。クラスはエンジンごとに定義されており、API利用者がクラスを追加することはできません。 | 固有名詞 |
注記
英語エンジンは、単語登録に対応していません。
単語登録の概要
例えば「パレオパラドキシア」という単語が認識されないので単語登録をしたいとします。この場合、以下のように表記と読みのペアを登録します。表記と読みは半角スペースで区切ります。クラスも設定する場合は、クラスの設定方法を参照してください。
パレオパラドキシア ぱれおぱらどきしあ
備考
表記
「表記」は発話された音声に対して出力させたい文字列のことです。
表記に使える特別な文字
表記に使える文字には、特別な働きをする記号があります。
| 文字 | 文字名 | 説明 |
|---|---|---|
| _ | 半角下線 | 音声認識結果で半角スペースとして出力される記号 |
注記
音声認識結果として半角下線(_)を出力することはできません。
表記に登録できない文字
表記には以下の文字を含む文字列は登録できません。
| 文字 | 文字名 |
|---|---|
| | | 半角パイプ |
| 半角スペース | |
| : | 半角コロン |
ヒント
登録する表記に半角スペースを使用することはできませんが、表記に半角下線(_)を使用して単語登録すると、音声認識結果では半角スペースとして出力されます。
例えば、「あみ」と発話して「Advanced Media」を出力させたい場合、「Advanced_Media あみ」と単語登録してください。
Advanced_Media あみ
読み
「読み」はその単語の読み方(発話のしかた)のことです。
言語ごとの読みの記述の方法
読みは言語ごとに記述方法が異なります。以下に各言語の記述方法を説明します。
日本語
日本語の場合、ひらがな、または、カタカナで記述します。
中国語
中国語の場合、声調を数字で表したピンインで記述します。例えば、「我们」は「wo3men5」と記述してください。
我们 wo3men5
韓国語
韓国語の場合、ハングルで記述します。