End to End エンジンの単語強調
End to End エンジンにおける単語強調に際しては、その単語の「表記」、「代替表記」、「単語強調度」を指定することができ、このうち「表記」は必須項目です。以下にそれぞれの構成要素について説明します。
項目 | 説明 | 必須 | 例 |
|---|---|---|---|
| 表記 | 音声認識の結果として得やすくしたい文字列です。 | ● | AmiVoice |
| 代替表記 | 表記に置き換えたい文字列です。表記の読みの情報のように扱うこともできます。代替表記も認識結果の候補として出やすくされたうえで、表記に置き換えられます。 | アミボイス | |
| 単語強調度 | 単語を強調する強さを指定します。0 ~ 1 の値が指定可能で、何も指定しない場合はデフォルトで 0.5 になります。 | 0.7 |
単語強調の概要
例えば「AmiVoice」という単語が認識されないので単語強調をしたいとします。この場合、以下のように表記や代替表記、単語強調度を登録します。表記と代替表記、代替表記と単語強調度は半角スペースで区切ります。
代替表記は省略することも可能です。この時、表記と単語強調度の間に半角スペースを2つ並べます。単語強調度も省略することが可能で、この場合はデフォルトで 0.5 が適用されます。
AmiVoice アミボイス 0.6
この時、「AmiVoice」が認識結果として出現しやすく強調される(強調度は0.6)だけでな く、「アミボイス」も認識結果の候補として出現しやすくなったうえで、認識結果の「アミボイス」は「AmiVoice」に置き換えられる、という挙動となります。
同一表記に複数の代替表記の設定
ひとつの表記に対して、複数の代替表記を設定できます。ただし、同一の表記に対して異なる単語強調度を適用することはできません。単語強調のリクエストに同一の表記のものが複数含まれる場合、一番最初のものに対して適用される単語強調度(一番最初のものが単語強調度の指定を省略していた場合、デフォルトの 0.5)が、その表記のもの全てに対して適用されます。
例えば「アミ」や「アドバンストメディア」という読みに対して「AMI」という表記を設定できます。
AMI 0.7
AMI アミ
AMI アドバンストメディア
この場合、「AMI アミ」や「AMI アドバンストメディア」も単語強調度は 0.7 が適用されます。
同一の代替表記を複数の表記に対して登録しないでください。
表記
「表記」は出力しやすくさせたい文字列のことです。
表記に使える特別な文字
表記に使える文字には、特別な働きをする記号があります。
| 文字 | 文字名 | 説明 |
|---|---|---|
| _ | 半角下線 | 単語区切りを表す記号 |
音声認識結果として半角下線(_)を出力することはできません。
末尾の文字が半角英数字である単語と、先頭の文字が半角英数字である単語とが連続する場合、2つの単語の間に半角スペースが挿入されます。
例えば、「あみ」と発話して「Advanced Media」を出力させたい場合、「Advanced_Media アミ」と単語強調をしてください。(単語強調度は任意)
Advanced_Media アミ
ただし、以下のような場合は半角スペースは挿入されません。
アドバンスト_メディア アミ
トリプル_W トリプルダブル
Triple_ダブル トリプルダブル
また、以下のように半角下線を表記に用いなかった場合は、一続きの単語として解釈されますので、半角スペースは挿入されません。
AdvancedMedia アミ
表記に登録できない文字
表記には以下の文字を含む文字列は登録できません。
| 文字 | 文字名 |
|---|---|
| | | 半角パイプ |
| 半角スペース | |
| : | 半角コロン |
代替表記
「代替表記」は「表記」に置き換えたい文字列です。代替表記も表記と同様に認識結果の候補として出やすくされたうえで、表記に置き換えられます。「表記」の読みの情報を与えるような使い方をすることもできますが、ハイブリッドエンジンの単語登録における「読み」とは異なる性質のものです。
たとえば、「雲母」という単語を認識させやすくしたいとします。「雲母」は通常「うんも」と読まれる単語であるため、代替表記を使って読みの情報を与えることをしなくても、「うんも」という発話の認識結果の候補になり得ます。このため、以下のように単語強調すると、「うんも」と発話した場合に「雲母」が認識され やすくなります。単語強調度の数値は一例です。
雲母 0.8
ここで、「きらら」という発話も「雲母」と認識させたいとします。この場合、代替表記を用いて次のように単語強調します。
雲母 キララ 0.8
この時、「うんも」と発話した場合も、「きらら」と発話した場合も、いずれも「雲母」と認識されやすくなります。
代替表記は、End to End エンジンが代替表記を認識結果として出した場合に、それを「表記」の単語に置き換えるというものです。このため、エンジンが代替表記を認識結果の候補として挙げることがないのであれば、単語強調が働いてくれません。日本語の End to End エンジンでは、固有名詞に対してはカタカナで記述した文字列が認識結果の候補として挙がりやすくなっているため、代替表記にはカタカナ表記を登録すると、適切に単語強調が働くことを期待できます。
例えば、「ぱれおぱらどきしあ」という発話を「絶滅哺乳類」と認識させたいとします。この時、表記に「絶滅哺乳類」を指定し、代替表記には「ぱれおぱらどきしあ」ではなく「パレ オパラドキシア」とカタカナ表記を登録すると適切に働きやすくなります。
必ずしも、認識結果で代替表記に合致する部分が全て表記に置き換えられて、認識結果から代替表記が消えると保証するものではありません。ある文字列を必ず違う文字列に置き換えたい場合は、クライアントシステム側で認識結果に対して後処理を行うことを推奨します。
代替表記に登録できない文字
代替表記には以下の文字を含む文字列は登録できません。
| 文字 | 文字名 |
|---|---|
| | | 半角パイプ |
| 半角スペース |
代替表記に使える特別な文字
代替表記に使える文字には、特別な働きをする記号があります。
| 文字 | 文字名 | 説明 |
|---|---|---|
| _ | 半角下線 | 単語区切りを表す記号 |
表記や代替表記に、単語区切りを表す「_」(半角下線)が使われている場合、認識結果の候補も同様に単語に区切りのあるものでなければ、表記や代替表記と一致するものとみなされません。たとえば以下のように単語強調を指定して「ぱれおぱらどきしあ」と発話した場合、認識結果の候補が「パレオパラドキシア」と一続きの単語となった場合は、代替表記の「パレオパラ」と「ドキシア」の2つの単語の並んだものとは異なるものと判断され、この単語強調は働きません。
絶滅哺乳類 パレオパラ_ドキシア 0.5
逆に、表記や代替表記に半角下線を使わず一続きの単語とした場合、認識結果の候補が複数の単語に区切られていたとしても、単語強調が働きます。
単語強調度
「単語強調度」は単語を強調する強さを指定します。0 ~ 1 の値が指定可能で、0 は強調しないことを表し、単語が出やすくなることも、出にくくなることもありません。1は、全体的な認識率を犠牲にしながらも強めに単語強調をすることを表します。何も指定しない場合、デフォルトで 0.5 になります。