메인 콘텐츠로 건너뛰기

End to End 엔진의 단어 강조

End to End 엔진에서 단어 강조 시, 해당 단어의 '표기', '대체 표기', '단어 강조도'를 지정할 수 있으며, 이 중 '표기'는 필수 항목입니다. 각 구성 요소에 대해 아래에서 설명합니다.

항목
설명
필수
예시
표기음성 인식 결과에서 잘 인식되도록 하고 싶은 문자열입니다.AmiVoice
대체 표기표기로 대체하고 싶은 문자열입니다. 표기의 읽기 정보로 취급할 수도 있습니다. 대체 표기도 인식 결과의 후보로 더 쉽게 나타나며, 표기로 대체됩니다.アミボイス
단어 강조도단어를 강조하는 강도를 지정합니다. 0.0 ~ 1.0 사이의 값을 지정할 수 있으며, 지정하지 않으면 기본값으로 0.5가 됩니다.0.7

단어 강조 개요

예를 들어 'AmiVoice'라는 단어가 인식되지 않아 단어 강조를 하고 싶다고 가정해 봅시다. 이 경우, 다음과 같이 표기나 대체 표기, 단어 강조도를 등록합니다. 표기와 대체 표기, 대체 표기와 단어 강조도는 반각 공백으로 구분합니다.

대체 표기는 생략할 수 있습니다. 이때 표기와 단어 강조도 사이에 반각 공백을 2개 연속으로 사용합니다. 단어 강조도도 생략할 수 있으며, 이 경우 기본값으로 0.5가 적용됩니다.

AmiVoice アミボイス 0.6

이 경우, 'AmiVoice'가 인식 결과로 나타나기 쉽게 강조될 뿐만 아니라(강조도는 0.6), 'アミボイス'도 인식 결과의 후보로 나타나기 쉬워지며, 인식 결과의 'アミボイス'는 'AmiVoice'로 대체되는 동작을 합니다.

정보

동일 표기에 대한 여러 대체 표기 설정

하나의 표기에 대해 복수의 대체 표기를 설정할 수 있습니다. 다만, 동일한 표기에 대해 서로 다른 단어 강조도를 적용할 수는 없습니다. 단어 강조 요청에 동일한 표기가 여러 개 포함된 경우, 가장 앞의 항목에 적용되는 단어 강조도(가장 앞의 항목에 대해 단어 강조도 지정을 생략한 경우, 기본값 0.5)가 해당 표기의 모든 항목에 적용됩니다.

예를 들어, 'アミ' 또는 'アドバンストメディア'라는 읽기에 대해 'AMI'라는 표기를 설정할 수 있습니다.

AMI  0.7
AMI アミ
AMI アドバンストメディア

이러한 설정의 경우, 'AMI アミ' 또는 'AMI アドバンストメディア'도 단어 강조도 0.7이 적용됩니다.

노트

동일한 대체 표기를 여러 표기에 대해 등록하지 마십시오.

표기

'표기'는 음성 인식이 해당 단어를 인식했을 때 최종 출력값으로 반환되기를 원하는 문자열을 의미합니다.

표기에 사용할 수 있는 특수 문자

표기에 사용할 수 있는 문자 중에는 특별한 기능을 하는 기호가 있습니다.

문자
문자명
설명
_반각 밑줄단어 구분을 나타내는 기호
노트

음성 인식 결과로 반각 밑줄(_)을 출력할 수는 없습니다.

마지막 문자가 반각 영숫자인 단어와, 첫 번째 문자가 반각 영숫자인 단어가 연속되는 경우, 두 단어 사이에 반각 공백이 삽입됩니다.

예를 들어, 'あみ'라고 발화하여 'Advanced Media'를 출력하고 싶은 경우, 'Advanced_Media アミ'와 같이 단어 강조를 해주십시오. (단어 강조도는 임의)

Advanced_Media アミ

단, 다음과 같은 경우에는 반각 공백이 삽입되지 않습니다.

アドバンスト_メディア アミ
トリプル_W トリプルダブル
Triple_ダブル トリプルダブル

또한, 다음과 같이 반각 밑줄을 표기에 사용하지 않은 경우에는 하나의 연속된 단어로 해석되므로 반각 공백이 삽입되지 않습니다.

AdvancedMedia アミ

표기에 등록할 수 없는 문자

표기에는 다음 문자를 포함하는 문자열을 등록할 수 없습니다.

문자
문자명
|반각 파이프
반각 공백
:반각 콜론

대체 표기

'대체 표기'는 '표기'로 대체하고 싶은 문자열입니다. 대체 표기도 표기와 마찬가지로 인식 결과의 후보로 더 쉽게 나타나며, 표기로 대체됩니다. '표기'의 읽기 정보를 제공하는 방식으로 사용할 수도 있지만, 하이브리드 엔진의 단어 등록에서의 '읽기'와는 다른 성질의 것입니다.

예를 들어, '雲母'라는 단어를 인식하기 쉽게 하려고 합니다. '雲母'는 일반적으로 'うんも'로 읽히는 단어이므로, 대체 표기를 사용하여 읽기 정보를 제공하지 않아도 'うんも'라는 발화의 인식 결과 후보가 되기 쉽습니다. 따라서 다음과 같이 단어 강조를 등록하면 'うんも'라고 발화한 경우에 '雲母'가 인식되기 쉬워집니다. 단어 강조도의 수치는 하나의 예시입니다.

雲母  0.8

여기서는 'きらら'라는 발화도 '雲母'로 인식되도록 하고자 한다고 가정해 보겠습니다. 이 경우, 대체 표기를 사용하여 다음과 같이 단어 강조를 등록합니다.

雲母 キララ 0.8

이때 'うんも'라고 발화한 경우에도, 'きらら'라고 발화한 경우에도 모두 '雲母'로 인식되기 쉬워집니다.

대체 표기는 End to End 엔진이 대체 표기를 인식 결과로 출력한 경우에, 그것을 '표기'의 단어로 대체하는 것입니다. 따라서 엔진이 대체 표기를 인식 결과의 후보로 제시하지 않는다면 단어 강조가 작동하지 않는다고 볼 수 있습니다. 일본어 End to End 엔진에서는, 고유명사에 대해 가타카나로 작성한 문자열이 인식 결과의 후보로 제시되기 쉬워지므로, 대체 표기에는 가타가나 표기로 등록하면, 적절하게 단어 강조 기능이 작동할 것으로 기대할 수 있습니다.

예를 들어, 'ぱれおぱらどきしあ'라는 발화를 '絶滅哺乳類'로 인식하게 하고 싶다고 합시다. 이때 표기에 '絶滅哺乳類'를 지정하고, 대체 표기에는 'ぱれおぱらどきしあ'가 아닌 'パレオパラドキシア'와 같이 가타가나 표기로 등록하면 적절하게 작동하기 쉬워집니다.

노트

반드시 인식 결과에서 대체 표기와 일치하는 부분이 모두 표기로 대체되어, 인식 결과에서 대체 표기가 사라진다고 보장하지 않습니다. 특정 문자열을 반드시 다른 문자열로 대체하고 싶은 경우에는, 클라이언트 시스템 측에서 인식 결과에 대해 후처리를 수행하는 것을 권장합니다.

대체 표기에 등록할 수 없는 문자

대체 표기에는 다음 문자를 포함하는 문자열을 등록할 수 없습니다.

문자
문자명
|반각 파이프
반각 공백

대체 표기에 사용할 수 있는 특수 문자

대체 표기에 사용할 수 있는 문자 중에는 특별한 기능을 하는 기호가 있습니다.

문자
문자명
설명
_반각 밑줄(언더스코어)단어 구분을 나타내는 기호

표기나 대체 표기에 단어 구분을 나타내는 반각 밑줄(언더스코어) 문자 '_'가 사용된 경우, 인식 결과의 후보도 마찬가지로 단어에 구분이 있는 것이어야 표기나 대체 표기와 일치하는 것으로 간주됩니다. 예를 들어 다음과 같이 단어 강조를 지정하고 'ぱれおぱらどきしあ'라고 발화한 경우, 인식 결과의 후보가 'パレオパラドキシア'와 같이 하나의 연속된 단어가 된 경우에는 대체 표기의 'パレオパラ'와 'ドキシア' 두 단어가 나란히 있는 것과는 다른 것으로 판단되어, 이 단어 강조는 작동하지 않습니다.

絶滅哺乳類 パレオパラ_ドキシア 0.5

반대로, 표기나 대체 표기에 반각 밑줄을 사용하지 않고 하나의 연속된 단어로 한 경우, 인식 결과의 후보가 여러 단어로 구분되어 있더라도 단어 강조가 작동합니다.

단어 강조도

'단어 강조도'는 단어를 강조하는 강도를 지정합니다. 0 ~ 1 사이의 값을 지정할 수 있으며, 0은 강조하지 않음을 나타내고, 단어가 더 쉽게 나타나거나 더 어렵게 나타나지 않습니다. 1은 전체적인 인식률을 희생하면서도 강하게 단어 강조를 하는 것게 됩니다. 아무것도 지정하지 않으면 기본값으로 0.5가 됩니다.