단어 등록의 구성 요소
단어 등록 시 해당 단어의 '표기', '읽기', '클래스'를 지정할 수 있으며, 이 중 '표기'와 '읽기'는 필수 항목입니다. 다음은 각 구성 요소에 대한 설명입니다.
항목 | 설명 | 필수 | 예 |
---|---|---|---|
'표기'(#written) | 해당 단어가 발화되었을 때 음성 인식 결과로 얻어지는 문자열입니다. | ● | AmiVoice |
'읽기'(#spoken) | 해당 단어가 어떻게 발음되는지를 나타내는 정보입니다. 각 언어마다 읽기를 기술하는 방법이 다릅니다. | ● | あみぼいす |
'클래스'(#class) | 단어의 카테고리나 타입을 지정하기 위한 분류입니다. 이 분류를 통해 음성 인식 시스템은 동일한 발음이라도 다른 맥락에서 사용되는 단어를 구별할 수 있습니다. 클래스는 엔진별로 정의되어 있으며, API 사용자가 클래스를 추가할 수 없습니다. | 固有名詞 |
영어 엔진은, 단어 등록 기능을 지원하지 않습니다.
단어 등록 개요
예를 들어 "パレオパラドキシア"라는 단어가 인식되지 않아 단어 등록을 하고 싶다고 가정해봅시다. 이 경우, 다음과 같이 표기와 읽기의 쌍을 등록합니다. 표기와 읽기는 반각 공백으로 구분합니다. 클래스도 설정하는 경우에는 클래스 지정 방법을 참조하세요.
パレオパラドキシア ぱれおぱらどきしあ
동일 표기에 여러 읽기 설정
하나의 표기에 대해 여러 개의 읽기를 설정할 수 있습니다.
예를 들어 "あみ" 또는 "アドバンストメディア"라는 읽기에 대해, "AMI"라는 표기를 설정할 수 있습니다.
AMI あみ
AMI あどばんすとめでぃあ
여러 표기에 동일한 읽기 설정
여러 다른 표기에 대해 같은 읽기를 설정할 수 있습니다. 오류가 발생하지는 않지만, 어느 표기가 선택될지는 불확실합니다. 굳이 설정하는 것은 권장하지 않습니다.
예를 들어 "あみ"라는 읽기에 대해 "AMI"와 "AmiVoice"라는 표기를 설정할 수 있습니다.
AMI あみ
AmiVoice あみ
표기
'표기'는 발화된 음성에 대해 출력하고 싶은 문자열을 말합니다.
표기에 사용할 수 있는 특수 문자
표기로써 사용할 수 있는 문자 중에는 특별한 기능을 하는 기호가 있습니다.
문자 | 문자명 | 설명 |
---|---|---|
_ | 반각 밑줄 | (일본어 인식의 경우,) 음성 인식 결과에서 반각 공백을 대신하여 출력되는 기호 |
음성 인식 결과로 반각 밑줄(_)은 출력할 수 없습니다.
표기에 등록할 수 없는 문자
표기에는 다음 문자를 포함하는 문자열을 등록할 수 없습니다.
문자 | 문자명 |
---|---|
| | 반각 파이프 |
반각 공백 | |
: | 반각 콜론 |
단어 등록 시, 표기에 반각 공백을 사용할 수 없지만, 표기에 반각 밑줄(_)을 사용하여 단어를 등록하면 음성 인식 결과에서는 반각 공백으로 출력됩니다.
예를 들어, "あみ"라고 발화하여 "Advanced Media"를 출력하고 싶은 경우, "Advanced_Media あみ"로 단어를 등록하세요.
Advanced_Media あみ
읽기
'읽기'는 해당 단어의 읽는 방법(발화 방법)을 말합니다.
언어별 읽기 기술 방법
읽기는 언어마다 기술 방법이 다릅니다. 다음은 각 언어의 기술 방법에 대한 설명입니다.
일본어
일본어의 경우, 히라가나 또는 카타카나로 기술합니다.
중국어
중국어의 경우, 성조를 숫자로 표시한 병음으로 기술합니다. 예를 들어, "我们"은 "wo3men5"로 기술합니다.
我们 wo3men5
한국어
한국어의 경우, 한글로 기술합니다.
읽기에 사용할 수 있는 특수 문자
읽기에 사용가능한 문자에는, 특별한 동작을 하는 기호가 있습니다. 다음은 각 언어에서 사용 가능한 특수 문자입니다.
일본어
문자 | 문자명 | 설명 |
---|---|---|
. | 반각 마침표 | 음절 구분, 장음화 억제를 위한 기호 |
_ | 반각 밑줄 | 무음을 나타내는 기호 |
- AmiVoice Tech Blog에서 이러한 읽기에 사용할 수 있는 특수 문자인 반각 마침표의 사용법에 대해 설명하고 있습니다. 자세한 내용은 다음을 참조해 주십시오.
【중급자용】AmiVoice의 단어 읽기 자동 변환에 대해(일본어)
- 반각 밑줄(_)을 사용하면 단어 중간에 약간의 무음이 있더라도 연속된 단어로 인식되기 쉬워집니다.
예를 들어, "AmiVoice青果店 あみぼいす_せいかてん"으로 단어를 등록하면, "あみぼいす"와 "せいかてん" 사이에 잠시 음성이 끊어져 있어도 "AmiVoice青果店"으로 인식되기 쉬워집니다.
AmiVoice青果店 あみぼいす_せいかてん
중국어・한국어
문자 | 문자명 | 설명 |
---|---|---|
_ | 반각 밑줄 | 무음을 나타내는 기호 |
클래스
AmiVoice API에서는 단어의 카테고리나 타입을 지정하기 위한 분류를 클래스라고 부릅니다. 클래스를 통해 음성 인식 시스템은 동일한 발음이라도 다른 맥락에서 사용되는 단어를 구별할 수 있습니다. 클래스는 음성 인식 엔진별로 정의되어 있으며, 예를 들어 "会話_汎用(대화 범용) 엔진"(-a-general
)의 경우 다음과 같은 클래스가 정의되어 있습니다. 자세한 내용은 음성 인식 엔진의 일본 어 언어 모델의 클래스명 목록을 참조해 주십시오.
- 固有名詞
- 名前
- 名前(名)
- 駅名
- 地名
- 会社名
- 部署名
- 役職名
- 記号
- 括弧開き
- 括弧閉じ
- 元号
- "会話_汎用(대화 범용) 엔진"의 클래스에서
名前
은 사람 이름의 성을,名前(名)
은 사람 이름의 이름을 나타냅니다. - 존재하지 않는 클래스명이 지정된 경우에는 클래스명이 지정되지 않은 것으로 간주됩니다.
예를 들어, 어떤 단어를 "名前" 클래스로 지정하면, 그 단어는 사람 이름이 말해지는 맥락에서 인식되기 쉬워집니다. 반대로 사람 이름이 말해지는 맥락 이외에서는 인식되기 어려워져, 동일한 발음이라도 다른 맥락에서 잘못 인식되는 문제를 줄일 수 있습니다. 만약 등록하려는 단어에 해당하는 클래스가 있다면 가능한 한 클래스를 지정해 주십시오.
사람 이름을 풀네임으로 단어 등록해도 잘 인식되지 않는 경우, 다음과 같은 대응방법이 있습니다.
-
사람 이름을 '성'과 '이름'으로 나누어 각각
名前
클래스,名前(名)
클래스로 등록한다.
이 경우, 발화의 성과 이름 사이에 무음이나 필러가 있어도 인식되기 쉬워집니다. 반면, 동음이의어인 사람 이름을 다른 것도 등록하는 경우에는 오인식되기 쉬워집니다. (예를 들어名前
클래스에 "山田"를,名前(名)
클래스에 "たろう"라는 읽기로 "太郎"와 "太朗"을 각각 등록하면, "やまだたろう"라고 발화하여 "山田太郎"으로 인식하고 싶은 경우에도 "山田太朗"으로 인식될 가능성이 있습니다) -
읽기의 '성'과 '이름' 사이에 무음을 나타내는 기호인 반각 밑줄(_)을 넣는다.
이 경우, 성과 이름 사이에 약간의 무음이 있어도 인식되기 쉬워집니다. 반면, 성과 이름 사이에 필러가 들어가는 경우에는 올바르게 인식되지 않습니다.
클래스 지정 방법
클래스는 "표기"와 "읽기" 다음에 지정합니다. 예를 들어, "アソーク駅"이라는 역이름이 인식되지 않는다고 합시다. 클래스명으로 駅名
을 지정하는 경우, 다음과 같이 반각 공백 다음에 기술합니다.
アソーク駅 あそーくえき 駅名
AmiVoice Tech Blog의 AmiVoice API의 단어 등록 기능에서 선택 가능한 "클래스"에 대한 해설(범용 엔진)(일본어)도 참조해 주십시오.
특별한 단어 등록
단어 등록에는 일부 엔진에서만 지원하는 특별한 종류가 있습니다.
필러 단어
"音声入力_氏名" 엔진은 성명만, "音声入力_住所" 엔진은 주소만 인식하는 데 사용하는 엔진입니다. 이러한 엔진에는 미리 설정된 필러 단어가 없지만, 이름이나 주소 이외의 단어도 발화해야 하는 경우에는 필요에 따라 사용자가 직접 필러 단어를 등록할 수 있습니다.
필러 단어에 사용할 수 있는 클래스는 다음과 같습니다.
클래스명 | 설명 |
---|---|
フィラー(文頭) | 풀네임이나 성 앞에 "えー", "わたしは", "ぼくは" 등을 넣고 싶은 경우 또는, 주소 앞에 "えーと", "住所は" 등을 넣고 싶을 때 사용하는 클래스 |
フィラー(文末) | 풀네임이나 名(이름) 뒤에 "です" "ともうします" 등을 넣고 싶은 경우 또는, 주소 뒤에 "です" 등을 넣고 싶을 때 사용하는 클래스 |
필러 단어를 등록할 때는 표기를 반각 퍼센트(%)로 감싸주세요. 읽는 방법은 반각 퍼센트를 붙이지 않고, 평소와 같이 단어의 읽는 방법을 기입해 주세요. 예를 들어, "あのー"라는 단어를 "フィラー(文頭)" 클래스에 등록하고 싶은 경우 다음과 같이 기술합니다.
%あのー% あのー フィラー(文頭)
"フィラー(文頭)" 또는 "フィラー(文末)"에는 "えー", "あのー" 같은 일반적인 필러 단어 외에도, 문장의 처음이나 끝에서만 사용되며 이름이나 주소가 아닌 필러로 취급하고 싶은 단어(짧은 구문)도 등록할 수 있습니다.
예를 들어, "音声入力_氏名" 엔진에 "私は"과 "です"를 각각 문두와 문말의 필러로 단어 등록합니다.
%私は% わたしは フィラー(文頭)
%です% です フィラー(文末)
이때, "わたしは、やまだあみです"라고 발화했다고 가정합니다.
わたしは、やまだあみです
이 음성 인식 결과는, 필러로서 등록된 단어가 자동 삭제되어 다음과 같은 결과가 얻어집니다.
ヤマダアミ