s 명령어 패킷/s 명령어 응답 패킷
s 명령어 패킷과 s 명령어 응답 패킷은 쌍을 이룹니다. s 명령어로 음성 데이터 전송 시작을 서버에 통지하면 서버는 s 명령어 응답 패킷을 반환합니다.
s 명령어 응답 패킷이 "s" 한 글자인 경우 성공입니다. 이어서 p 명령어 패킷으로 음성 데이터 공급을 시작할 수 있습니다. 음성 데이터 전송이 모두 끝나면 e 명령어 패킷으로 전송 종료를 통지하지만, 그 후에도 연결이 유지되어 있다면 다시 s 명령어 패킷부터 재개할 수 있습니다.
s 명령어 패킷
음성 데이터 전송을 시작합니다. 전송 시작을 통지하는 것 외에도 전송할 음성의 포맷과 사용하고 싶은 음성 인식 엔진(연결 엔진 이름), 인증 정보(APPKEY) 및 기타 파라미터를 전송해야 합니다.
형식
타입 TEXT
s <audio_format> <grammar_file_names>
s <audio_format> <grammar_file_names> <key>=<value> ...
s 및 각 파라미터 블록의 구분 문자는 반각 공백입니다. 다음은 각 파라미터의 세부 사항에 대한 설명입니다.
<audio_format>
전송할 음성 포맷을 지정합니다. 이 파라미터는 필수입니다. 지정할 수 있는 포맷 이름에 대해서는 이용 가이드의 음성 포맷에 대하여를 참조하십시오.
<grammar_file_names>
연결 엔진 이름을 지정합니다. 이 파라미터는 필수입니다.
<key>
<key>에는 다음과 같은 키 문자열을 지정할 수 있습니다. <value>에 공백이 포함되는 경우에는 value의 앞뒤를 반각 큰따옴표 「"」로 감싸줍니다.
<key> | 설명 |
---|---|
authorization | authorization 에는 마이페이지에 기재된 [APPKEY] 또는 원타임 APPKEY 발행 API로 취득한 원타임 APPKEY를 설정합니다. 이 파라미터는 필수입니다. |
profileId | profileId 는 사용자 고유의 단어를 등록할 경우의 사용자 고유 데이터 파일(프로파일)의 ID입니다. 해당 프로파일을 지정하여 사용할 수 있는 것은 해당 사용자뿐입니다. 프로파일은 사용자 고유 영역에 저장되므로 다른 사용자와의 이름 충돌이 발생하지 않습니다. ※ profileId 에는 반각 영숫자 및 「-」(반각 마이너스), 「_」(반각 밑줄)로 구성된 문자열을 지정합니다. 단, 「__」(반각 밑줄 2문자)로 시작하는 문자열은 음성 인식 엔진 측에서 예약되어 있으므로 「__」(반각 밑줄 2문자)로 시작하는 문자열은 지정하지 않도록 하십시오. 마이페이지의 단어 등록에서 단어를 등록하면 마이페이지의 연결 정보에 기재된 서비스 ID(사용자 ID에서 자동 생성됨)와 동일한 이름의 프로파일(내 단어장)이 서버상에 자동으로 생성 저장됩니다. 이 프로파일(내 단어장)을 이용하여 음성 인식을 수행하고 싶을 때는 **「서비스 ID의 앞에 반각 콜론":"을 추가한 문자열」**을 profileId 에 지정합니다. (예) 서비스 ID가 「aiueo12345」인 경우, 「:aiueo12345」를 profileId 의 값으로 지정합니다. 단어 등록 단어 등록은 마이페이지의 단어 등록 화면에서 수행하는 것이 가장 간단합니다. 이 방법이라면 후술할 profileWords 를 이용할 필요가 거의 없습니다. 마이페이지의 단어 등록 화면에서 작성한 프로파일(내 단어장)과 profileWords 의 관계에 대해서는 이 페이지의 profileId 와 profileWords 를 참조하십시오. profileId 와 profileWords 모두를 지정하는 경우에는 profileId 를 먼저 지정해야 합니다. |
profileWords | profileWords 파라미터에는 등록하고 싶은 단어의 표기와 읽기를 설정합니다. 『표기<반각 공백>읽기』와 같이 등록합니다. 여러 개를 등록하는 경우에는 「 | 」로 구분합니다. 전송 시에는 profileWords 파라미터의 값 전체를 「"」로 감싸줍니다. ※ 클래스 이름을 지정하는 경우에는 『표기<반각 공백>읽기 <반각 공백> 클래스 이름』으로 지정하십시오. |
keepFillerToken | 발화에 포함된 필러 단어(「아ー」나 「어ー」 등)를 인식 결과 문자열에 포함하고 싶은 경우에는 다음과 같이 지정합니다. keepFillerToken=1 필러 단어에는 다양한 것들이 있지만, 모두 표기의 앞뒤가 반각의 %로 둘러싸여 있습니다. (예) %아ー% %어ー% %오ー% %어ーっと% keepFillerToken=1 의 지정을 하지 않은 경우, 필러 단어는 인식 결과 문자열에서 제거됩니다. |
segmenterProperties | 발화 검출의 파라미터입니다. 화자 다이어라이제이션의 활성화/비활성화를 제어하거나 결과를 조정하기 위한 파라미터를 설정할 수 있습니다. 여러 파라미터를 공백으로 구분하여 설정할 수 있습니다. segmenterProperties="key1=value1 key2=value2..." 설정할 수 있는 파라미터는 다음과 같습니다. useDiarizer 1을 설정하면 화자 다이어라이제이션이 활성화됩니다. ・지정 가능한 값: 0 또는 1 ・기본값: 0 diarizerAlpha 새로운 화자의 출현 용이성을 제어하는 파라미터입니다. 큰 값을 지정할수록 새로운 화자가 출현하기 쉬워지고, 작은 값을 지정할수록 새로운 화자가 출현하기 어려워집니다. useDiarizer=1 일 때만 유효합니다.・지정 가능한 값: 0 이상 ・참고 범위: 1e-100~1e50 ・기본값: 1 diarizerTransitionBias 화자 전환의 용이성을 제어하는 파라미터입니 다. 큰 값을 지정할수록 화자가 전환되기 쉬워지고, 작은 값을 지정할수록 화자가 전환되기 어려워집니다. useDiarizer=1 일 때만 유효합니다.・지정 가능한 값: 0 이상 1 미만 ・참고 범위: 1e-150~1e-10 ・기본값: 1e-40 (8k의 경우는 1e-20) |
마이페이지에서 등록한 단어를 사용하고 싶은 경우의 s 명령어
s MSB16K -a-general profileId=:<사용자ID> authorization=XXXXXXXXXXXXXX