메인 콘텐츠로 건너뛰기

제한 사항

AmiVoice API의 제한 사항에 대해 설명합니다.

WebSocket 인터페이스

세션 유지 최대 시간: 24시간

WebSocket 인터페이스에서 세션을 유지할 수 있는 최대 시간은 24시간입니다. 처리 중인지 여부와 관계없이 세션 유지 최대 시간이 지나면 연결을 끊습니다. 인식 처리를 계속하려면 연결부터 다시 시작하십시오.

비음성 구간으로 인한 강제 연결 해제 시간: 600초

600초 동안 발화를 감지하지 못한 경우 연결을 끊습니다. 인식 처리를 계속하려면 연결부터 다시 시작하십시오.

이 연결 해제가 발생한 경우, p 응답 패킷에서 다음 메시지를 받게 됩니다.

p can't feed audio data to recognizer server

참조의 p 명령어 응답 패킷과 이용 가이드의 WebSocket 인터페이스의 세션 유지도 참조하십시오.

무통신으로 인한 강제 연결 해제 시간: 60초

60초 동안 어떤 데이터도 수신하지 못한 경우 연결을 끊습니다.

이 연결 해제가 발생한 경우, 인식 처리를 시작하기 전이라면 다음 메시지를 받게 됩니다.

e timeout occurred

인식 처리 중이라면 다음 메시지를 받게 됩니다.

e timeout occurred while recognizing audio data from client

참조의 e 명령어 응답 패킷과 이용 가이드의 WebSocket 인터페이스의 세션 유지도 참조하십시오.

하나의 발화 구간의 최대 시간: 30초

발화 구간이 최대 시간을 초과한 경우, 최대 시간까지를 일단 발화가 종료된 것으로 간주하여 음성 인식 결과를 반환합니다. 그 이후의 음성은 새로운 발화 구간으로 인식 처리가 수행됩니다.

※ 발화 구간이란 1초 미만의 무음(소리가 없는 시간)으로 구분된 "소리가 있는" 구간입니다.

동기 HTTP 인터페이스

수용 가능한 음성 데이터의 최대 용량: 16,777,215바이트 (약 16 MiB)

동기 HTTP 인터페이스의 한 번의 요청에서 전송할 수 있는 음성 데이터의 최대 크기는 16,777,215바이트입니다. 이 상한을 초과하는 음성 데이터를 전송하려면 비동기 HTTP 인터페이스를 사용하십시오.

비음성 구간으로 인한 강제 연결 해제 시간: 50초

50초 동안 발화를 감지하지 못한 경우 연결을 끊습니다. 인식 처리를 계속하려면 연결을 다시 시작한 후 음성을 전송하십시오.

하나의 발화 구간의 최대 시간: 30초

음성 데이터 내에서 발화 구간이 최대 시간 이상 지속되는 경우, 그 시점까지의 음성을 하나의 발화가 종료된 것으로 간주하여 인식 확정 결과를 생성하고 반환합니다. 그 이후의 음성은 새로운 발화 구간으로 인식 처리가 수행됩니다.

※ 발화 구간이란 1초 미만의 무음 시간(소리가 없는 시간)으로 구분된 "소리가 있는" 구간입니다.

무통신으로 인한 강제 연결 해제 시간: 60초

60초 동안 어떤 데이터도 수신하지 못한 경우 연결을 끊습니다.

비동기 HTTP 인터페이스

수용 가능한 음성 데이터의 최대 용량: 2,147,483,647바이트 (약 2 GiB) (화자 다이어라이제이션 활성화 시 최대 3시간)

비동기 HTTP 인터페이스의 한 번의 요청에서 전송할 수 있는 음성 데이터의 최대 크기는 2,147,483,647바이트입니다.

또한, 화자 다이어라이제이션을 활성화한 요청의 경우, 음성의 최대 길이는 3시간입니다. 제한을 초과하면 요청 시 오류가 발생합니다.

{"results":[{"tokens":[],"tags":[],"rulename":"","text":""}],"code":"^","message":"request too large (audio duration exceeded 3 hours with speaker diarization)"}

하나의 발화 구간의 최대 시간: 60초

음성 데이터 내에서 발화 구간이 최대 시간 이상 지속되는 경우, 그 시점까지의 음성을 하나의 발화가 종료된 것으로 간주하여 인식 확정 결과를 생성하고 반환합니다. 그 이후의 음성은 새로운 발화 구간으로 인식 처리가 수행됩니다.

※ 발화 구간이란 1초 미만의 무음 시간(소리가 없는 시간)으로 구분된 "소리가 있는" 구간입니다.

비음성 구간으로 인한 강제 연결 해제 시간: 제한 없음

발생하지 않습니다.

음성 인식 결과의 보존 기간: 7일

음성 인식 처리가 종료된 후 7일간(168시간) 보존합니다.

무통신으로 인한 강제 연결 해제 시간: 60초

60초 동안 어떤 데이터도 수신하지 못한 경우 연결을 끊습니다.