사용 가이드

음성 인식 서버의 엔드포인트에 HTTP 또는 WebSocket으로 연결하고, 요청 파라미터와 함께 음성 데이터를 전송하여 음성 인식 결과를 얻을 수 있습니다. 여기서는 AmiVoice API를 사용하여 애플리케이션을 만드는 개발자를 위한 사용 방법을 순서대로 설명합니다.

기본 기능

일반적으로 AmiVoice API를 사용하여 음성 인식을 수행하는 클라이언트 애플리케이션은 다음과 같은 구현이 필요합니다.

음성 데이터를 녹음 장치나 네트워크에서 가져오기
음성 데이터를 지원되는 형식으로 변환하기 (지원되는 음성 형식인 경우 불필요합니다)
음성 인식 API 엔드포인트로 음성 데이터 전송하기
음성 인식 결과 받기
음성 인식 결과를 해석하고 활용하기 (예: 자막으로 화면에 표시, 의도를 이해하여 음성 봇 응답 생성, 회의 의사록 등 요약 처리의 입력으로 사용 등)

다음은 클라이언트 프로그램과 음성 인식 서버 간의 상호작용 개요입니다.

그림. AmiVoice API 개요

A. 인터페이스 선택

AmiVoice API는 3가지 음성 인식 인터페이스를 제공합니다. 필요한 특징과 예상되는 사용 사례에 대해 설명하고, 사용자가 선택할 수 있도록 돕습니다.

인터페이스 선택

B. 요청 방법

음성 인식 결과를 얻기 위해 서버로 요청할 때 다양한 설정을 하고 음성 파일을 전송해야 합니다.

요청 파라미터에서는 요청 시 설정해야 하는 항목을 설명합니다.
지원되는 음성 데이터에 대해서는 음성 형식을 참조하십시오.
사용 가능한 음성 인식 엔진과 지원되는 언어에 대해서는 음성 인식 엔진을 참조하십시오.

요청 전송 방법은 HTTP와 WebSocket에 따라 다르므로 각 인터페이스에 대해 순서대로 설명합니다.

전송한 데이터와 음성 인식 결과의 서버 상 로그 처리에 대해서는 로그 보존을 참조하십시오.

C. 결과 처리

음성 인식 서버에서는 전송한 음성을 텍스트로 변환한 결과를 얻을 수 있습니다. 또한 텍스트 이외에 얻을 수 있는 다양한 정보에 대해서는 음성 인식 결과에서 자세히 설명합니다. 오류 처리에 대해서는 응답 코드와 메시지를 참조하십시오.

고급 기능 등

AmiVoice API를 더 잘 활용하여 애플리케이션을 개발하기 위한 정보와 클라이언트 라이브러리, 샘플 프로그램, 제한 사항에 대해 설명합니다.

그림. AmiVoice API 개요

D. AmiVoice API의 기능

AmiVoice API의 다양한 기능에 대해 설명합니다.

E. 클라이언트 라이브러리

AmiVoice API를 다양한 언어에서 쉽게 사용할 수 있는 클라이언트 라이브러리를 소개합니다.

클라이언트 라이브러리

F. 샘플 프로그램

AmiVoice API를 사용한 다양한 프로그래밍 언어의 샘플 프로그램을 소개합니다.

샘플 프로그램

G. 제한 사항

AmiVoice API를 사용할 때 알아야 할 제한 사항에 대해 설명합니다.

제한 사항

기본 기능​

A. 인터페이스 선택​

B. 요청 방법​

C. 결과 처리​

고급 기능 등​

D. AmiVoice API의 기능​

E. 클라이언트 라이브러리​

F. 샘플 프로그램​

G. 제한 사항​