메인 콘텐츠로 건너뛰기

소개

AmiVoice API는 음성을 텍스트로 변환하는 음성 인식 API입니다. AmiVoice API에 음성을 전송하면 발화 내용을 텍스트로 변환한 결과를 반환합니다. 회의 녹취록 작성이나 음성 대화 시스템 등의 음성 지원 애플리케이션을 만들 수 있습니다.

그림. AmiVoice API 개요

빠른 시작

1

APPKEY 취득

사용자 등록 페이지에서 등록하고, 마이페이지의 [연결 정보]에 표시된 APPKEY를 확인합니다. 다음 명령어로 환경 변수에 설정합니다.

export AMIVOICE_APPKEY=your_appkey_here
2

오디오 파일 준비

전사할 오디오 파일을 준비합니다. 아래의 샘플 오디오(test.wav)를 바로 사용할 수 있습니다.

지원하는 오디오 파일 형식에 대해서는 오디오 형식을 참조하세요.

3

음성 인식 실행

다음을 실행합니다. test.wav를 사용할 오디오 파일의 경로로 바꿔 주세요.

curl https://acp-api.amivoice.com/v1/recognize \
-F d=-a-general \
-F u=$AMIVOICE_APPKEY \
-F a=@test.wav | jq
4

결과 확인

성공하면 다음과 같은 JSON이 반환됩니다. text 필드에 전사 결과가 포함됩니다.

{
"results": [
{
"tokens": [ ... ],
"confidence": 0.998,
"starttime": 250,
"endtime": 8794,
"text": "アドバンスト・メディアは、人と機械との自然なコミュニケーションを実現し、豊かな未来を創造していくことを目指します。"
}
],
"utteranceid": "20220602/14/018122d637320a301bc194c9_20220602_141433",
"text": "アドバンスト・メディアは、人と機械との自然なコミュニケーションを実現し、豊かな未来を創造していくことを目指します。",
"code": "",
"message": ""
}

응답의 자세한 내용은 음성 인식 결과를 참조하세요.

다음 단계

API의 자세한 사용 방법은 다음 가이드를 참조하세요.

고급 기능 활용