OpenAI Docs – Audio and speech API – Voice agents

고객 지원 및 언어 튜터링과 같은 애플리케이션을 위한 강력하고 상황 인식적인 음성 에이전트를 만드세요. 이 가이드는 음성 에이전트를 설계하고 구축하는 데 도움이 됩니다.   올바른 아키텍처 선택 OpenAI는 음성 에이전트를 구축하기 위한 두 가지 주요 아키텍처를 제공합니다. 음성-음성(멀티모달) 체인(음성-텍스트 → LLM → 텍스트-음성) 음성-음성(멀티모달) 아키텍처 멀티모달 음성-음성(S2S) 아키텍처는 오디오 입력...

OpenAI Docs

음성 관련 OpenAI Realtime API Audio and speech API Audio and speech API – Voice agents    관련 글 Smarteasy와 글 읽기 – New audio models from OpenAI, but how much can we rely on them?  

OpenAI Docs – Audio and speech API

OpenAI API는 오디오 애플리케이션 또는 음성 에이전트를 빌드하는 데 도움이 되는 여러 API 엔드포인트를 제공합니다. 오디오 사용 사례 둘러보기 음성 에이전트 음성 에이전트는 오디오를 이해하여 작업을 처리하고 자연어로 응답합니다. 음성 에이전트에 접근하는 방법에는 크게 두 가지가 있습니다. 음성-음성 모델과 Realtime API를 사용 음성-텍스트 모델, 요청을 처리하는 텍스트 언어 모델, 응답하는...