코파일럿은 어떤 형태를 다루는 지에 따라 구분됩니다.
- 텍스트
- 텍스트 다루기
- 텍스트로 작성된 내용을 기반으로 질의하거나 생성 지시하거나, 번역, 요약, 노트기록 할 수 있습니다.
- 코파일럿 기능들과 연계할 수 있습니다.
- 웹 페이지 다루기
- 웹 페이지 텍스트를 읽습니다.
- 문서 번역
- 문서를 번역합니다.
- 챗 로그 다루기
- 사용자와 코파일럿 에이전트의 챗 로그를 다룹니다.
- 텍스트 검색 증강, Pdf 검색 증강
- 텍스트 파일이나 Pdf 파일 내용으로 지식 기반을 구축하고, 구축된 지식 기반으로 검색 증강 생성을 할 수 있습니다.
- 텍스트 다루기
- 오디오
- 음성 인식
- 음성을 인식해 텍스트로 변환합니다.
- 음성 합성
- 텍스트를 음성으로 변환합니다.
- 스크립트 녹음
- 팟캐스트나 유튜브 영상 스크립트를 음성으로 녹음합니다.
- 실시간 음성 대화
- OpenAI의 실시간 오디오 기능을 사용합니다. “영어 말하기 튜터”와 같은 실시간 음성 대화를 위한 코파일럿 에이전트를 사용할 수 있습니다.
- 음성 인식
- 이미지 / 비전
- 이미지 생성
- 텍스트 설명으로 이미지를 생성합니다.
- 이미지 질의응답/생성
- 이미지 내용에 대해 질의하거나 텍스트 생성을 지시합니다.
- 광학 문자 인식(OCR)
- 이미지 글자를 텍스트로 인식합니다.
- 이미지 생성
Copilot is categorized based on the type of data it handles:
- Text
- Text Handling: Can answer questions, generate content based on written text, translate, summarize, and take notes. Can be linked with other Copilot features.
- Web Page Handling: Reads web page text.
- Document Translation: Translates documents.
- Chat Log Handling: Handles chat logs between the user and the Copilot Agent.
- Text Search Augmentation, PDF Search Augmentation: Builds a knowledge base from text or PDF files and uses it for search-augmented generation.
- Audio
- Speech Recognition: Converts speech to text.
- Speech Synthesis: Converts text to speech.
- Script Recording: Records podcasts or YouTube video scripts as audio.
- Real-time Voice Conversation: Uses OpenAI’s real-time audio feature. Enables Copilot Agents for real-time voice conversations, such as an “English Speaking Tutor.”
- Image / Vision
- Image Generation: Generates images from text descriptions.
- Image Q&A/Generation: Answers questions about image content or generates text based on images.
- Optical Character Recognition (OCR): Recognizes text within images.