업무 파일럿(업무 전문가)를 위한 프롬프트 엔지니어링: 실전 가이드 – 1. 프롬프트 엔지니어링 06. 고급 기법 3. Multimodal CoT
|0 Comment
3. Multimodal CoT 다중 모달 CoT 기법입니다. 두 단계로 구성됩니다. 첫 번째 단계에서는 다중 모달 정보를 기반으로 이성을 생성합니다. 이미지가 비전으로 사용되는 경우라면, 이미지 내용을 읽습니다. 음성이나 영상이 사용되는 경우라면, 음성을 인식하거나 영상 내용을 읽습니다. 두 번째 단계는 생성된 정보를 활용한 답변을 추론합니다. 이 단계에서 CoT 기법을 활용할 수 있습니다....