p112~113. Conv2D 레이어는 영상 인식에 주로 사용하며, 필터가 탑재되어 있다. 주요 인자는 다음과 같다.
- filters: 필터 수
- kernel_size: 커널의 (행, 열)
- padding: 경계 처리 방법을 정의한다.
- ‘valid’: 유요한 영역만 출력, 출력 이미지 사이즈는 입력 이미지 사이즈보다 작다. 깊은 층을 가진 모델인 경우 특징 맵이 계속 작아져서 정보가 많이 손실된다.
- ‘same’: 출력 이미지 사이즈가 입력 이미지 사이즈와 동일하다. 입력 이미지에 경계를 학습시키는 효과가 있다.
- input_shape: 샘플 수를 제외한 입력 형태를 정의한다. (행, 열, 채널 수)로 정의, 채널은 흑백영상인 경우 1, 컬러영상인 경우 3으로 설정한다.
- activation: 활성화 함수를 설정
입력 형태는 image_data_format이 ‘chnnels_first’인 경우 (샘플 수, 채널 수, 행, 열)로 이루어진 4D 텐서이고, image_data_format이 ‘chnnels_last’인 경우 (샘플 수, 행, 열, 채널 수)로 이루어진 4D 텐서이다. image_data_format 옵션은 keras.json 파일 안에 있는 설정이다.
출력 형태는 image_data_format이 ‘chnnels_first’인 경우 (샘플 수, 필터 수, 행, 열)로 이루어진 4D 텐서이고, image_data_format이 ‘chnnels_last’인 경우 (샘플 수, 행, 열, 필터 수)로 이루어진 4D 텐서이다. image_data_format 옵션은 keras.json 파일 안에 있는 설정이다.
p113. 필터는 가중치를 의미한다. 하나의 필터가 입력 이미지를 순회하면서 적용된 결과값을 모으면 출력 이미지가 생성된다.
- 동일한 가중치 사용 – 파라미터 공유, 학습해야 할 가중치 수를 현저하게 줄여준다. 위치에 무관하게 특징을 추출할 수 있다.
- 출력에 영향을 미치는 영역이 지역적으로 제한되어 있다. 지역적인 특징을 잘 뽑아내게 되어 영상 인식에 적합하다.
p116~118. 필터 마다 고유한 특징을 뽑아 고유한 출력 이미지를 만들어 내야 하기 때문에 필터의 수와 출력 이미지 수가 같다.
채널의 다수인 경우 채널의 수 만큼 커널의 계산이 늘어날 뿐 출력 이미지 수에는 영향을 주지 않는다.