목차
0. Abstract
1. Introduction
2. Deformable Convolution
3. Deformable ROI pooling
4. Performance
0. Abstract
1. Introduction
2. Deformable Convolution
3x3 deformable convolution
그림을 보면 input feature map에서 2 branch로 나뉘진다. 1 branch는 offset을 계산하는 conv layer이고, 또 다른 branch는 offset 정보를 받아 conv 연산을 수행해 output feature map을 생성한다.
즉, conv layer로 offset을 계산한 뒤에, 이 offset 정보를 추가하여 conv 연산을 수행합니다.
델타 P는 추가된 offset을 의미한다.
offset이 추가 되어 좀 더 넓은 범위의 grid 영역에서 특징을 추출합니다. 이 때 문제는 offset은 실수이기 때문에 해당 픽셀값을 찾을 수 없다는 것이고, 문제는 쌍선형 보간법을 통해 계산합니다. (쌍선형 보간법에 대해서는 구글링..)
3x3 deformable convolution의 예 (1)
해당 activation 물체에 맞게 필터가 조정되며, 해당 물체에만 잘 fitting 되는 모습을 볼 수 있다!
3x3 deformable convolution의 예 (2)
붉은 점 : deformable convolution filter에서 학습한 offset을 반영
일정하게 샘플링 패턴이 고정되어 있지 않고, 큰 object에 대해서는 receptive field가 더 커진 것을 확인할 수 있습니다.
3. Deformable ROI pooling
전개 논리는 Deformable conv와 동일하다.
(RoI Pooling 이란 Fast RCNN에서 원하는 위치(regions)의 feature를 max pooling 하여 고정된 크기로 만들기 위한 layer)
수식 (위쪽이 스탠다드, 아래쪽이 deformable)
Deformable conv와 다른 점
- offset 값을 convolution이 아닌, fully-connected 연산을 통해 구함
- 쌍선형 보간법 적용은 동일
deformable RoI pooling을 사용했을 때, RoI에 해당하는 붉은 사각형의 모양이 object 형태에 따라 다양한 형태로 변형되는 것을 볼 수 있다.
4. Performance
성능 향상을 확인할 수 있다.
결론
•배경이나 큰 물체의 경우에 넓은 범위의 receptive field가 필요하다
'AI 논문 공부' 카테고리의 다른 글
FPN : Feature Pyramid Net 논문 리뷰 (0) | 2023.02.06 |
---|---|
R-CNN, Fast R-CNN, Faster R-CNN 논문 리뷰 (1) | 2023.01.27 |
resnet 논문 리뷰 (1) | 2023.01.07 |
GoogleNet 논문 리뷰 (0) | 2022.12.30 |
vggNet 논문 리뷰 (0) | 2022.11.30 |