hye-log

[부스트캠프 AI Tech]WEEK 14_DAY 67 본문

Boostcourse/AI Tech 4기

[부스트캠프 AI Tech]WEEK 14_DAY 67

iihye_ 2022. 12. 23. 16:13

🎄 개별학습


[5] FCN의 한계를 극복한 model 2 - 성능적인 측면에서의 극복

1. Receptive Field를 확장시킨 models

1) DeepLab v2

(1) DeepLab vs DeepLab v2

- conv에서 3x3 maxpool layer가 삭제됨

- fc6, fc7, fc8 layer가 추가됨

- ResNet-101 구조 사용

2) PSPNet

(1) 도입 배경

- Mismatched Relationship : 객체들 간의 관계를 catch하지 못함

- Confusion Categories : categories 혼돈하여 예측

- Inconspicuous Classes : 객체가 작아서 잘 예측하지 못함

(2) Architecture - Pyramid Pooling Module

- feature map에 average pooling을 적용해 sub-region을 생성

- sub-region 각각에 conv 진행하여 channel이 1인 feature map 생성

- feature map과 pyramid pooling module을 upsampling한 output을 서로 concat

3) DeepLab v3

(1) Architecture

Chen, L. C., Papandreou, G., Schroff, F., & Adam, H. (2017). Rethinking atrous convolution for semantic image segmentation.  arXiv preprint arXiv:1706.05587 .

- Global average pooling 추가 : feature map 평균 내서 1x1 크기로 만들어줌

4) DeepLab v3+

(1) Architecture

Chen, L. C., Zhu, Y., Papandreou, G., Schroff, F., & Adam, H. (2018). Encoder-decoder with atrous separable convolution for semantic image segmentation. In  Proceedings of the European conference on computer vision (ECCV)  (pp. 801-818).

- Encoder-Decoder 구조 : Encoder에서 spatial dimension의 축소로 손실된 정보를 decoder에서 점진적으로 복원

- modified Xception Backbone : 각 채널마다 다른 filter를 사용하여 conv 연산 후 결합

 

5) 정리



🎄 오늘의 회고

mmsegmentation 코드를 본격적으로 살펴보기 시작..!! mmsegmentation은 예전에 사용했을 때 시드 고정을 안 해서(...) 모든 실험을 다시 한 경험이 있는 패키지이기 때문에 시드 고정부터 하려고 코드 이곳저곳을 찾아보았다. 처음에는 parser에 정의 되어 있는 랜덤 시드만 고정하면 되는 줄 알았는데, 1 에포크 씩 실험해보니까 뭔가 시드가 고정되지 않았는지 계속 값이 다르게 나왔다.. 이것저것 찾아보기도 하고 피어세션을 이용해서 이야기도 해보았는데 deterministic 을 적용해도 계속 고정이 안 되었다.. 왜지.. 왜 안 되는 걸까....😥(아직도 원인을 못 찾음..)

728x90
Comments