- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 09_DAY 43 ๋ณธ๋ฌธ
๐ฟ ๊ฐ๋ณํ์ต
[5] 1 Stage Detectors
1. 1 Stage Detectors
1) Background
(1) 2 Stage Detectors
- RCNN, FastRCNN, SPPNet, FasterRCNN, ...
- Localization(ํ๋ณด ์์ญ ์ฐพ๊ธฐ) -> Classification(ํ๋ณด ์์ญ์ ๋ํ ๋ถ๋ฅ)
- ์๋๊ฐ ๋๋ฆผ -> real world์์ ์ฌ์ฉํ๊ธฐ ์ด๋ ค์
(2) 1 Stage Detectors
- Yolo, SSD, RetinaNet, ...
- Localization & Classification ๋์์ ์งํ
- ์ ์ฒด ์ด๋ฏธ์ง์ ๋ํด ํน์ง ์ถ์ถ, ๊ฐ์ฒด ๊ฒ์ถ์ด ์ด๋ฃจ์ด์ง -> ๊ฐ์ฒด์ ๋ํ ๋งฅ๋ฝ์ ์ดํด๊ฐ ๋์
- ์๋๊ฐ ๋น ๋ฆ (real-time detection)
2) History
2. YOLO v1
1) Overview
- ์ ์ฒด ์ด๋ฏธ์ง์์ bounding box + class ์์ธก์ ๋์์ ์งํ
2) Pipeline
(1) GoogleNet์ ๋ณํ
- 24๊ฐ์ conv layer ๋ก ํน์ง ์ถ์ถ
- 2๊ฐ์ fully connected layer ๋ก box ์ขํ๊ฐ ๋ฐ ํ๋ฅ ๊ณ์ฐ
(2) ์์
- ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ S×S ๊ทธ๋ฆฌ๋ ์์ญ์ผ๋ก ๋๋๊ธฐ
- ๊ฐ ๊ทธ๋ฆฌ๋๋ง๋ค B๊ฐ์ bounding box์ confidence score ๊ณ์ฐ
- ๊ฐ ๊ทธ๋ฆฌ๋๋ง๋ค C๊ฐ์ class์ ๋ํ ํด๋์ค ํ๋ฅ ๊ณ์ฐ
3) Result
- Faster R-CNN์ ๋นํด 6๋ฐฐ ๋น ๋ฅธ ์๋
- ๋ค๋ฅธ real-time detector์ ๋นํด 2๋ฐฐ ๋์ ์ ํ๋
- ์ด๋ฏธ์ง ์ ์ฒด๋ฅผ ๋ณด๊ธฐ ๋๋ฌธ์ ํด๋์ค์ ์ฌ์ง์ ๋ํ ๋งฅ๋ฝ์ ์ ๋ณด๋ฅผ ํฌํจํ๊ณ ์์
- ๋ฌผ์ฒด์ ์ผ๋ฐํ๋ ํํ์ ํ์ต -> ์๋ก์ด ๋๋ฉ์ธ๊ณผ dataset์๋ ์ฑ๋ฅ์ด ์ข์
3.SSD
1) Overview
(1) YOLO์ ๋จ์
- 7×7 ๊ทธ๋ฆฌ๋ ์์ญ์ผ๋ก ๋๋๊ธฐ ๋๋ฌธ์ ๊ทธ๋ฆฌ๋๋ณด๋ค ์์ ํฌ๊ธฐ์ ๋ฌผ์ฒด๋ ๊ฒ์ถํ์ง ๋ชปํจ
- ๋ง์ง๋ง feature๋ง ์ฌ์ฉํ์ฌ ์ ํ๋๊ฐ ํ๋ฝํจ
(2) YOLO vs SSD
- YOLO : 448×448 / SSD : 300×300
- YOLO : FC layer๋ก ์ธํด์ ์๋๊ฐ ๋๋ ค์ง / SSD : 1×1 conv๋ฅผ ์ฌ์ฉํ์ฌ ์๋๊ฐ ๋น ๋ฆ
- YOLO : ๋ง์ง๋ง feature์์ detection / SSD : ๋ง์ง๋ง feature map์์ extra feature layer๋ฅผ ์ด์ฉํ์ฌ detection ์ํ
(3) SSD์ ํน์ง
- extra conv layers์์ ๋์จ ๋ชจ๋ feature map์์ detection ์ํ
-> ํฐ feature map์ ์์ ๋ฌผ์ฒด ํ์ง. ์์ feature map์ ํฐ ๋ฌผ์ฒด ํ์ง
- FC ๋์ conv layer ์ฌ์ฉํ์ฌ ์๋ ํฅ์
- Default box ์ฌ์ฉ(anchor box)
2) Pipeline
- VGG-16(backbone) + Extra Conv Layers
- ์ ๋ ฅ ์ด๋ฏธ์ง 300×300
- Multi-scale feature map ์ฌ์ฉ
4. YOLO Follow-up
1) YOLO v2
(1) Concepts
- ์ ํ๋(better), ์๋(faster), ๋ ๋ง์ ํด๋์ค ์์ธก(stronger) ํฅ์
(2) ์ ํ๋
- batch normalization
- high resolution classifier : 448×448 ์ด๋ฏธ์ง๋ก ์๋กญ๊ฒ fine tuning
- convolution with anchor boxes : FC ์ ๊ฑฐํ๊ณ anchor box ๋์
- fine-grained features : early feature map์ late feature map์ ํฉ์ณ์ฃผ๋ passthrough layer
- multi-scale training : ๋ค์ํ ์ ๋ ฅ ์ด๋ฏธ์ง ์ฌ์ฉ
(3) ์๋
- Darknet-19 ์ฌ์ฉ
(4) ๋ ๋ง์ ํด๋์ค ์์ธก
- Imagenet, Coco ํจ๊ป ์ฌ์ฉ
- wordtree ๊ตฌ์ฑ(๊ณ์ธต์ ์ธ ํธ๋ฆฌ)
2) YOLO v3
(1) Darknet-53
- skip connection ์ ์ฉ
- max pooling X, conv stride 2 ์ฌ์ฉ
(2) Multi-scale Feature maps
- ์๋ก ๋ค๋ฅธ 3๊ฐ์ scale ์ฌ์ฉ
- FPN(Feature Pyramid Network) ์ฌ์ฉ
5. RetinaNet
1) Overview
(1) 1 Stage Detector Problems
- Class imbalance : ๊ฐ์ฒด ๋ณด๋ค ๋ฐฐ๊ฒฝ ์์ญ์ด ๋ ๋ง์
- Anchor box ๋๋ถ๋ถ Negative Samples(background)
2) Concept
(1) ์๋ก์ด loss function ์ ์ : cross entropy loss + scailing factor -> ์ฌ์ด ์์ ์ ์์ ๊ฐ์ค์น, ์ด๋ ค์ด ์์ ์ ํฐ ๊ฐ์ค์น
(2) Focal loss
- 1 stage method์ ๋จ์ ์ด์๋ ์ฑ๋ฅ์์ ํฐ ํฅ์์ ์ด๋ฃธ
- Class imbalance๊ฐ ์ฌํ Dataset์ ํ์ตํ ๋ ์ฌ์ฉ
๐ฟ ์ค๋์ ํ๊ณ
1 Stage Detector ๊ฐ์ ๋ค์ผ๋ฉด์ ํ๋ฃจ ์์! 2 Stage ๋ง ๋ณด๋ค๊ฐ 1 Stage ๋ณด๋๊น ํ์คํ ๋ชจ๋ธ์ด ๊ฐ์ฒด๋ฅผ ํ์งํ๋ ๊ณผ์ ์ด ๊ฐ๋จํด์ ธ์ ์ฑ๋ฅ ํฅ์์ ์ด๋ค๋ค๋ ์ ์ด ํน์ง์ด๋ค. ๋ํ ๊ด๋ จ์ผ๋ก๋ mmdetection, detectron ๋ฑ ๋ค์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์์ง๋ง, mmdetection์ด config ํ์ผ๋ง ๋ฐ๊ฟ์ ์คํํ ์ ์์ด์ ๊ฐ๋จํ๊ณ , ๋ค์ํ ๋ชจ๋ธ์ ์ ์ฉ์์ผ๋ณผ ์ ์๊ธฐ ๋๋ฌธ์ mmdetection์ ์ฌ์ฉํ๊ธฐ๋ก ํ๋ค. mmdetection์ wandb๋ฅผ ์ฐ๊ฒฐํ๋ ์ฝ๋๋ฅผ ์์ฑํ๋ค๊ฐ ์๋ฌ๊ฐ ๋์.. ํด๊ฒฐํ๋๋ผ ์กฐ๊ธ ์ด๋ ค์ ์ง๋ง.. (์กฐ๊ธ.. ์กฐ๊ธ ์ด๋ ค์ ๋๊ฑธ๋ก..) ๊ทธ๋๋ wandb์ ์ฐํ๋ log๋ฅผ ๋ณด๋๊น ํ์คํ ์๊ฐํ๋ผ๋ ํจ๊ณผ๊ฐ ๋๋จํ๋ค๊ณ ๋๊ผ๋ค! ์ด์ wandb ์ฐ๊ฒฐ๋ ํ์ผ๋ dataset ๊ตฌ์ฑํ๊ณ ์ด๋ป๊ฒ ๋ชจ๋ธ ๋๋ฆด์ง๋ง ๊ณ ๋ฏผํ๋ฉด ๋๋ค! ํผ์ด์ธ์ ๋์๋ ์ด๋ฒ ์ฃผ ํ ํ๊ณ ๋ฅผ ์์ฑํ๊ณ , detection task์ ์ ์ฉํ ์ ์๋ augmentation์ ๋ํด์ ๋ ผ์ํด๋ณด์๋ค. detection์ด๋ผ bounding box๋ฅผ ์ด๋ป๊ฒ ํด๊ฒฐํ ์ง๊ฐ ํฐ ๊ด๊ฑด...(!!!) ๋ฒ์จ level 2์ ํ ์ฃผ๊ฐ ์ง๋ฌ๋๋ฐ ํ์คํ level 1 ์ ํ ์ฃผ๋ณด๋ค ๋นจ๋ฆฌ ์ง๋๊ฐ๋ ๊ฒ ๊ฐ๋ค(์ ์ํด์ ๊ทธ๋ฐ๊ฐ)๐ค
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 10_DAY 45 (0) | 2022.11.23 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 10_DAY 44 (0) | 2022.11.22 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 09_DAY 42 (1) | 2022.11.18 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 09_DAY 41 (0) | 2022.11.16 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 09_DAY 40 (0) | 2022.11.16 |