[๋ถ์คํธ์บ ํ AI Tech]WEEK 14_DAY 65
๐ ๊ฐ๋ณํ์ต
[3] Semantic Segmentation์ ๊ธฐ์ด์ ์ดํด
1. ๋ํ์ ์ธ ๋ฅ๋ฌ๋์ ์ด์ฉํ ์ธ๊ทธ๋ฉํ ์ด์ FCN
1) Abstract
(1) backbone(extracting feature) : VGG ๋คํธ์ํฌ
(2) VGG FC layer -> Convolution์ผ๋ก ๋์ฒด
(3) Transposed Convolution -> Pixel Wise Prediction ์ํ
2) VGG
- Image classifcation์์ ์ข์ ์ฑ๋ฅ
- pretrained network๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉํ ์ ์์
3) Fully Connected Layer vs Convolution Layer
- Convolution Layer : ๊ฐ ํฝ์ ์ ์์น ์ ๋ณด๋ฅผ ๊ทธ๋๋ก ๊ฐ์ ธ์ด
- Fully Connected Layer : flatten์ ํ๊ธฐ ๋๋ฌธ์ ์์น ์ ๋ณด๋ฅผ ํด์นจ
- 1x1 Conv๋ฅผ ์ฌ์ฉํ๋ ์ด์ : kernel์ ํ๋ผ๋ฏธํฐ์ ์ํด ์ํฅ์ ๋ฐ๊ณ , ์ด๋ฏธ์ง๋ ๋ ์ด์ด ํฌ๊ธฐ(height, width)์๋ ์๊ด ์์
4) Transposed Convolution
- ์ค์ด๋ ์ด๋ฏธ์ง๋ฅผ ๋ณต์ํ๋ ๊ณผ์ ์ด๊ธฐ ๋๋ฌธ์ upsampling
- convolution์ ์ญ์ฐ์ฐ์ด๊ธฐ ๋๋ฌธ์ deconvolution
- convolution์ transpose ํด์ transposed convolution
- ํ์ต ๊ฐ๋ฅํ ํ๋ผ๋ฏธํฐ๋ฅผ ํตํด์ ์ค์ด๋ ์ด๋ฏธ์ง๋ฅผ ๋ค์ ํค์ฐ๋ convolution
5) FCN์์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํ ๋ฐฉ๋ฒ
- MaxPooling์ ์ํด์ ์์ด๋ฒ๋ฆฐ ์ ๋ณด๋ฅผ ๋ณต์ํด์ฃผ๋ ์์ ์ ์งํ
- Upsampled Size๋ฅผ ์ค์ฌ์ฃผ๊ธฐ ๋๋ฌธ์ ํจ์จ์ ์ธ ์ด๋ฏธ์ง ๋ณต์ ๊ฐ๋ฅ
6) ํ๊ฐ ์งํ
- Pixel Accuracy : True pixel / Total pixel
- Mean IoU : ํด๋์ค๋ณ (Ground Truth∩Predict / Ground Truth∪Predict) ํ๊ท
๐ ์ค๋์ ํ๊ณ
๊ฐ์..๋ ๋ค์ด์ผ ํ์ง๋ง ์ค์ ์๋ ์ต์ข ํ๋ก์ ํธ ๊ด๋ จํด์ ์ด๋ค ๋ฐ์ดํฐ์ ์๋์ง, ์ด๋ค ์ฃผ์ ๋ก ํ๋ฉด ์ข์์ง ์๊ฐํด๋ณด์๋ค. ์๋๋ ์ฐจ๋ ํ์ ๊ด๋ จํด์ ํ๋ก์ ํธ๋ฅผ ์งํํ๋ ค๊ณ ํ๋๋ฐ, AI hub์์ ๋ฐ์ดํฐ๋ ๋ด๋ ค ๋ฐ์์ ํ๋์ฉ ๋ณด๊ณ , ์บ๊ธ์์๋ ์ด๋ค ๋ํ๋ค ์ด๋ ธ๋์ง ์ฐพ์๋ณด์๋ค. ์ด๋ค ํ๋ก์ ํธ๋ฅผ ์งํํ๋ ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ ธ์ผ ํ ์ ์์ผ๋ ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ์ฐพ์๋ณด๋ ์ ๋ฐ์ ์๋ ๊ฑฐ ๊ฐ๋ค. ๊ฐ์๋ ํ๋ ์ ๋ ๋ฃ๊ณ , ์๋ฒ ์ด์ด์ ssh ์ค์ ํ๋๋ฐ ์ ํ ๋๋ง๋ค ํท๊ฐ๋ฆฌ๋๊ฑธ๊น?(ใ ใ ) ํ์ํ ๊ฒ๋ค ๊น๊ณ ์ฃผ์ด์ง ๋ฒ ์ด์ค๋ผ์ธ ์ฝ๋๋ ์ดํด๋ณด์๋ค. ๋ฉํ ๋ง ๋์๋ segmentation ๋ํ ๊ด๋ จํด์ ๋ฉํ ๋์ด ๊ฐ๋จํ๊ฒ ๋ฆฌ๋ทฐํด์ฃผ์ จ๋ค. ํ detection ๋๋ ๊ทธ๋ ๊ณ ํ์คํ transformer ์ด์ฉํ ๋ชจ๋ธ์ด ๋ง์ด ๋์ค๋๊ฑฐ ๊ฐ๋ค..!