- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 16 ๋ณธ๋ฌธ
๐ ๊ฐ๋ณํ์ต
[1] Computer Vision ์ด๋
1. Course Overview
1) AI๋ ์ฌ๋์ ์ง๋ฅ์ ์ปดํจํฐ๋ก ๊ตฌํํ ๊ฒ
2) ์ค๊ฐ(sight, sound, touch, taste, smell) + ๋ณต์กํ ๊ฐ๊ฐ(social, face, touch, speech)๋ก๋ ์ ๋ณด ํ๋ ๊ฐ๋ฅ
3) ์ธ๊ฐ์ ๋์ผ๋ก ์ด๋ค ์ฅ๋ฉด์ ๊ด์ฐฐํ๋ฉด -> ์์ ์ฒด ๋ค์ ์์ด ๋งบํ๊ณ -> ๋์ ์ ๋ฌ๋์ด -> ํด์ํจ
4) ์ปดํจํฐ๋ ์นด๋ฉ๋ผ๋ฅผ ํตํด ์์์ ์์ฑํ๊ณ -> ์๊ณ ๋ฆฌ์ฆ์ ํตํด ํด์ํ๊ณ -> high-level representation์ผ๋ก ๋ณํํจ
5) computer graphics : ์ ๋ณด๋ฅผ ํตํด ์์์ rendering ํ๋ ๊ฒ
- computer vision : computer graphics์ ์ญ๊ณผ์
6) ๋จธ์ ๋ฌ๋์์ ์ปดํจํฐ ๋น์ ์ ์ฐ๊ตฌ
- input(๋ฐ์ดํฐ ์ถ์ถ) -> feature extraction(์ ๋ฌธ๊ฐ๊ฐ ํน์ง ์ถ์ถ) -> classification(๋ถ๋ฅ) -> output(๊ฒฐ๊ณผ)
7) ๋ฅ๋ฌ๋์์ ์ปดํจํฐ ๋น์ ์ ์ฐ๊ตฌ
- input(๋ฐ์ดํฐ ์ถ์ถ) -> feature extraction + classification(end-to-end ๋ฐฉ์์ ํน์ง ์ถ์ถ๊ณผ ๋ถ๋ฅ) -> output(๊ฒฐ๊ณผ)
2. Image Classification
1) Input(์์) -> Classifier(๋ถ๋ฅ) -> Output(์นดํ ๊ณ ๋ฆฌ๋ ํด๋์ค์ ๊ฐ์ ์ถ๋ ฅ)
2) k Nearest Neightbors(k-NN) ๋ฐฉ์์ผ๋ก ๋ถ๋ฅ ๋ฌธ์ ํด๊ฒฐ
- ์ด ์ธ์์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ ๋ถ๊ฐํ๊ณ , image ๊ฐ ๊ด๋ จ์ฑ ์ ์๋ ์ด๋ ค์
3) Convolutional Neural Networks(CNN)
- ๋ฐฉ๋ํ ๋ฐ์ดํฐ๋ฅผ ์์คํ ์ ๋ น์ฌ ๋ฃ์
- Fully Connected Network(FCN)์ ๋ชจ๋ pixel์ ๊ณ ๋ คํ์ฌ ํ๋์ ํน์ง์ ๊ด์ฐฐ
- Locally Connected Network์ ๊ณต๊ฐ์ ํน์ฑ์ ๊ณ ๋ คํ์ฌ ๊ตญ๋ถ์ ์ผ๋ก ์ ํ
- backbone์ ๋ฐ๋ผ ๋ค์ํ task ์ํ
3. CNN architectures for image classification
1) AlexNet
- Conv - Pool - Conv - Pool - FC -FC ๊ตฌ์กฐ
- ๋ ๊น์ด์ง ๋ ์ด์ด(7 hidden layers)
- ๋ ๋ง์์ง ํ๋ผ๋ฏธํฐ(60 million parameters)
- ๋ ๋ง์ ๋ฐ์ดํฐ๋ก ํ์ต(ImageNet), ReLU ์ฌ์ฉ
- GPU ๋ฌธ์ ๋ก ๋ ๊ฐ๋๋ก ๋๋์ด์ ๊ทธ๋ ค์ง ๊ตฌ์กฐ๊ฐ ํน์ง. ์ผ๋ถ์์ cross connection์ผ๋ก ์ฐ๊ฒฐ๋์ด ์์
- Local Response Normalization(LRN) ์ฌ์ฉ -> ์ง๊ธ์ Batch Normalization ์ฌ์ฉ
- 11×11 conv filter ์ฌ์ฉ
- K×K conv, stride 1, P×P pool layer๊ฐ ์์ ๋, ์์ฑ๋๋ layer์ ํฌ๊ธฐ๋ (P+K-1)×(P+K-1)
2) VGGNet
- ๋ ๊น์ด์ง ๊ตฌ์กฐ(16, 19 layers)
- ๋ ๊ฐ๋จํ ๊ตฌ์กฐ(3×3 conv filters, 2×2 max pooling ์ฌ์ฉ)
- ๋ ๋์ ์ฑ๋ฅ(AlexNet๋ณด๋ค ์ฑ๋ฅ ํฅ์)
- ๋ ๋์ ์ผ๋ฐํ(fine-tuning ์์ด๋ ๋ค๋ฅธ task์ ์ ์ฉ ๊ฐ๋ฅ)
[2] Data Augmentation
1. Data augmentation
1) Neural Network๋ ๋ฐ์ดํฐ์ ์ ํน์ง์ ์์ถํ์ฌ ํ์ตํจ
2) train ๋ฐ์ดํฐ๋ ์ค์ ๋ฐ์ดํฐ์ ๊ทนํ ์ผ๋ถ์ ํด๋น
3) train ๋ฐ์ดํฐ์ ์ค์ ๋ฐ์ดํฐ ๊ฐ์ gap์ด ์กด์ฌ
- ์๋ฅผ ๋ค์ด train ๋ฐ์ดํฐ์ ์ด ๋ฐ์ ์์์ ์์ฃผ๋ก ๋ชจ๋ธ ํ์ต์ ์งํํ์ ๋, ์ค์ ๋ฐ์ดํฐ๋ก ์ด๋์ด ์์์ด ์ฃผ์ด์ง๋ฉด ๋ชจ๋ธ์ด ํผ๋์ค๋ฌ์ธ ์ ์์
4) augmentation data๋ train ๋ฐ์ดํฐ์ ์ค์ ๋ฐ์ดํฐ๊ฐ gap์ ์ค์ฌ์ฃผ๊ณ ๋ฐ์ดํฐ๋ฅผ ํ๋ถํ๊ฒ ๋ง๋ค์ด์ค
5) crop, shear, brightness, perspective, rotate ๋ฑ์ ํ์ฉ
2. Leveraging pre-trained infromation
1) ๋์ ํ์ง์ ๋ฐ์ดํฐ์ ์ ์ป๊ธฐ ์ํด์๋ ๊ทธ์ ๋ง๋ label์ด ํ์ํจ
2) transfer learning์ ์ฌ์ ์ง์์ ํ์ฉํด์ ์ฐ๊ด๋ task์ ์ ์ ๋ ธ๋ ฅ์ผ๋ก๋ ๋์ ์ฑ๋ฅ์ ๋๋ฌํ๋ ๊ฒ์ด ๋ชฉํ
3) ์ ๊ทผ ๋ฐฉ๋ฒ 1. conv layer ๋ค์ ์๋ก์ด FC layer๋ฅผ ๋ถ์ด๊ธฐ
4) ์ ๊ทผ ๋ฐฉ๋ฒ 2. conv layer๋ ๋ฎ์ learning rate๋ก ๋๋ฆฌ๊ฒ ํ์ตํ๊ณ , ์๋ก์ด FC layer๋ ๋์ learning rate๋ก ๋น ๋ฅด๊ฒ ํ์ตํ๊ธฐ
5) knowledge distillation(์ง์ ์ฆ๋ฅ)
- teacher-student learning : teacher(big model)์ ์ง์์ student(small model)๋ก ์ ๋ฌํ๋ ๋ฐฉ์
- Knowledge distillation : teacher model์ ๊ฒฐ๊ณผ์ ๋น์ทํ๊ฒ ์์ธก
- T(Softmax with temperature) : softmax์ ๊ฐ์ smoothํ๊ฒ ๋ฒ๋ ค์ค
์) (5, 10) -> (Normal Softmax) (0.0067, 0.9933)
-> (Softmax with temperature) (0.4875, 0.5125)
6) Hard label vs. Soft label
- Hard label(One-hot vector) : ์ ๋ต์ N๊ฐ ์ค ํ๋
- Soft label : 0~1 ์ฌ์ด์ ๊ฐ์ผ๋ก ๊ฒฐ๊ณผ๊ฐ ์กด์ฌ
7) Distillation Loss
- KL div(Soft label, Soft prediction)
- teacher network์ student network ๊ฐ์ ์ฐจ์ด (teacher network๊ฐ ์๋ ๊ฒ์ ํ์ต)
8) Student Loss
- CrossEntropy(Hard label, Soft prediction)
- student network์ true label ๊ฐ์ ์ฐจ์ด (right answer๋ฅผ ํ์ต)
3. Leveraging unlabeled datset for trainign
1) Semi-supervised learning : Unsupervised(No label) + Fully supervised(fully labeled)
2) Pseudo-labeling unlabeled data using pre-trained model
- labeled data๋ก๋ถํฐ ๋ชจ๋ธ ํ์ต
- pre-trained model์ ์ฌ์ฉํ์ฌ unlabeled data์์ label ์์ธก
- labeled dataset๊ณผ pseudo-labeled dataset์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ ํ์ต
3) Self-training : Augmentation + Teacher-Student networks + Semi-supervised learning
- labeled data๋ก teacher model ํ์ต
- teacher mdoel์ ์ฌ์ฉํ์ฌ unlabeled data์ pseudo-label ์์ฑ
- labeled data์ unlabled data๋ฅผ ์ฌ์ฉํ์ฌ student model ํ์ต
- student model์ ์๋ก์ด teacher model๋ก ๋ณด๊ณ , ์๋ก์ด student ๋ชจ๋ธ์ ํ์ต
- ์ด ๊ณผ์ ์ ๋ฐ๋ณต
๐ ์ค๋์ ํ๊ณ
์ค์ ์๋ ์ปดํจํฐ ๋น์ ๋๋ฉ์ธ ๊ฐ์๋ฅผ ๋ค์๋ค! ๊ฐ์ ๋ฃ๊ณ ๊ณผ์ ํด๋ณด๋๋ฐ Resnet ๊ตฌํ๊ณผ Augmentation์ ์ด์ฉํ์ฌ ๋ชจ๋ธ ํ์ตํ๋ ๊ณผ์ ๋ฅผ ํด๋ณด์๋ค. Resnet ๊ตฌํ์ ์ด๋ ต๋ค.. ๋ด์ผ ๋ค์ ํ ๋ฒ ๋์ ํด๋ณด๊ธฐ๋ก.. ํผ์ด์ธ์ ๋์๋ Level 2 ๊ณผ์ ์์ ์๋ก์ด ํ ๋น๋ฉ์ ์ด๋ป๊ฒ ํ ์ง, ๊ฐ์ ๊ด์ฌ ์๋ ๋ถ์ผ๋ ์ด๋ค ๊ฒ์ด ์๋์ง ์ด์ผ๊ธฐํ๋ ์๊ฐ์ ๊ฐ์ก๋ค. ๋๋ ํ์ ์ฐพ๊ธฐ์ ์์ง ๊ธ์ ๋ชป ์ฌ๋ ค์ ์ด๋ค ํ๋ก์ ํธ ํ๊ณ ์ถ์์ง, ์ด๋ค ํ๋ก์ ํธ ๊ฒฝํํด๋ดค๋์ง ์ ๋ฆฌํด๋ดค๋ค. ์ฌ์ ํ ์ด๋ค ๋ถ์ผ๋ก ๊ฐ์ผํ ์ง๋ ์ง์ง ์ ๋ชจ๋ฅด๊ฒ ๋ค.. ๋ถ์บ ์ค๋ชฐํก ์๊ฐ์๋ ZEP์์ ๊ฐ๋จํ ๋คํธ์ํน ํ๋ ์๊ฐ์ ๊ฐ์ก๋๋ฐ, ZEP ๋ฉํ๋ฒ์ค ์ ๊ธฐํ๋ค +_+ ๋ค์ํ ๋ถ๋ค๋ ๋ง๋๋ฉด์ ํ์คํ๊ฒ ์๊ธฐ ๋ถ์ผ๊ฐ ์ ํด์ง ๋ถ๋ค์ด ์ ๋ง ๋ถ๋ฌ์ ๋ค.. ํ ๊พธ๋ฆฌ๊ธฐ ์ ์ ํ์คํ๊ฒ ๋ถ์ผ ํ๋๊ฐ ์ ํด์ผ๊ฒ ๋ค๊ณ ์๊ฐํ๋ค...
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 18 (0) | 2022.10.14 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 17 (0) | 2022.10.14 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 15 (0) | 2022.10.12 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 14 (0) | 2022.10.11 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 13 (0) | 2022.10.07 |