- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 05_DAY 21 ๋ณธ๋ฌธ
๐ฅ ๊ฐ๋ณํ์ต
[8] Conditional Gereative Model
1. Conditional generative model
1) ์ฃผ์ด์ง '์กฐ๊ฑด'์ ๋์ํ๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๊ฒ ๋จ
2) Generative model vs. Conditional generative model
- Generative model : ๋จ์ํ random sample์ ์์ฑ
- Conditional generative model : condition์ ๋ง๋ random sample์ ์์ฑ
3) Conditional generative model์ ์์
- audio super resolution : ์ ํ๋ฆฌํฐ์ ์์ฑ์ ๊ณ ํ๋ฆฌํฐ ์์ฑ์ผ๋ก ๋ณํ
- machine translation : ๋ฒ์ญ๊ธฐ
- article generation with the title : ํ์ดํ๊ณผ ๋ถ์ ๋ชฉ์ด ์ฃผ์ด์ง๋ฉด ๊ด๋ จ๋ ๋ด์ฉ(article)์ ์์ฑ
4) Image-to-Image
- image๋ฅผ ๋ค๋ฅธ image๋ก translating
- Style Transfer, Super resolution, Colorization ๋ฑ
5) Example: Super resolution
- Input : ์ ํด์๋(LR) ์ด๋ฏธ์ง -> Output : ๊ณ ํด์๋(HR) ์ด๋ฏธ์ง
- Naive Regression model : MAE(L1) or MSE(L2) loss ์ฌ์ฉ
- Super Resolution GAN : Real HR Image์ Fake HR Image๋ฅผ ํ๋ณํจ
- MAE/MSE : ์์ฑ๋ patch๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ค๋ฅธ patch์์ error๋ฅผ ๊ณ์ฐํ์ฌ ์ ๋นํ ํ๊ท ์ด๋ฏธ์ง๋ฅผ ์์ฑ
- GAN : real data์ ๊ตฌ๋ถ ๋ชปํ๋ ๊ฒ ๋ชฉ์ ์ด๊ธฐ ๋๋ฌธ์ ๊ธฐ์กด์ blurryํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐ
2. Image translations GANs
1) Pix2Pix
(1) ๋ฌธ์ ์ ์
- ์ด๋ฏธ์ง๋ฅผ style๊ณผ ๊ฐ์ด ๋ค๋ฅธ ๋๋ฉ์ธ์ผ๋ก ๋ณํํ๋ ๊ฒ
- ์) label to street scene, label to facade, bw to color, aerial to map, day to night, edges to photo
(2) Loss function
- GAN loss : realistic ํ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ํจ
- L1 loss : blurry ํ ์ด๋ฏธ์ง ์์ฑ. ์ ๋นํ ๊ฐ์ด๋๋ฅผ ๋ง๋ฆ
(3) GAN loss์ ์ญํ
- L1 loss๋ง ์ฌ์ฉํ๋ฉด blurryํ ์ด๋ฏธ์ง๋ฅผ ์์ฑ
- GAN loss ๋ง ์ฌ์ฉํ๋ฉด sharpํ ์ด๋ฏธ์ง๊ฐ ๋ง๋ค์ด์ง์ง๋ง style ์ ์ง๊ฐ ๋์ง ์์
- L1 loss์ GAN์ ๋ชจ๋ ์ฌ์ฉํด์ผ style๋ ์ ์ง๋๊ณ sharpํ ์ด๋ฏธ์ง๊ฐ ๋ง๋ค์ด์ง
2) CycleGAN
(1) ๋ฌธ์ ์ธ์
- Pix2Pix์ ๊ฒฝ์ฐ pairwise data๋ฅผ ํ์๋ก ํจ
- unpaired data๋ก๋ image๋ฅผ ์์ฑํ ์ ์๋๊ฐ?
(2) CycleGAN์ ํน์ง
- non-pairwise dataset์ผ๋ก๋ ์ด๋ฏธ์ง translation์ด ๊ฐ๋ฅ
(3) Loss function - GAN Loss
- G : input X๋ก output Y๋ฅผ ์์ฑํ๋ generator
- F : input Y๋ก oupput X๋ฅผ ์์ฑํ๋ generator
- Dx : X style๋ก ๊ฐ๋์ง ํ๋ณํ๋ discriminator
- Dy : Y style๋ก ๊ฐ๋์ง ํ๋ณํ๋ discriminator
(4) Model Collapse
- GAN Loss๋ง ์ฌ์ฉํ ๋์ ๋ฌธ์ ์
- input์ ์๊ด์์ด ํ๋์ output๋ง์ ์์ฑ
- ์ด๋ค X(input image)๋ฅผ ๋ฃ๋ Y(realistic image)๊ฐ ๊ฐ์ -> Dy๋ Y๋ฅผ ๋ณด๊ณ ํญ์ realistic ํ๋ค๊ณ ํ๋จ -> G๊ฐ ์ํ๊ณ ์๋ค๊ณ ํ๋จ
- ๋ง์ฐฌ๊ฐ์ง๋ก Y๋ฅผ ๋ฃ์ผ๋ฉด ํญ์ X๊ฐ ๊ฐ์ -> Dx๋ X์ style๋ง ๋ณด๊ณ ๋ง๋ค๊ณ ํ๋จ -> F๊ฐ ์ํ๊ณ ์๋ค๊ณ ํ๋จ
(5) Cycle-consistency loss
- X -> Y / Y -> X ์์ ์ฐจ์ด๊ฐ ์์ผ๋ฉด ์ ๋จ(content๊ฐ ์ ์ง๋์ด์ผ ํจ)
3) Perceptual loss
(1) GAN train์ ์ด๋ ค์
- generator-discriminator ์ฌ์ด์ ๊ฒฝ์์ ํ๊ธฐ ๋๋ฌธ์ GAN์ ํ์ตํ๊ธฐ ์ด๋ ค์
- GAN ์์ด high-quality image๋ฅผ ์ป์ ์ ์๋?
(2) GAN loss vs. Perceptual loss
- GAN loss : train, ์ฝ๋ ์์ฑ์ด ์ด๋ ค์. pre-trained network ํ์ ์์. application ์ ์ฝ X
- Perceptual loss : train, ์ฝ๋ ์์ฑ ํธํจ. pre-trained network ํ์
(3) Observation
- Pre-trained classifier๊ฐ ์ฌ๋์ ์ง๊ฐ๋ฅ๋ ฅ๊ณผ ์ ์ฌํจ
- image๋ฅผ perceptual space๋ก ๋ณํ
(4) Perceptual loss
- Feature reconstruction loss : feature map ์ฌ์ด์ loss๋ฅผ ๊ตฌํ์ฌ content๋ฅผ ์ ์งํ๋์ง ํ์ธ
- Style reconstruction loss : feature map์ ํต๊ณ์ ํน์ฑ์ ํฌํจํ๋ gram matrix๋ฅผ ์์ฑํ์ฌ multiple feature map์ ์ป์
3. Various GAN applications
1) Deepfake
- ์ฌ๋์ ์ผ๊ตด์ด๋ ์์ฑ์ ๋ค๋ฅธ ์ผ๊ตด์ด๋ ์์ฑ์ผ๋ก ๋ฐ๊ฟ
2) Face de-identification
- ์ฌ๋์ ์ผ๊ตด์ ์๋ณํ์ง ๋ชปํ๊ฒ ๋น์ทํ ๋ชจ์ต์ผ๋ก ๋ฐ๊ฟ
3) Video translation
๐ฅ ์ค๋์ ํ๊ณ
์ค๋์ generative model ๊ฐ์๋ฅผ ๋ค์๋ค. generative model์ ํฅ๋ฏธ๋ก์ด ์ฃผ์ ์ด๊ธดํ๋ฐ ํ์ ์ ์ผ๋ก ํ๊ณ ๋ค๋ฉด ์ด๋ ค์ด.. ๊ฒ ๊ฐ๋ค.. ์ต๊ทผ์ ๋ฌ๋ฆฌ์ ๊ฐ์ ์์ฑ ๋ชจ๋ธ ์ฌ์ดํธ๊ฐ ์ธ๊ธฐ๋ฅผ ๋๊ณ ์๋๋ฐ, ๋จ์ํ ์ฌ๋ฏธ์๋ application์ผ๋ก๋ ์์ฉํ ์ ์์ง๋ง, ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฐ์๋ ์ค์ํ ์ญํ ์ ํ๊ณ ์์ด์ ๊ณ์ ์ฐ๊ตฌํ ๋งํ ์ฃผ์ ์ด๊ธฐ๋ ํ๋ค. ํผ์ด์ธ์ ๋์๋ perceptual loss์ ๋ํด์ ์ด์ผ๊ธฐํ๋๋ฐ loss๋ฅผ ์์์ ์ผ๋ก ํ๊ณ ๋ค๋ฉด ํท๊ฐ๋ฆฌ๋ ๋ถ๋ถ์ด ์๊ธฐ๋ ๊ฒ ๊ฐ๋ค. ๋ด์ผ์ ํ๋ฃจ ์ข ์ผ(..) ๊นํ๋ธ ํน๊ฐ์ด ์๋๋ฐ ๋ง์ง๋ง ํน๊ฐ์ธ๋งํผ ์ด์ฌํ ๋ค์ด์ผ์ง!
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 05_DAY 23 (0) | 2022.10.22 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 05_DAY 22 (1) | 2022.10.20 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 05_DAY 20 (0) | 2022.10.20 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 05_DAY 19 (0) | 2022.10.20 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 18 (0) | 2022.10.14 |