- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 02_DAY 10 ๋ณธ๋ฌธ
๐ ๊ฐ๋ณํ์ต
[10] PyTorch Troubleshooting
1. OOM(Out Of Memory)
1) batch size๋ฅผ ์ค์ด๊ณ -> GPU๋ฅผ ๋น์ฐ๊ณ -> Run
2) GPU Util ์ฌ์ฉํ๊ธฐ
- nvidia-smi, Colab ๋ฑ์์ GPU ์ํ ํ์ธ
- iter๋ง๋ค ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋์ด๋๋์ง ํ์ธํ ๊ฒ
3) torch.cuda.empty_cache()
- ์ฌ์ฉํ์ง ์์ GPU ์ cache๋ฅผ ์ ๋ฆฌํด์ ๊ฐ์ฉ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํ๋ณด
4) training loop์ tensor๋ก ์ถ์ ๋๋ ๋ณ์ ํ์ธํ๊ธฐ
- tensor๋ก ์ฒ๋ฆฌ๋ ๋ณ์๋ GPU ์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ
- ํด๋น ๋ณ์๊ฐ loop ์ฐ์ฐ์ ์์ผ๋ฉด computation graph๋ฅผ ์์ฑ
5) del ๋ช ๋ น์ด ์ ์ ํ ์ฌ์ฉํ๊ธฐ
6) ๊ฐ๋ฅํ batch ์ฌ์ด์ฆ ์คํํด๋ณด๊ธฐ
- batch size 1๋ก ํด์ ์คํํด๋ณด๊ธฐ
7) torch.no_grad() ์ฌ์ฉํ๊ธฐ
2. ์์์น ๋ชปํ ์๋ฌ ๋ฉ์์ง
1) CUDNN_STATUS_NOT_INIT, device-side-assert ๋ฑ
- ์ ์ ํ ์ฝ๋ ์ฒ๋ฆฌ๊ฐ ํ์ํจ
2) colab์์ ๋๋ฌด ํฐ ์ฌ์ด์ฆ๋ ์คํํ์ง ๋ง ๊ฒ(linear, CNN, LSTM)
3) CNN์ ๋๋ถ๋ถ์ ์๋ฌ๋ ํฌ๊ธฐ๊ฐ ์ ๋ง์์ ์๊ธฐ๋ ๊ฒฝ์ฐ(torchsummary ํ์ฉ)
4) tensor์ float precision์ 16bit๋ก ์ค์ผ ์ ์์
๐ ์ค๋์ ํ๊ณ
์ค์ ์๋ ๋จ์ ํ์ดํ ์น ๊ฐ์ ํ๋ ๋ฃ๊ณ ! ๋๋์ด ํ์ดํ ์น ์ฃผ๊ฐ์ด ๋๋ฌ๋ค~ ํ์ง๋ง ๋ถ๋์ด๋ ๋ฐ์ดํฐ์ &๋ฐ์ดํฐ๋ก๋ ๋ถ๋ถ ๋ณต์ตํ๊ณ ์ด๋ฒ ์ฃผ ๋ง๋ฌด๋ฆฌ ํ๋๊ฑธ๋ก...! ์ค๋์ 1์๊ฐ์ฉ ์ค 3๊ฐ๋ฅผ ์ฐ๋ฌ์ ํ๋ ค๋ ์กฐ๊ธ์ ํ๋ ๋ ..^..ใ ์ฒ์์ผ๋ก ์คํ์ ํผ์ด์ธ์ ์ ์งํํ๋๋ฐ, ๋ค๋ฅธ ์กฐ์ ์๋ ์บ ํผ๋ถ๋ค๊ณผ ๋๋ค์ผ๋ก ๋ชจ์ฌ์ ์ด์ผ๊ธฐ ๋๋๋ ์๊ฐ์ด์๋ค. ์ฒ์ ๋ณด๋ ์บ ํผ๋ค๋ ์์ด์ ์ด์ํจ ์์ ์๊ธฐ์๊ฐ๋ ํ๊ณ , ํผ์ด์ธ์ ๋ ์ด๋ค ๊ฒ์ ํ๋์ง, ๋ฉํ ๋ง ์๊ฐ์๋ ๋ฌด์์ ํ๋์ง ์ง๋ฌธํ๋ฉด์ ์๊ฐ์ ๋ณด๋๋ค. ๋ด๋ฉด์์ ๊ฐ๋ ๋์ค๋ 19%์ E ์ฑํฅ์ ๊บผ๋ด์ ๋๋ฆ(?) ์ ๊ทน์ ์ผ๋ก ์ง๋ฌธํ๋ค.. ๋ค๋ฅธ ์บ ํผ๋ถ๋ค ๋๋ถ์ ์ค๋์ค ์ ๋น๊ณ 1์๊ฐ ๋์ ์ ์ตํ ์๊ฐ์ด์๋ ๊ฒ ๊ฐ๋ค. ๋ค์ ํผ์ด์ธ์ ์ผ๋ก ๋์์์ ๊ฐ์ ์คํ์ ํผ์ด์ธ์ ์์ ๋๋ ์ด์ผ๊ธฐ๋ค ๊ณต์ ํ๋๋ฐ ๊ณตํต์ ์ผ๋ก ๋ง์๋ ํ๋ ์ค ํ๋๊ฐ ๋ ผ๋ฌธ์ด์๋ค. ๊ทธ๋์ ์ฐ๋ฆฌ ์กฐ๋ ๋ ผ๋ฌธ ์ฝ๊ธฐ๋ฅผ ์์ํด๋ณด๋ ค๊ณ ํ๋๋ฐ, ์ฌ์ค ๊ฐ์๋ ๊ณผ์ ์์ ๋ณด๋ฉด ์๊ฐ๋ณด๋ค ํ ์ผ์ด ๋ง์์(ใ ใ ) ๋ค ์ํํ๋๋ฐ ๋ฌด๋ฆฌ๊ฐ ์์ง ์์๊นํด์ ๊ธฐ์ ์ ์ธ ๋ ผ๋ฌธ์ ์ฝ๊ธฐ๋ณด๋ค๋ ์ปดํจํฐ ๋น์ ์ ๋ค์ํ ๋ถ์ผ๋ค(detection, segmentation, GAN ๋ฑ..) ์์ฃผ๋ก ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๊ธฐ๋ก ํ๋ค!! ๋ง์คํฐํด๋์ค์์๋ ๋์์์ผ๋ก๋ง ๋ณด๋ ์ต์ฑ์ฒ ๊ต์๋๊ป์ Data Centric AI๋ผ๋ ์ฃผ์ ๋ก ๊ฐ์ฐ์ ํด์ฃผ์ จ๋๋ฐ, ์ ๋ง ์ฌ๋ฏธ์๋ PPT์ ์ธ์ ๊ตํ๋ค์ ๋จ๊ฒจ์ฃผ์๋ฉด์ ๋ง๋ฌด๋ฆฌํด์ฃผ์ จ๋ค. WEEK 02๋ ๋ฒ์จ ๋! ๋ค์ ์ฃผ๋ 10์์ด๋คใ -ใ
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 12 (0) | 2022.10.06 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 11 (0) | 2022.10.05 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 02_DAY 09 (0) | 2022.09.29 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 02_DAY 08 (0) | 2022.09.29 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 02_DAY 07 (0) | 2022.09.27 |