- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 14 ๋ณธ๋ฌธ
๐ฑ ๊ฐ๋ณํ์ต
[7] Recurrent Neural Networks
1. Sequential Model
1) Naive sequence model : ์ด์ ๋ฐ์ดํฐ๋ก ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์์ธกํจ
2) Autoregressive model : ๊ณผ๊ฑฐ์ τ๊ฐ๋ก ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์์ธกํจ
3) Markov model : ๋ฐ๋ก ์ง์ ๊ฐ๋ง ์ํฅ์ ๋ฐ์
4) Latent autoregressive model : hidden state๋ก ๊ณผ๊ฑฐ์ ์ ๋ณด๋ฅผ ๊ธฐ์ต, ์์ฝ
2. Recurrent Neural Network
1) Recurrent Neural Network : ๋ชจ๋ธ์ ์ถ๋ ฅ์ด ๋ค์ ์ ๋ ฅ์ผ๋ก ๊ฐ๋ ๊ตฌ์กฐ
2) ๋จ์ : Long-term dependencies
- ๋คํธ์ํฌ์ ํฌ๊ธฐ๊ฐ ํด์๋ก ๊ณผ๊ฑฐ์ ์ ๋ณด๋ฅผ ์์ด๋ฒ๋ฆด ์ ์์
- vanishing/exploding gradient ๋ฌธ์
3. Long Short Term Memory(LSTM)
1) ๊ตฌ์กฐ
- Input
- Output
- Gate : Forget gate, Input gate, Output gate
- Cell state : Previous cell state, Next cell state
- Hidden state : Previous cell state, Next cell state
2) Forget gate : ์ด๋ค ์ ๋ณด๋ฅผ ๋ฒ๋ฆด์ง
3) Input gate : ์ด๋ค ์ ๋ณด๋ฅผ ์ ์ฅํ ์ง
4) Update cell : cell state์ ์ ๋ฐ์ดํธ
5) Output gate : ์ด๋ค ๊ฐ์ ๋ฐ์ผ๋ก ๋ด๋ณด๋ผ์ง
[8] Transformer
1. Transformer
1) attention ๊ตฌ์กฐ๋ฅผ ํ์ฉํ ์ํ์ค ๋ณํ ๋ชจ๋ธ
2) ๊ธฐ๊ณ์ด ๋ฒ์ญ ๋ฑ์ ์ฌ์ฉ
3) encoder-decoder ๊ตฌ์กฐ๋ก ๊ตฌ์ฑ
4) ํ๋์ encoder๋ self-attention, feed-forward๋ก ๊ตฌ์ฑ
- self-attention์ path๋ ์์กด์ (dependency)
- feed-forward์ path๋ ๋ ๋ฆฝ์ (independency)
๐ฑ ์ค๋์ ํ๊ณ
๋ง๋ฌด๋ฆฌํ์ง ๋ชปํ ๊ธฐ๋ณธ ๊ณผ์ ๊ฐ ์์ด์ ์ค์ ์๋ ๊ฐ์ ๋ฃ๊ณ ๊ธฐ๋ณธ ๊ณผ์ ํ์ด์ ์ ์ถํ๋ค. ์คํ์๋ transformer ๊ฐ์๋ฅผ ๋ค์๋๋ฐ... ์ด๋ ต๋ค.. ์ฌ์ค ๊ฐ์ ๋ด์ฉ์ ์ ๋ถ ์ํํ์ง ๋ชปํด์ ์์ฌ์ ๋ค.. ๋คํํ๋ ํผ์ด์ธ์ ๋ ๋ค๋ฅธ ์บ ํผ๋ถ์ด generative model์ ๋ํด์ ์ค๋ช ํด์ฃผ์ ์ ๊ทธ๋๋ง ์ดํด๊ฐ ๊ฐ๋ค! ๊ธ์์ผ์ ์คํ์ ํผ์ด์ธ์ ๋ ์ค๋น๋์ด ์๋ ๋ ! ๋ค๋ฅธ ์บ ํผ๋ถ๋ค์ด๋ ๋ง๋์ ์ด๋ค ๋ถ์ผ์ ๊ด์ฌ ์๋์ง, ํผ์ด์ธ์ ์ ์ด๋ป๊ฒ ์ด์ํ๊ณ ์๋์ง์ ๋ํด์ ์ด์ผ๊ธฐ ๋๋์๋ค. ์ด๋ฒ ์ฃผ๊น์ง๊ฐ level 2๋ฅผ ์ํ ์กฐ๋ฅผ ์ง๋ ์๊ฐ์ธ๋ฐ ์ด๋ค ์ฃผ์ ๋ก ์ด๋ป๊ฒ ํ๋ก์ ํธ๋ฅผ ์งํํด์ผ ํ ์ง ์์ง๊น์ง๋ ๊ฐ์ด ์ ์ ์จ๋คใ ใ ์คํผ์ค์์์๋ ์ฌํ ๊ณผ์ ์ ๋ํ ์ค๋ช ํ๋ ์๊ฐ์ ๊ฐ์ก๋๋ฐ, ์์ํ๋ ์ธํธ๋ก ๋ ธ๋๊ฐ ๋ด์ง์ค์ Attention.. (is all you need) (๊ตฟ!) ๋ค์ ์ฃผ๋ถํฐ๋ ์, ํ, ์ ํผ์ด์ธ์ ๋ ํ๋ ์ผ์ด ๊ฑฐ์ ์๋๊ฑฐ ๊ฐ์์ ๋ฐ์ด์ฝ ๋ํ๋ฅผ ์์ํ๊ธฐ๋ก ํ๋ค!
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 16 (0) | 2022.10.13 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 04_DAY 15 (0) | 2022.10.12 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 13 (0) | 2022.10.07 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 12 (0) | 2022.10.06 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 03_DAY 11 (0) | 2022.10.05 |