hye-log

[๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech]WEEK 01_DAY 04 ๋ณธ๋ฌธ

Boostcourse/AI Tech 4๊ธฐ

[๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech]WEEK 01_DAY 04

iihye_ 2022. 9. 22. 21:28

๐ŸŒŸ ๊ฐœ๋ณ„ํ•™์Šต


[8] ๋ฒ ์ด์ฆˆ ํ†ต๊ณ„ํ•™ ๋ง›๋ณด๊ธฐ

1. ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ 

1)  P(A ∩ B) = P(B) P(A | B)

+ P(A | B) = P(A ∩ B) / P(B)

+ P(A | B) ๋Š” ์‚ฌ๊ฑด B๊ฐ€ ์ผ์–ด๋‚  ์ƒํ™ฉ์—์„œ A๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ 

2) P(B | A) = P(A ∩ B) / P(A) = P(B) *  P(A | B) / P(A)

+ A ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ P(B)๋กœ๋ถ€ํ„ฐ P(B | A)๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ๊ณต

3) P( θ | D ) = P( θ ) * P( D | θ ) / P( D )

P( θ | D ) : ์‚ฌํ›„ํ™•๋ฅ (posterior). ์ƒˆ๋กœ ๊ด€์ฐฐํ•˜๋Š” ๋ฐ์ดํ„ฐ์ธ D๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ์˜ ํ™•๋ฅ 

P( θ ) : ์‚ฌ์ „ํ™•๋ฅ (prior)

P( D | θ ) : ๊ฐ€๋Šฅ๋„(likehood). ๋ฐ์ดํ„ฐ D๊ฐ€ ๊ด€์ฐฐ๋  ํ™•๋ฅ 

P( D ) : Evidence. ๋ฐ์ดํ„ฐ D ์ „์ฒด์˜ ๋ถ„ํฌ

(์˜ˆ) ์–ด๋–ค ์งˆ๋ณ‘์˜ ๋ฐœ๋ณ‘๋ฅ  10%, ์‹ค์ œ ๊ฑธ๋ ธ์„ ๋•Œ ๊ฒ€์ง„๋  ํ™•๋ฅ  99%, ์‹ค์ œ ๊ฑธ๋ฆฌ์ง€ ์•Š์•˜์„ ๋•Œ ์˜ค๊ฒ€์ง„๋  ํ™•๋ฅ  1%๋ผ ํ•  ๋•Œ, 

์งˆ๋ณ‘์— ๊ฑธ๋ ธ๋‹ค๊ณ  ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”์„ ๋•Œ ์ •๋ง๋กœ ์งˆ๋ณ‘์— ๊ฐ์—ผ๋˜์—ˆ์„ ํ™•๋ฅ ์€?

θ : ์งˆ๋ณ‘(๊ด€์ฐฐ ๋ถˆ๊ฐ€) / D : ํ…Œ์ŠคํŠธ ๊ฒฐ๊ณผ(๊ด€์ฐฐ ๊ฐ€๋Šฅ)

P( θ ) = 0.1

P( D | θ ) = 0.99

P( D | ~θ ) = 0.01

P( D ) = ∑ P( D | θ ) P( θ ) = P( D | θ ) P( θ ) + P( D | ~θ ) P( ~θ ) = 0.99 * 0.1 + 0.01 * 0.9 = 0.108

P( θ | D ) = 0.1 * (0.99 / 0.108) ~= 0.916

4) ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ์•ž์„œ ๊ณ„์‚ฐํ•œ ์‚ฌํ›„ํ™•๋ฅ ์„ ์‚ฌ์ „ํ™•๋ฅ ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐฑ์‹ ๋œ ์‚ฌํ›„ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์Œ

(์˜ˆ) ์งˆ๋ณ‘ ํŒ์ •์„ ๋ฐ›์€ ์‚ฌ๋žŒ์ด ๋‘ ๋ฒˆ์งธ ๊ฒ€์ง„์„ ๋ฐ›์•˜์„ ๋•Œ๋„ ์–‘์„ฑ์ด ๋‚˜์™”์„ ๋•Œ, ์ง„์งœ ์งˆ๋ณ‘์— ๊ฑธ๋ ธ์„ ํ™•๋ฅ ์€?

P( D* ) = 0.99 * 0.916 + 0.1 * 0.084 ~= 0.915

P( θ | D* ) = 0.916 * (0.99 / 0.915) = 1.081

 

2. ์ธ๊ณผ ๊ด€๊ณ„

1) ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์˜ ๋ณ€ํ™”์— ๊ฐ•๊ฑดํ•œ ์˜ˆ์ธก๋ชจํ˜•์„ ๋งŒ๋“ค ๋•Œ ํ•„์š”

2) ๋‘ ๊ฐœ ์ด์ƒ์˜ ๋ณ€์ˆ˜์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ์ค‘์ฒฉ์š”์ธ(confounding factor)์˜ ํšจ๊ณผ๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ๊ณ„์‚ฐํ•ด์•ผ ํ•จ


[9] CNN ์ฒซ๊ฑธ์Œ

1. Convolution ์—ฐ์‚ฐ

1) ์ปค๋„(kernel)์„ ์ž…๋ ฅ๋ฒกํ„ฐ ์ƒ์—์„œ ์›€์ง์—ฌ๊ฐ€๋ฉด์„œ ์„ ํ˜•๋ชจ๋ธ๊ณผ ํ•ฉ์„ฑํ•จ์ˆ˜๊ฐ€ ์ ์šฉ๋˜๋Š” ๊ตฌ์กฐ

2) ์ปค๋„์„ ์ด์šฉํ•ด ๊ตญ์†Œ์ ์œผ๋กœ ์ฆํญ ๋˜๋Š” ๊ฐ์†Œ์‹œ์ผœ์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœ, ํ•„ํ„ฐ๋งํ•จ

 

2. 2์ฐจ์› Convolution ์—ฐ์‚ฐ

1) ์ปค๋„์„ ์ž…๋ ฅ ๋ฒกํ„ฐ ์ƒ์—์„œ ์›€์ง์—ฌ๊ฐ€๋ฉด์„œ ์„ ํ˜•๋ชจ๋ธ๊ณผ ํ•ฉ์„ฑํ•จ์ˆ˜๊ฐ€ ์ ์šฉ๋˜๋Š” ๊ตฌ์กฐ

2) ์ถœ๋ ฅ ํฌ๊ธฐ ๊ณ„์‚ฐ ๋ฐฉ๋ฒ•

- ์ž…๋ ฅ ํฌ๊ธฐ (H,W), ์ปค๋„ ํฌ๊ธฐ(Kh, Kw), ์ถœ๋ ฅ ํฌ๊ธฐ(Oh, Ow)

- Oh = H - Kh + 1 / Ow = W - Kw + 1

3) ์ฑ„๋„์ด ์—ฌ๋Ÿฌ ๊ฐœ์ธ 2์ฐจ์› ์ž…๋ ฅ์€ convolution์„ ์ฑ„๋„ ๊ฐœ์ˆ˜๋งŒํผ ์ ์šฉ

4) ์—ญ์ „ํŒŒ๋ฅผ ๊ณ„์‚ฐํ•  ๋•Œ๋„ convolution ์—ฐ์‚ฐ์ด ๋‚˜์˜ด


[10] RNN ์ฒซ๊ฑธ์Œ

1. ์‹œํ€€์Šค ๋ฐ์ดํ„ฐ

1) ์†Œ๋ฆฌ, ๋ฌธ์ž์—ด, ์ฃผ๊ฐ€ ๋“ฑ๊ณผ ๊ฐ™์ด ์‹œ๊ฐ„ ์ˆœ์„œ์— ๋”ฐ๋ผ ๋‚˜์—ด๋œ ๋ฐ์ดํ„ฐ

2) ๊ณผ๊ฑฐ ์ •๋ณด๋‚˜ ์•ž๋’ค ๋งฅ๋ฝ ์—†์ด ๋ฏธ๋ž˜๋ฅผ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ์™„์„ฑํ•˜๋Š” ๊ฒƒ์€ ๋ถˆ๊ฐ€ -> ๊ณผ๊ฑฐ ์ •๋ณด๊ฐ€ ์†์‹ค๋˜์ง€ ์•Š๋Š” ๊ฒƒ์ด ์ค‘์š”

3) ์กฐ๊ฑด๋ถ€ํ™•๋ฅ ์„ ์ด์šฉ

- P(X1, ..., Xt) = P(Xt | X1, ..., Xt-1) * P(X1, ..., Xt-1) = ∏P(Xs | Xs-1, ..., X1)

4) ๊ฐ€๋ณ€์ ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด ํ•„์š”

5) AR(τ) : ์ž๊ธฐํšŒ๊ท€๋ชจ๋ธ(Autoregressive Model). ๊ณ ์ •๋œ ๊ธธ์ด τ๋งŒํผ ์‹œํ€€์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ

6) ์ž ์žฌ AR ๋ชจ๋ธ : ์ด์ „ ์ •๋ณด๋ฅผ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€ ์ •๋ณด๋“ค์„ Ht๋ผ๋Š” ์ž ์žฌ๋ณ€์ˆ˜๋กœ ์ธ์ฝ”๋”ฉํ•ด์„œ ํ™œ์šฉํ•˜๋Š” ๊ฒฝ์šฐ

7) ์ž ์žฌ๋ณ€์ˆ˜ Ht๋ฅผ ์‹ ๊ฒฝ๋ง์„ ํ†ตํ•ด ๋ฐ˜๋ณตํ•ด์„œ ์‚ฌ์šฉํ•˜์—ฌ ์‹œํ€€์Šค ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์„ ํ•™์Šตํ•˜๋Š” ๋ชจ๋ธ์ด RNN ์ž„

 

2. RNN(Recurrent Neural Network)

1) ์ด์ „ ์ˆœ์„œ์˜ ์ž ์žฌ๋ณ€์ˆ˜์™€ ํ˜„์žฌ์˜ ์ž…๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ๋ชจ๋ธ๋ง

2) RNN์˜ ์—ญ์ „ํŒŒ(BPTT, Backpropagation Through Time)

 

3. ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค

1) ์‹œํ€€์Šค ๊ธธ์ด๊ฐ€ ๊ธธ์–ด์ง€๋ฉด BPTT๋ฅผ ํ†ตํ•œ ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ณ„์‚ฐ์ด ๋ถˆ์•ˆํ•ด์ง€๋ฏ€๋กœ ๊ธธ์ด๋ฅผ ๋Š๋Š” ๊ฒƒ์ด ํ•„์š”ํ•จ(truncated BPTT)

2) Vanilla RNN์€ ๊ธธ์ด๊ฐ€ ๊ธด ์‹œํ€€์Šค๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์–ด๋ ค์›€ -> LSTM, GRU ๋“ฑ์žฅ



๐ŸŒŸ ์˜ค๋Š˜์˜ ํšŒ๊ณ 

๋ฒŒ์จ ๋ชฉ์š”์ผ์ด์–! ์˜ค์ „์—๋Š” ๋‹ค๋ฅธ ์ผ์ •์ด ์—†์–ด์„œ ๋ฐ์ผ๋ฆฌ ์Šคํฌ๋Ÿผํ•˜๊ณ  ๋ชจ๊ฐ๊ณต์œผ๋กœ ํ•˜๋ฃจ๋ฅผ ์‹œ์ž‘ํ–ˆ๋‹ค! ํ”ผ์–ด์„ธ์…˜ ๋•Œ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ•œ ๋ฌธ์ œ๋ฅผ ํ•จ๊ป˜ ๋ณด๊ธฐ๋กœ ํ•ด์„œ ์–ด์ œ ํ’€๋‹ค๊ฐ€ ์ž˜ ์•ˆ ํ’€๋ ธ๋˜ ๋ถ€๋ถ„ ์ฐพ์•„๋ณด๊ณ  ์ฝ”๋“œ ์ •๋ฆฌํ•˜๋Š”๊ฑธ๋กœ ์˜ค์ „ ์‹œ๊ฐ„์„ ๋ณด๋ƒˆ๋‹ค. ์ ์‹ฌ ๋จน๊ณ  ์–ด์ œ์— ์ด์–ด์„œ ํ†ต๊ณ„ํ•™ ๋“ฃ๋Š”๋ฐ ํ†ต๊ณ„ํ•™์€ ๋“ค์–ด๋„ ๋“ค์–ด๋„ ์–ด๋ ต๋‹ค. ํ€ด์ฆˆ ํ‘ธ๋Š”๋ฐ ์ž˜ ์•ˆ ํ’€๋ฆฌ๋Š” ๋ฌธ์ œ ์žˆ์–ด์„œ ์†์œผ๋กœ ์จ ๊ฐ€๋ฉด์„œ ํ’€๋‹ค๊ฐ€ '์•„!' ํ•˜๊ณ  ์ •๋‹ต์„ ์ฐพ์•„์„œ ๋„ˆ๋ฌด ๊ธฐ๋ปค๋‹คใ…‹.ใ…‹ CNN ๋“ฃ๊ณ  ์ •๋ฆฌํ•˜๊ณ  ๋” ์ฐพ์•„๋ณผ๋งŒํ•œ ๋‚ด์šฉ ์žˆ๋Š”์ง€ ์œ ํŠœ๋ธŒ๋„ ๊ฒ€์ƒ‰ํ•ด๋ณด๊ณ  ํ•˜๋‹ค๋ณด๋‹ˆ ๋ฒŒ์จ ํ”ผ์–ด์„ธ์…˜ ์‹œ๊ฐ„... ์˜ค๋Š˜์€ ๋…ธ์…˜์— ์ •๋ฆฌํ•œ ์ฝ”๋“œ ๊ณต์œ ํ•˜๊ณ  ์„œ๋กœ ์ฝ”๋“œ ๋ฆฌ๋ทฐํ–ˆ๋‹ค. ๊ฐ™์€ ๊ธฐ๋Šฅ์„ ํ•˜๋Š” ํ•จ์ˆ˜์—ฌ๋„ ํŒŒ์ด์ฌ์ด๋ผ ์‹œ๊ฐ„ ์ดˆ๊ณผ๊ฐ€ ๋‚˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์–ด์„œ reversed ์‚ฌ์šฉํ•˜๊ธฐ* ์ƒˆ๋กœ ๋ฐฐ์› ๋‹ค. ๋งˆ์Šคํ„ฐ ํด๋ž˜์Šค์—์„œ๋Š” AI Math ํŒŒํŠธ๋ฅผ ๋‹ด๋‹นํ•˜์‹œ๋Š” ์ž„์„ฑ๋นˆ ๋งˆ์Šคํ„ฐ๋‹˜์˜ ์„ธ์…˜์„ ๋“ค์—ˆ๋‹ค. ์ธ๊ณต์ง€๋Šฅ ๋Œ€ํ•™์›๋ถ€ํ„ฐ ์ˆ˜ํ•™ ๊ณต๋ถ€๊นŒ์ง€, ๊ทธ๋ฆฌ๊ณ  ๋งˆ์Šคํ„ฐ๋‹˜์€ ์–ด๋–ป๊ฒŒ ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์— ๋น ์ง€๊ฒŒ ๋˜์…จ๋Š”์ง€ ๋“ค์„ ์ˆ˜ ์žˆ์–ด์„œ ๋„ˆ๋ฌด ์ข‹์•˜๋‹ค. ์‚ฌ๋žŒ, ํŠนํžˆ ์ž์‹ ์˜ ์ง์—…์„ ๊ฐ€์ง„ ์‚ฌ๋žŒ์„ ๋ณด๋ฉด ์™œ ์ด ๊ธธ์„ ์„ ํƒํ–ˆ๋Š”์ง€ ๊ถ๊ธˆํ•  ๋•Œ๊ฐ€ ๋งŽ๋‹ค+_+ ๋งˆ์Šคํ„ฐํด๋ž˜์Šค ๋“ฃ๊ณ  RNN ๋‚˜๋จธ์ง€ ์ˆ˜์—… ๋“ฃ๊ณ  ์ •๋ฆฌ๊นŒ์ง€ ๋! ์˜ค๋Š˜์€ ์กฐ๊ธˆ ์ผ์ฐ ์ž˜ ์ˆ˜ ์žˆ์œผ๋ ค๋‚˜๐Ÿค”

728x90
Comments