- Today
- Total
hye-log
[๋ถ์คํธ์บ ํ AI Tech]WEEK 08_DAY 34 ๋ณธ๋ฌธ
๐ฐ ๊ฐ๋ณํ์ต
[1] ๊ฐ์ ์๊ฐ
1. ๊ฐ์์ ๋ชฉํ
1) AI ์์ง๋์ด๋ก ์ถ๋ฐํ๊ธฐ ์ํ ์์์ ์ ๊ทธ๋ฆด ์ ์๋ ํฐ ๊ทธ๋ฆผ์ ์ธ์งํ๊ธฐ
2) ์ง์ ๋ฌธ์ ์ ์ํ๊ณ ํ์ํ ๋๊ตฌ๋ฅผ ์ฐพ์๋ณด๋ ๋ฅ๋์ ์ธ ์์ธ ๊ฐ์ง๊ธฐ
3) ์ง์์ ์ผ๋ก ๊ฐ์ ํ๊ธฐ
4) ํ๋กํ ํ์ดํ๋ถํฐ ๋ชจ๋ธ ๋ฐฐํฌ, ๋ชจ๋ํฐ๋ง ๊ณผ์ ์ ์ดํดํ๊ธฐ
2. ๊ฐ์์ ํน์ง
1) ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ ๋ง๋ค์ด์ก๋์ง ์ง์คํ๊ธฐ
2) ์ผ๋ฐ์ ์ธ AI ์์ง๋์ด๋ง์ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์ ์๊ธฐ ๋๋ฉ์ธ์ ์ด๋ป๊ฒ ์ ์ฉํ ์ ์์์ง ์๊ฐํด๋ณด๊ธฐ
[2] MLOps ๊ฐ๋ก
1. MLOps ๊ฐ๋ก
1) ๋ชจ๋ธ ๊ฐ๋ฐ ํ๋ก์ธ์ค(Research)
(1) ์์ ์ ์ปดํจํฐ, ์๋ฒ ๋ฑ์์ ๊ณ ์ ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ต
(2) ํ์ต๋ ๋ชจ๋ธ์ real world, production ํ๊ฒฝ์ ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ ๊ฒ์ด ํ์
2) ๋ชจ๋ธ ๊ฐ๋ฐ ํ๋ก์ธ์ค(Production)
(1) ์น, ์ฑ์์ ์๋น์ค๋ฅผ ํ์ฉํ ์ ์๊ฒ ๋ง๋๋ ๊ณผ์
(2) '๋ชจ๋ธ์๊ฒ ๋ฐ์ดํฐ(Input)์ ์ ๊ณตํ์ฌ ์์ธก(Output)ํด์ฃผ์ธ์' ๋ผ๊ณ ์์ฒญ
(3) ๋ชจ๋ธ์ด ๋ฐฐํฌ๋์๋ค๊ณ ๊ฐ์
- ๊ฒฐ๊ณผ๊ฐ์ด ์ด์ํ ๊ฒฝ์ฐ : input ๋ฐ์ดํฐ๊ฐ ์ด์ํ ๊ฒฝ์ฐ, outlier๊ฐ ์กด์ฌํ๋ ๊ฒฝ์ฐ
- ์ฑ๋ฅ์ด ๊ณ์ ๋ณ๊ฒฝ๋๋ ๊ฒฝ์ฐ : ์์ธก ๊ฐ๊ณผ ์ค์ ๋ ์ด๋ธ์ ์์์ผ ํจ
- ์๋ก์ด ๋ชจ๋ธ์ด ๋ ์ ์ข์ ๊ฒฝ์ฐ : research์์ ์ข์๋ ๋ชจ๋ธ์ด production์์๋ ์ ์ข์ ์๋, ์ด์ ๋ชจ๋ธ์ ๋ค์ ์ฌ์ฉ
- ์ด ์ธ์๋ ๋ค์ํ ์ด์๊ฐ ์กด์ฌํจ
3) MLOps๋
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ง ์ฝ๋๋ ๋จธ์ ๋ฌ๋ ์์คํ ์ ์ผ๋ถ์ ๋ถ๊ณผํจ
- MLOps = ML(Machine Learning) + Ops(Operations)
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ด์ํ๋ฉด์ ๋ฐ๋ณต์ ์ผ๋ก ํ์ํ ์ ๋ฌด๋ฅผ ์๋ํ์ํค๋ ๊ณผ์
- ๋จธ์ ๋ฌ๋ ์์ง๋์ด๋ง + ๋ฐ์ดํฐ ์์ง๋์ด๋ง + ํด๋ผ์ฐ๋ + ์ธํ๋ผ
- ๋ชจ๋ธ๋ง์ ์ง์คํ ์ ์๋๋ก ๊ด๋ จ๋ ์ธํ๋ผ๋ฅผ ๋ง๋ค๊ณ ์๋์ผ๋ก ์ด์๋๋๋ก ๋ง๋๋ ์ผ
- Production ํ๊ฒฝ์ ๋ฐฐํฌํ๋ ๊ณผ์ ์์ Research ๋ชจ๋ธ์ด ์ฌํ ๊ฐ๋ฅํด์ผ ํจ (+ํ์ค์ Risk ๊ณ ๋ ค)
- ๋ชฉํ : ๋น ๋ฅธ ์๊ฐ ๋ด, ๊ฐ์ฅ ์ ์ ์ํ์ผ๋ก, ์์ด๋์ด๋ถํฐ Production๊น์ง, ML ํ๋ก์ ํธ๋ฅผ ์งํํ ์ ์๋๋ก, ๊ธฐ์ ์ ๋ง์ฐฐ์ ์ค์ด๋ ๊ฒ
- ํ์ต ๋ฐฉ๋ฒ : ๊ฐ Component์์ ํด๊ฒฐํ๊ณ ์ถ์ ๋ฌธ์ ๋ ๋ฌด์์ด๊ณ , ๊ทธ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก ์ด๋ค ๋ฐฉ์์ ํ์ฉํ ์ ์๋์ง
4) Reserach์ Production์ ์ฐจ์ด
2. MLOps Component
1) Server ์ธํ๋ผ(์ฅ์)
- ํธ๋ํฝ
- GPU, Memory ์ฑ๋ฅ
- ์ค์ผ์ผ ์ /์์
- ์์ฒด ์๋ฒ ๊ตฌ์ถ, ํด๋ผ์ฐ๋
2) GPU Infra(๋๊ตฌ)
- ๋ก์ปฌ GPU
- ํด๋ผ์ฐ๋ GPU : ํด๋ผ์ฐ๋ - AWS, GCP, Azure, NCP ๋ฑ / ์จ ํ๋ ๋ฏธ์ค : ์ ์ฐ์ค์ ์๋ฒ๋ฅผ ์ง์ ์ค์น
3) Serving(์๋น)
- Batch Serving : ์ผ์ ์ฃผ๊ธฐ(1์ผ, 1์ฃผ, 1๋ฌ ๋ฑ)๋ก ํ๊บผ๋ฒ์ ์์ธก
- Online Serving : ์ค์๊ฐ์ผ๋ก ์์ธก, ๋ณ๋ชฉ์ด ์์ด์ผ ํจ
4) Experiment, Model Management(๋ ์ํผ)
- ํ๋ผ๋ฏธํฐ, ๋ชจ๋ธ ๊ตฌ์กฐ ๋ฑ
- ๋ชจ๋ธ ์์ฑ์ผ, ๋ชจ๋ธ ์ฑ๋ฅ, ๋ฉํ ์ ๋ณด ๋ฑ์ ๊ธฐ๋ก
- ์ฌ๋ฌ ๋ชจ๋ธ ์ด์
- ex) mlflow
5) Feature Store(์ ์ฅ)
- feature๋ฅผ ์ง๊ณํ feature store(์ ํ ๋ฐ์ดํฐ์์ ์์ฃผ ์ฌ์ฉ)
- ex) FEAST
6) Data Validation(์ฌ๋ฃ)
- Feature์ ๋ถํฌ ํ์ธ
- ์ข ๋ฅ : Data Drift, Model Drift, Concept Drift
- Static model : ํ ๋ฒ ํ์ตํ ๋ชจ๋ธ์ ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ผ ๊ทธ๋๋ก ๊ฐ์ ธ๊ฐ.
ํ๋ฒํ์ตํ๊ณ ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ผ ๊ทธ๋๋ก ๊ฐ์ ธ๊ฐ. ํ๋ฆฌํฐ๊ฐ ๋ฎ์์ง
- Refreshed models : ๋ค์ ํ์ตํ๋ฉด์ ํ๋ฆฌํฐ๋ฅผ ์ ์งํจ
7) Continuous Training(ํ์ง ์ ์ง)
- ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ค๋ ๊ฒฝ์ฐ
- ์ผ์ ๊ธฐ๊ฐ๋ง๋ค(๋งค์ผ, ๋งค์๊ฐ)
- Metric ๊ธฐ๋ฐ์ผ๋ก ํ์ธํ์ ๋
- ์์ฒญํ ๋๋ง๋ค
8) Monitoring(๊ธฐ๋ก)
- ๋ชจ๋ธ์ ์งํ, ์ธํ๋ผ์ ์ฑ๋ฅ ์งํ ๋ฑ์ ๊ธฐ๋ก
9) AutoML(์๋)
- ex) MLIlibrary
10) ์ ๋ฆฌ
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ง์ ์ด์ํ๋ฉด์ ์ ๊ฒฝ์จ์ผ ํ๋ ๋ถ๋ถ
- ํ์ฌ์ ๋น์ฆ๋์ค ์ํฉ๊ณผ ๋ชจ๋ธ ์ด์ ์ํฉ์ ๋ฐ๋ผ ์ฐ์ ์์๊ฐ ๋ฌ๋ผ์ง
- MVP(Minimal Value Product)๋ก ์์ํด์ ์ ์ ์ด์ ๋ฆฌ์์ค๊ฐ ๋ง์ด ์ถ๊ฐ๋ ๋ ํ๋์ฉ ๊ตฌ์ถํจ
๐ฐ ์ค๋์ ํ๊ณ
๋ํ๊ฐ ๋๋์ ๋ค์ ์๋๋๋ก ๋์์จ ๊ฒ ๊ฐ์ 8์ฃผ์ฐจ..! ๋ฐ์ผ๋ฆฌ ์คํฌ๋ผ ๋๋ ์ค๋ ๊ณํ์ ๋ํด์ ๋งํ๋ฉด์ ์์ํ๋ค. ์ด๋ฒ ์ฃผ๋ถํฐ MLOps ๋ค์ด๊ฐ๋๋ฐ ์ ์ผ ๋ง์ด ๊ธฐ๋ํ ํํธ์ด๊ธฐ๋ ํ๋ค. ์๋ฌด๋๋ CV ๋ณด๋ค๋ ์์ง๋์ด๋ง์ด ์์ฌ์ง MLOps๊ฐ ๋ ์ฌ๋ฏธ์์ ๊ฒ ๊ฐ์ ๋๋... ๊ฐ์ ํ๋ํ๋๊ฐ ๋น์ ๋ฅผ ํตํด์ ์ค๋ช ํด์ฃผ์ ์ ์์ฒญ ์ดํด๊ฐ ์์๋์๋ค. ๋ญ๊ฐ ์๋ก ๋์ค๋ ๊ฐ๋ ๋ค์ด๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ์ฐพ์๋ณด๋ฉด์ ๋ค์๋๋ฐ, ์ด๋ฐ ํด๋ค๋ก ๊ฒฐ๊ตญ์๋ MLOps๊ฐ ์ด๋ฃจ์ด์ง๋ ๊ฒ์ด๊ตฌ๋๋ผ๊ณ ์ดํดํ๋ค.. ํผ์ด์ธ์ ๋์๋ ์ค๋๋ง์ ํ ์ด์ผ๊ธฐ๊ฐ ์์ด์ ์๊ณ ๋ฆฌ์ฆ ๋ฌธ์ ํ๊ธฐ๋ก ํ๊ณ , ์ง๋ ์ฃผ 1๋ฑ ์กฐ์์ ๋ฐํํ๋ ํ์ ํด ์ค์์ VSCode live coding ๊ธฐ๋ฅ์ ์จ ๋ณด์๋ค. ์ฒ์์๋ ์ด๋ป๊ฒ ์ฐ๊ฒฐํ๋๊ฑด๊ฐ ํค๋งธ์๋๋ฐ ๋คํํ๋ ๊นํ๋ธ ๊ณ์ ์ ์ด์ฉํด์ ์ฝ๊ฒ ์ ๊ทผํ ์ ์์๋ค. ์ฐ๋ฆฌ ์กฐ๋ ๋ฏธ๋ฆฌ ํ๋ก์ฐ/ํ๋ก์ ํด ๋ ๋๋ถ์ ์ฝ๊ฒ ํ์ ํ ์ ์์์! ๊ฐ์์ ์์น๊ฐ ํ์๋๊ณ ๋์์ ์์ ํ ์ ์์ด์ ์์ฒญ ์ ์ฉํ ๊ฒ ๊ฐ๋ค๐
'Boostcourse > AI Tech 4๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ถ์คํธ์บ ํ AI Tech]WEEK 08_DAY 36 (0) | 2022.11.09 |
---|---|
[๋ถ์คํธ์บ ํ AI Tech]WEEK 08_DAY 35 (0) | 2022.11.09 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 07_DAY 33 (1) | 2022.11.05 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 07_DAY 32 (0) | 2022.11.04 |
[๋ถ์คํธ์บ ํ AI Tech]WEEK 07_DAY 31 (0) | 2022.11.02 |