|
๋ถ์๋์ ์ |
๋ถ์๋์ ๋ชจ๋ฆ |
๋ถ์๋ฐฉ๋ฒ ์ |
์ต์ ํ |
ํต์ฐฐ |
๋ถ์๋ฐฉ๋ฒ ๋ชจ๋ฆ |
์๋ฃจ์
|
๋ฐ๊ฒฌ |
๊ณผ์ ์ค์ฌ์ ์ธ ๋ฐฉ์ ๋ง์คํฐ ํ๋ ๋จ์
speed & test Accuracy&Deploy
quick & win Long Term view
problem solving problem Definition
๋ถ์ ๊ธฐํ์ ๊ณ ๋ ค์ฌํญ
- ๊ฐ์ฉ ๋ฐ์ดํฐ์ ๋ํ ๊ณ ๋ ค
- ์ ์ ํ ํ์ฉ๋ฐฉ์๊ณผ ์ ์ฆ์ผ์ด์ค
- ์ฅ์ ์์๋ค์ ๋ํ ์ฌ์ ๊ณํ ์๋ฆฝ
๋ฐ์ดํฐ ๊ธฐ๋ฐํ ์์ฌ๊ฒฐ์ ๋ฐฉํด์์ - ํ๋ ์ด๋ฐํจ๊ณผ, ํธํฅ๋ ์๊ฐ, ๊ณ ์ ๊ด๋
-ํ๋ ์ด๋ฐ ํจ๊ณผ :ํํ๋ฐฉ์ ๋ฐ ๋ฐํ์์ ๋ฐ๋ผ ๋์ผํ ์ฌ์ค์๋ ํ๋จ์ ๋ฌ๋ฆฌํ๋ ํ์
๋ถ์๋ฐฉ๋ฒ๋ก ๊ฐ์
- ์ ์ฐจ, ๋ฐฉ๋ฒ, ๋๊ตฌ์ ๊ธฐ๋ฒ, ํ
ํ๋ฆฟ๊ณผ ์ฐ์ถ๋ฌผ
๋ถ์ ๋ฐฉ๋ฒ๋ก
์๋ฌต์ง - ์ฒดํ๋์ด์์ง๋ง ๋๋ฌ๋์ง์๋ ์ง์
ํ์์ง - ๋ฌธ์๋ ๋งค๋ด์ผ ์ฒ๋ผ ํ์ํ๋ ์ง์
๋ฐฉ๋ฒ๋ก ์ ์ ์ฉ์
๋ฌด์ ๋ฐ๋ฅธ ๋ชจ๋ธ
- ํญํฌ์ ๋ชจ๋ธ
- ํ๋กํ ํ์
- ๋์ ํ๋ชจ๋ธ : ์ ์ฆ์ ๊ฐ๋ฐํ๋ ๋ฐฉ๋ฒ
๋ฐฉ๋ฒ๋ก ์ ๊ตฌ์ฑ ๋จ๊ณ > ํ์คํฌ > ์คํ
KDD ๋ถ์ ๋ฐฉ๋ฒ๋ก
๋ฐ์ดํฐ์
์ ํ - ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - ๋ฐ์ดํฐ ๋ณํ - ๋ฐ์ดํฐ ๋ง์ด๋ - ๋ฐ์ดํฐ ๋ง์ด๋ ๊ฒฐ๊ณผ ํ๊ฐ
CRISP-DM ๋ถ์ ๋ฐฉ๋ฒ๋ก
์
๋ฌด์ดํด - ๋ฐ์ดํฐ ์ดํด(์ ํ, ์ ์ฒ๋ฆฌ) - ๋ฐ์ดํฐ ์ค๋น(์ ์ฒ๋ฆฌ) - ๋ชจ๋ธ๋ง(๋ง์ด๋) - ํ๊ฐ(๊ฒฐ๊ณผ ํ๊ฐ) - ์ ๊ฐ
๋น
๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ๋ก
๋ถ์๊ธฐํ - ๋ฐ์ดํฐ ๋ถ๋น - ๋ฐ์ดํฐ ๋ถ์ - ์์คํ
๊ตฌํ - ํ๊ฐ ๋ฐ ์ ๊ฐ
๋ถ์ ๊ณผ์ ๋ฐ๊ตด (๊ณผ์ ๋ฐ๊ตด ํ ๊ณผ์ ์ํ)
- ํํฅ์ ์ ๊ทผ๋ฐฉ๋ฒ(์ต์ ํ > ์๋ฃจ์
) ๋ฌธ์ ์ฃผ์ด์ง๊ณ ์ด์ ๋ํ ํด๋ฒ์ ์ฐพ๊ธฐ ์ํ์ฌ ๊ฐ ๊ณผ์ ์ด ์ฒด๊ณ์ ์ผ๋ก ๋จ๊ณํ
๋ฌธ์ ํ์ - ๋ฌธ์ ์ ์ - ํด๊ฒฐ๋ฐฉ์ ํ์ - ํ๋น์ฑ ๊ฒํ
-- ๋น์ฆ๋์ค ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฌธ์ ํ์
-- ๋ฒ์ ํ์ฅ
- ์
๋ฌด, ์ ์ถค, ๊ณ ๊ฐ, ๊ท์ & ๊ฐ์ฌ, ์ง์ ์ธํ๋ผ
- ๊ฑฐ์ง์ ๊ด์ ์ ๋ฉ๊ฐ ํธ๋๋ STEEP
- ๊ฒฝ์์ ํ๋ ๊ด์ - ๋์ฒด์, ๊ฒฝ์์, ์ ๊ท ์ง์
์
- ์์ฅ์ ๋์ฆ ํ์ ๊ด์ - ๊ณ ๊ฐ, ์ฑ๋, ์ํฅ์
- ์ญ๋์ ์ฌํด์ ๊ด์ - ๋ด๋ถ์ญ๋, ํํธ๋์ ๋คํธ์ํฌ
์ธ๋ถ ์ฐธ์กฐ ๋ชจ๋ธ๊ธฐ๋ฐ - ํ
๋ง ํ๋ณด ๊ทธ๋ฃน์ ํตํด quick & easy
๋ถ์ ์ ์ฆ ์ผ์ด์ค
๋ฌธ์ ์ ์ - ๋น์ฆ๋์ค ๋ฌธ์ ๋ฅผ ๋ฐ์ดํฐ์ ๋ฌธ์ ๋ก
ํด๊ฒฐ๋ฐฉ์ ํ์
ํ๋น์ฑ ๊ฒํ - ๊ฒฝ์ ์ , ๋ฐ์ดํฐ ๋ฐ ๊ธฐ์ ์
- ์ํฅ์ ์ ๊ทผ๋ฐฉ๋ฒ
๋์์ธ ์ฌ๊ณ ์ ๊ทผ๋ฒ ํตํด ํํฅ์ ๊ทน๋ณต
๊ฐ์ ์ด์
- define - ideate - prototype - test
๋น์ง๋ ํ์ต - ์ฅ๋ฐ๊ตฌ๋, ๊ตฐ์ง
์ง๋ํ์ต
ํ๋กํ ํ์
๋ถ์ ํ๋ก์ ํธ ๊ด๋ฆฌ
์ฃผ์์์ญ - Data Size, Data Complexity, Speed, Analytic Complexity, Accuracy& Precision
๋ถ์ ๋ง์คํฐ ํ๋
์ฐ์ ์์ ๊ณ ๋ ค - ์ ๋ต์ ์ค์๋, ๋น์ฆ๋์ค ์ฑ๊ณผ/ROI, ์คํ์ฉ์ด์ฑ
์ ์ฉ๋ฒ์, ๋ฐฉ์ ๊ณ ๋ ค์์ - ๋ด์ ํ, ๋ฐ์ดํฐ ์ ์ฉ, ์ง๊ตฟใน ์ ์ฉ ์์ค
ISP - ๊ณต๊ณต๊ธฐ๊ด์์ ๊ณํ ์๋ฆฝ
์๊ธ์ฑ 3-4-2
๋์ด๋ 3-1-2
๊ฑฐ๋ฒ๋์ค ๊ตฌ์ฑ - ๊ณผ์ ๊ธฐํ ๋ฐ ์ด์ ํ๋ก์ธ์ค, ์์คํ
, ๋ฐ์ดํฐ, HR, ์กฐ์ง
๋ถ์ ์ค๋น๋ - ๋ถ์ ์
๋ฌด, ๋ถ์์ธ๋ ฅ&์กฐ์ง, ๋ถ์๊ธฐ๋ฒ, ๋ถ์๋ฐ์ดํฐ, ๋ถ์ ๋ฌธํ, ๋ถ์ ์ธํ๋ผ
๋ถ์ ์ฑ์๋ - ๋์
>ํ์ฉ>ํ์ฐ>์ต์ ํ
์ฑ์๋ ํ๊ฐ ๋ชจ๋ธ - CMMI
|
์ค๋น๋ ๋ฎ์ |
์ค๋น๋ ๋์ |
์ฑ์๋ ๋์ |
์ ์ฐฉํ |
ํ์ฐํ |
์ฑ์๋ ๋ฎ์ |
์ค๋นํ |
๋์
ํ |
๊ฑฐ๋ฒ๋์ค ๊ตฌ์ฑ์์ - ์์น, ์กฐ์ง, ํ๋ก์ธ์ค
๋ฐ์ดํฐ ํ์คํ
๋ฐ์ดํฐ ๊ด๋ฆฌ ์ฒด๊ณ
๋ฐ์ดํฐ ์ ์ฅ์ - ์ํฌํ๋ก์ฐ, ์ฌ์ ์ํฅ ํ๊ฐ
ํ์คํ ํ๋
๋ถ์ ์กฐ์ง ๊ตฌ์กฐ
- ์ง์ค ๊ตฌ์กฐ : ์ด์คํ/์ด์ํ ๊ฐ๋ฅ์ฑ ๋์
- ๊ธฐ๋ฅ ๊ตฌ์กฐ : ๋ณ๋ ๋ถ์์กฐ์ง ์์
- ๋ถ์ฐ ๊ตฌ์กฐ : ์ ์ํ ์ก์
๊ฐ๋ฅ
***๊ณผ์ ๋ฐ๊ตด > ๊ณผ์ ์ํ ***
BI ํค์๋ - Information, Ad hoc Report, Alerts, Clean Data