์ฐ๊ด๋ถ์์ด๋?
์ฐ๊ด๋ถ์์ ์ธก๋
์ฐ๊ด๊ท์น์ ์ฅ๋จ์
R ํ๋ก๊ทธ๋๋ฐ
์ฐ๊ด๊ท์น
์ฐ๊ด ๋ถ์ = ์ฅ๋ฐ๊ตฌ๋ ๋ถ์ = ์์ด ๋ถ์
"๊ธฐ์ ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ํ์ ๊ตฌ๋งค, ์๋น์ค ๋ฑ ์ผ๋ จ์ ๊ฑฐ๋ ๋๋ ์ฌ๊ฑด๋ค ๊ฐ์ ๊ท์น์ ๋ฐ๊ฒฌํ๊ธฐ ์ํด"
If A then B : ๋ง์ผ A๊ฐ ์ผ์ด๋๋ฉด B๊ฐ ์ผ์ด๋๋ค.
์ฐ๊ด๊ท์น์ ์ธก๋
1) ์ง์ง๋ Support : ์ ์ฒด ๊ฑฐ๋ ์ค ํญ๋ชฉ A,B ๋์์ ํฌํจํ๋ ๊ฑฐ๋์ ๋น์จ
2) ์ ๋ขฐ๋ Confidence : ํญ๋ชฉ A๋ฅผ ํฌํจํ ๊ฑฐ๋์ค ํญ๋ชฉ A,B๊ฐ ๊ฐ์ด ํฌํจ๋ ํ๋ฅ -> ์ง์ง๋/ P(A)
3) ํฅ์๋ Lift : A๊ฐ ๊ตฌ๋งค๋์ง ์์์ ๋ ํ๋ชฉ B์ ๊ตฌ๋งคํ๋ฅ ์ ๋นํด A๊ฐ ๊ตฌ๋งค๋์ ๋ ํ๋ชฉ B์ ๊ตฌ๋งคํ๋ฅ ์ ์ฆ๊ฐ ๋น
์๋ก ๊ด๋ จ์ด ์์ ๊ฒฝ์ฐ์ ํฅ์๋ = 1 -> A,B ๋์์ ํฌํจ๋ ๊ฑฐ๋์ / Aํฌํจ ๊ฑฐ๋์ X Bํฌํจ ๊ฑฐ๋์
์ฐ๊ด๊ท์น์ ์ ์ฐจ
์ต์ ์ง์ง๋ ๊ฒฐ์ -> ํ๋ชฉ ์ค ์ต์ ์ง์ง๋ ๋๋ ํ๋ชฉ ๋ถ๋ฅ -> 2๊ฐ์ง ํ๋ชฉ ์งํฉ ์์ฑ -> ๋ฐ๋ณต
์ฐ๊ด๊ท์น์ ์ฅ์
๊ฒฐ๊ณผ ์ฝ๊ฒ ์ดํดํ ์ ์๋ค.
๋ชฉ์ ์ด ์๋ ๊ฒฝ์ฐ ์ ์ฉํ๊ฒ ์ฌ์ฉํ ์ ์๋ค. (๋ชฉ์ ๋ณ์ ์์)
๋ฐ์ดํฐ ๋ณํ์์ด ๊ทธ์์ฒด๋ก ์ด์ฉํ ์ ์๋ ๊ฐ๋จํ ์๋ฃ๊ตฌ์กฐ ํํ
๋ถ์์ ์ํ ๊ณ์ฐ์ด ๊ฐ๋จ.
์ฐ๊ด๊ท์น์ ๋จ์
ํ๋ชฉ์๊ฐ ๋์ด๋๋ฉด ํ์ํ ๊ณ์ฐ์ด ๋์ด๋จ -> ์ ์ฌ ํ๋ชฉ์ ํ ๋ฒ์ฃผ๋ก, ์๋ฏธ๊ฐ ์ ์ ์ฐ๊ด๊ท์น์ ์ ์ธ
๋๋ฌด ์ธ๋ถํ ๋์ด์์ผ๋ฉด ์ฐ๊ด๊ท์น ์ฐพ๋๊ฒ ์๋ฏธ์์ -> ์ ์ ํ ํฐ์ ์ฃผ๋ก ๊ตฌ๋ถ
๊ฑฐ๋๋์ด ์ ์ ํ๋ชฉ์ ๊ฑฐ๋์๊ฐ ์์ ์ ์ธํ๊ธฐ ์ฌ์
์์ฐจ ํจํด
๋์์ ๊ตฌ๋งค๋ ๊ฐ๋ฅ์ฑ์ด ํฐ ์ํ๊ตฐ์ ์ฐพ์๋ด๋ ์ฐ๊ด์ฑ =๋ถ์์ ์๊ฐ์ด๋ผ๋ ๊ฐ๋ ์ ํฌํจ์์ผ ์์ฐจ์ ์ผ๋ก ๊ตฌ๋งค๊ฐ๋ฅ์ฑ์ด ํฐ ์ํ๊ตฐ์ ์ฐพ์๋ด๋ ๊ฒ
์ฐ๊ด์ฑ๋ถ์ ์๊ณ ๋ฆฌ์ฆ
1) Aprori ์๊ณ ๋ฆฌ์ฆ : ์ต์ ์ง์ง๋ ์ด์์ ๋น๋ฐํญ๋ชฉ์งํฉ์ ์ฐพ์ ํ ๊ทธ๊ฒ์ ๋ํด์๋ง ๊ณ์ฌ
2) FP-Growth ์๊ณ ๋ฆฌ์ฆ : ํ๋ณด ๋น๋ฐํญ๋ชฉ์งํฉ์ ์์ฑํ์ง์๊ณ , FP-Tree๋ฅผ ๋ง๋ ํ ๋ ๋น ๋ฅด๊ฒ ๋น๋ฐํญ๋ชฉ์งํฉ์ ์ถ์ถ
Rํ๋ก๊ทธ๋๋ฐ ์์
data(Groceries)
inspect(Groceries[1:3])
apriori(Groceries,parameter = list(support=0.01, confidence =0.3))
๊ท์น์ ์๊ฐ ๋๋ฌด ์ ์ผ๋ฉด ์ง์ง๋์ ์ ๋ขฐ๋๋ฅผ ๋ฎ์ถ๊ณ , ๋๋ฌด ๋ง์ผ๋ฉด ์ง์ง๋์ ์ ๋ขฐ๋๋ฅผ ๋์ฌ์ผ ํ๋ค.
'๋ฏธ์ฌ์ฉ > ADsP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[3๊ณผ๋ชฉ] 5๊ณผ๋ชฉ 2์ ๋ถ๋ฅ ๋ถ์ (0) | 2021.08.12 |
---|---|
[3๊ณผ๋ชฉ] 5๊ณผ๋ชฉ 3์ ์์๋ธ ๋ถ์ (0) | 2021.08.12 |
[3๊ณผ๋ชฉ] 5์ฅ 4์ ์ธ๊ณต์ ๊ฒฝ๋ง ๋ถ์ (0) | 2021.08.12 |
[3๊ณผ๋ชฉ] 5์ฅ 5์ ๊ตฐ์ง๋ถ์ (0) | 2021.08.11 |
[ADsP] ์๊ฒฉ์ํ ์ผ์ (0) | 2021.06.26 |