๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก์•„ํŒŒ์น˜ ์ŠคํŒŒํฌ (2)

data_lab

[ํ•˜๋‘ก์—์ฝ”์‹œ์Šคํ…œ] ์ŠคํŒŒํฌ / apache spark

ํ•˜๋‘ก์˜ ๋ฌธ์ œ์ ์„ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ์ŠคํŒŒํฌ ์ƒ๊น€ ํ•˜๋‘ก์˜ ๋ฌธ์ œ๋Š” 1. ๋ฐ˜๋ณต์ ์ธ ์ž‘์—…์—๋Š” ๋น„ํšจ์œจ์ ์ž„ 2. ๋งต๋ฆฌ๋“€์Šค์‹œ ๋„คํŠธ์›Œํฌ ํŠธ๋ž˜ํ”ฝ์œผ๋กœ ์ธํ•ด ์„ฑ๋Šฅ์ €ํ•˜๋จ. ์ŠคํŒŒํฌ๋ž€? ๊ธฐ์กด ๋งต๋ฆฌ๋“€์Šค์˜ ๋””์Šคํฌ ์ž…์ถœ๋ ฅ์„ ๋ณด์™„ํ•˜์—ฌ ์ธ ๋ฉ”๋ชจ๋ฆฌ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํ”„๋ ˆ์ž„ ์›Œํฌ ์ด๋‹ค. ์ธ ๋ฉ”๋ชจ๋ฆฌ - ์ตœ์ดˆ ๋ฐ์ดํ„ฐ ์ž…๋ ฅ, ์ถœ๋ ฅ์—๋งŒ ๋””์Šคํฌ์— ์ž‘์„ฑํ•จ์œผ๋กœ ๋„คํŠธ์›Œํฌ ํŠธ๋ž˜ํ”ฝ ๋ฐœ์ƒ ๋‚ฎ์ถค, ์ค‘๊ฐ„ ๊ฒฐ๊ณผ๋Š” ๋ณ‘๋ ฌ์ฒ˜๋ฆฌํ•จ ์ŠคํŒŒํฌ์˜ ์ฃผ์š”๊ธฐ๋Šฅ - ์ŠคํŒŒํฌ SQL, ์ŠคํŒŒํฌ ์ŠคํŠธ๋ฆฌ๋ฐ, ์ŠคํŒŒํฌ MLlib, ์ŠคํŒŒํฌ GraphX, ์ŠคํŒŒํฌ ์ฝ”์–ด, ์ŠคํŒŒํฌ ์ž‘์—… ์ฒ˜๋ฆฌ ์ŠคํŒŒํฌ ์•„ํ‚คํ…์ฒ˜ ๋…ธ๋“œ๋งค๋‹ˆ์ € ์•ˆ์— ๋“œ๋ผ์ด๋ฒ„ ํ”„๋กœ๊ทธ๋žจ์ด ์žˆ์Œ. 1. ๋“œ๋ผ์ด๋ฒ„ ํ”„๋กœ๊ทธ๋žจ์ด SparkContext ์ธ์Šคํ„ด์Šค ์ƒ์„ฑํ•จ(์ด๋•Œ yarn๊ณผ ์—ฐ๊ฒฐ) 2. executors ๋ฅผ ์š”๊ตฌ 3. ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ฝ”๋“œ๋ฅผ executors์— ๋ณด..