์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ํด ์ค์น
- ์ํ์น ์คํํฌ
- airflow
- ์คํํฌ
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ์๋ผ์คํฑ์์น
- ๋ฆฌ๋ ์ค RPM
- kudu
- CLF-C02
- BIGDATA
- ์ค์๋ธ
- ํ๋ก์ค์น
- ์ค์นผ๋ผ ๋ถ
- aws ccp
- ๋น ๋ฐ์ดํฐ
- hadoop
- rpmbuild
- Apache spark
- ansible
- ํ๋ก
- ํ์ด๋ธ
- ํ๋ก์์ฝ์์คํ
- elastic stack
- ์ฑ๊ธ์๋ฒ
- standalone
- HBase
- LeetCode
- ์ค์๋ธ ์ค์น
- ๋ฆฌ๋ ์ค
- ๋ฆฟ์ฝ๋
- Today
- Total
๋ชฉ๋ก์ํ์น ์คํํฌ (2)
data_lab
์คํํฌ๋ฅผ ์คํํ ๋, ๋ฉ๋ชจ๋ฆฌ์ ์ฝ์ด๋ฅผ ์ค์ ํ์ฌ ์คํํ ์ ์๋ค. x=sc.parallelize([โsparkโ, โrddโ, โexampleโ, โsampleโ, โexampleโ], 3) ๋ณ๋ ฌํ(transformation) x=x.map(lambda x:(x,1)) #์ ๋ ฅ๊ฐ : x ์ถ๋ ฅ๊ฐ: (x,1) ๋งคํ(transformation) y.collect ์งํฉ(action) [(โsparkโ,1), (โrddโ,1), (โexampleโ,1), (โsampleโ,1), (โexampleโ,1)] spark yarn ์คํ scala : spark-shell --master yarn --queue queue_name python : pyspark --master yarn --queue queue_name --..
ํ๋ก์ ๋ฌธ์ ์ ์ ๋ณด์ํ๊ธฐ ์ํด ์คํํฌ ์๊น ํ๋ก์ ๋ฌธ์ ๋ 1. ๋ฐ๋ณต์ ์ธ ์์ ์๋ ๋นํจ์จ์ ์ 2. ๋งต๋ฆฌ๋์ค์ ๋คํธ์ํฌ ํธ๋ํฝ์ผ๋ก ์ธํด ์ฑ๋ฅ์ ํ๋จ. ์คํํฌ๋? ๊ธฐ์กด ๋งต๋ฆฌ๋์ค์ ๋์คํฌ ์ ์ถ๋ ฅ์ ๋ณด์ํ์ฌ ์ธ ๋ฉ๋ชจ๋ฆฌ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๋ ์ ์ํฌ ์ด๋ค. ์ธ ๋ฉ๋ชจ๋ฆฌ - ์ต์ด ๋ฐ์ดํฐ ์ ๋ ฅ, ์ถ๋ ฅ์๋ง ๋์คํฌ์ ์์ฑํจ์ผ๋ก ๋คํธ์ํฌ ํธ๋ํฝ ๋ฐ์ ๋ฎ์ถค, ์ค๊ฐ ๊ฒฐ๊ณผ๋ ๋ณ๋ ฌ์ฒ๋ฆฌํจ ์คํํฌ์ ์ฃผ์๊ธฐ๋ฅ - ์คํํฌ SQL, ์คํํฌ ์คํธ๋ฆฌ๋ฐ, ์คํํฌ MLlib, ์คํํฌ GraphX, ์คํํฌ ์ฝ์ด, ์คํํฌ ์์ ์ฒ๋ฆฌ ์คํํฌ ์ํคํ ์ฒ ๋ ธ๋๋งค๋์ ์์ ๋๋ผ์ด๋ฒ ํ๋ก๊ทธ๋จ์ด ์์. 1. ๋๋ผ์ด๋ฒ ํ๋ก๊ทธ๋จ์ด SparkContext ์ธ์คํด์ค ์์ฑํจ(์ด๋ yarn๊ณผ ์ฐ๊ฒฐ) 2. executors ๋ฅผ ์๊ตฌ 3. ์ ํ๋ฆฌ์ผ์ด์ ์ฝ๋๋ฅผ executors์ ๋ณด..