์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- LeetCode
- ์ค์นผ๋ผ ๋ถ
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- CLF-C02
- ํ๋ก์์ฝ์์คํ
- Apache spark
- ansible
- ํ๋ก์ค์น
- ๋ฆฌ๋ ์ค RPM
- ํด ์ค์น
- ์คํํฌ
- elastic stack
- HBase
- standalone
- ๋ฆฌ๋ ์ค
- ์ฑ๊ธ์๋ฒ
- ์ํ์น ์คํํฌ
- hadoop
- ์ค์๋ธ ์ค์น
- ํ๋ก
- rpmbuild
- kudu
- ๋ฆฟ์ฝ๋
- airflow
- BIGDATA
- ํ์ด๋ธ
- ๋น ๋ฐ์ดํฐ
- aws ccp
- ์ค์๋ธ
- ์๋ผ์คํฑ์์น
- Today
- Total
๋ชฉ๋กSPARK (2)
data_lab
partitionColumnํํฐ์ ์ ๊ฒฐ์ ํ๋ ๋ฐ ์ฌ์ฉํด์ผ ํ๋ ์ด lowerBound๊ฐ์ ธ์ฌ ๊ฐ์ ๋ฒ์ ๋ฅผ upperBound๊ฒฐ์ ํฉ๋๋ค. ์ ์ฒด ๋ฐ์ดํฐ ์ธํธ๋ ๋ค์ ์ฟผ๋ฆฌ์ ํด๋นํ๋ ํ์ ์ฌ์ฉ SELECT * FROM table WHERE partitionColumn BETWEEN lowerBound AND upperBound lowerBound: 0 upperBound: 1000 numPartitions: 10 Stride๋ 100์ด๊ณ ํํฐ์ ์ ๋ค์ ์ฟผ๋ฆฌ์ ํด๋นํฉ๋๋ค. SELECT * FROM table WHERE partitionColumn BETWEEN 0 AND 100 SELECT * FROM table WHERE partitionColumn BETWEEN 100 AND 200 SELECT * FROM..
์คํํฌ ์ธ์ ์์ฑ val spark = SparkSession .appName("Spark Session") .config("config.name",congfig.value") .getOrCreate() ์คํํฌ ์ ํ๋ฆฌ์ผ์ด์ -> ์คํํฌ ๋๋ผ์ด๋ฒ ํ๋ก๊ทธ๋จ -> ์คํํฌ ์ธ์ ๊ฐ์ฒด ์คํํฌ ๋๋ผ์ด๋ฒ๋ ์คํํฌ ์ ํ๋ฆฌ์ผ์ด์ ์ ํ๋์ด์์ ์ก์ผ๋ก ๋ณํ ์ก์๋ ์ฐ์ฐ์ด ์ฌ๋ฌ๊ฐ์ ์คํํฌ ์คํ ์ด์ง๋ก ๋๋จ ๊ฐ ์คํ ์ด์ง๋ ์ต์ ์คํ ๋จ์์ด๋ฉฐ ์ฐํฉ ์คํ๋๋ ์คํํฌ ํ์คํฌ๋ค๋ก ์ด๋ฃจ์ด์ง