HIVE ํ ์ด๋ธ ๊ด๋ฆฌ
HIVE ํ ์ด๋ธ
1. ๋ฐ์ดํฐ๋ฅผ HIVE ํ ์ด๋ธ๋ก ๊ฐ์ ธ์ค๋ฉด?
HiveQL, ํผ๊ทธ, ์คํํฌ ๋ฑ์ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌ > ์ํธ์ด์ ๋ณด์ฅ
2. HIVE๊ฐ ์ง์ํ๋ ํ ์ด๋ธ ์ข ๋ฅ
- ๋ด๋ถ ํ ์ด๋ธ : HIVE๊ฐ ๊ด๋ฆฌ, HIVE/ ๋ฐ์ดํฐ์จ์ดํ์ฐ์ค์ ์ ์ฅ, ๋ด๋ถํ ์ด๋ธ ์ญ์ ์ ๋ฉํ์ ์์ ๋ฐ์ดํฐ๊น์ง ์ญ์ ๋จ,
ORC๊ฐ์ ํ์์ผ๋ก ์ ์ฅ๋์ด ๋น๊ต์ ๋น ๋ฅธ ์ฑ๋ฅ
- ์ธ๋ถ ํ ์ด๋ธ : ํ์ด๋ธ๊ฐ ์ง์ ๊ด๋ฆฌํ์ง ์์,
ํ์ด๋ธ์ ๋ฉํ์ ์๋ง ์ฌ์ฉํ์ฌ ์์ ํํ๋ก ์ ์ฅ๋ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๊ทผ
์ธ๋ถ ํ ์ด๋ธ์ ๋ฐ์ดํฐ๋ฅผ ์ญ์ ํด๋ ํ ์ด๋ธ ๋ฉํ ์ ์๋ง ์ญ์ ๋๊ณ ๋ฐ์ดํฐ๋ ์ ์ง๋จ.
ํด๋น ๋ฐ์ดํฐ๊ฐ ํ์ด๋ธ ์ธ๋ถ์ ์ ์ฌ ๋์ด์๊ฑฐ๋ ํ ์ด๋ธ์ด ์ญ์ ๋๋๋ผ๋ ์๋ณธ ๋ฐ์ดํฐ๊ฐ ๋จ์ ์์ด์ผํ ๋ ์ฌ์ฉ
3.csv ํ์ผ์ ํ์ด๋ธ ํ ์ด๋ธ๋ก ๊ฐ์ ธ์ค๊ธฐ
1.names.csv ์ HDFS์ ๋ณต์ฌ
2. hdfs dfs –mkdir names
3. hdfs dfs –put names.csv names
4. hive ์คํ ํ ์ฟผ๋ฆฌ๋ก ํ ์ด๋ธ ์์ฑ location ‘/directory’ ๊ตฌ๋ฌธ์ ํ ์ด๋ธ์ด ์ฌ์ฉํ ์ ๋ ฅ ํ์ผ์ ๊ฒฝ๋ก์ด๋ค.
5. select * from ~ ๋ฐ์ดํฐ ํ์ธํ๊ธฐ
6. stored as orc > ๋ด๋ถ ํ ์ด๋ธ
7. ๋ฐ์ดํฐ ํ์ – ํ ์คํธ ํ์ผ, ์ํ์ค ํ์ผ(k-v์), RC ํ์ผ, ORC ํ์, Parquet ํ์
์ธ๋ถ ํ ์ด๋ธ ์์ฑ
su – hdfs
hdfs dfs –mkdir /Smartcar
hdfs dfs –put /txtfile.txt /Smartcar
hdfs dfs –chown –R hive /Smartcar
hdfs dfs –chmod –R 777 /Smartcar
su – hive
hive
create external table (~) ~ location /Smartcar;
๋ด๋ถ ํ ์ด๋ธ ์์ฑ
create table (~) ~ location /Smartcar;
์ธ๋ถ ํ ์ด๋ธ์ ๋ฐ์ดํฐ ๋ด๋ถ ํ ์ด๋ธ๋ก ๋ณต์ฌ
insert overwrite table SmartCar_in
select * from SmartCar_ex;
๋ด๋ถ ํ ์ด๋ธ ๋๋ ํฐ๋ฆฌ ์์ฑํ์ธ
hdfs dfs –ls /Smartcar
/Smartcar/base_0000001/bucket_00000/bucket_00000
ํ์ด๋ธ๋ SQL๊ณผ ์ ์ฌํด์
๊ธฐ์กด์ SQL์ ๊ณต๋ถํ๋ค๋ฉด ์ด๋ ต์ง์๋ค.
'BIGDATA > ํ๋ก์์ฝ์์คํ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Spark] ์ํ์น ์คํํฌ, Apache Spark ๋ช ๋ น์ด ์ ๋ฆฌ (0) | 2021.05.02 |
---|---|
[Hbase] ์ํ์น Hbase ๋ช ๋ น์ด ์ ๋ฆฌ (0) | 2021.05.02 |
[Hadoop] ํ๋ก ๋ช ๋ น์ด ์ ๋ฆฌ / Hadoop ๋ช ๋ น์ด ์ ๋ฆฌ (0) | 2021.05.02 |
[ํ๋ก์์ฝ์์คํ ] ์คํํฌ / apache spark (0) | 2021.03.30 |
[ํ๋ก์์ฝ์์คํ ] Apache Avro / ์ํ์น ์์ด๋ธ๋ก (0) | 2021.03.28 |