์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ansible
- ์ฑ๊ธ์๋ฒ
- LeetCode
- ํ์ด๋ธ
- ๋ฆฟ์ฝ๋
- ์ค์๋ธ ์ค์น
- CLF-C02
- ํด ์ค์น
- HBase
- rpmbuild
- ์๋ผ์คํฑ์์น
- ์ํ์น ์คํํฌ
- ํ๋ก์ค์น
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ๋น ๋ฐ์ดํฐ
- airflow
- Apache spark
- ์คํํฌ
- ๋ฆฌ๋ ์ค
- ํ๋ก
- hadoop
- ๋ฆฌ๋ ์ค RPM
- elastic stack
- ์ค์๋ธ
- BIGDATA
- ์ค์นผ๋ผ ๋ถ
- kudu
- aws ccp
- standalone
- ํ๋ก์์ฝ์์คํ
- Today
- Total
๋ชฉ๋กBIGDATA/ํ๋ก์์ฝ์์คํ (34)
data_lab
์ฐธ๊ณ ์ฌ์ดํธ https://www.bucketplace.com/post/2021-04-13-%EB%B2%84%ED%82%B7%ED%94%8C%EB%A0%88%EC%9D%B4%EC%8A%A4-airflow-%EB%8F%84%EC%9E%85%EA%B8%B0/ ๋ฒํทํ๋ ์ด์ค Airflow ๋์ ๊ธฐ - ์ค๋์์ง ๋ธ๋ก๊ทธ ํ์ํ ๋ฐ์ดํฐํ๋ซํผ์ ์ํ Airflow ๋์ ๊ธฐ www.bucketplace.com
Secondary Namenode: HDFS์ Secondary Namenode๋ ์ฃผ Namenode์ ๋ฉํ๋ฐ์ดํฐ ์ ๋ณด๋ฅผ ์ฃผ๊ธฐ์ ์ผ๋ก ์์งํ์ฌ ๋ก๊ทธ ํ์ผ์ ํฉ์นฉ๋๋ค. ์ด๋ฌํ ๋ก๊ทธ ํ์ผ์ ์ฃผ Namenode๊ฐ ๊ณ ์ฅ ๋ฌ์ ๋, ์ด์ ์ ์์ง๋ ๋ก๊ทธ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ ์ฃผ Namenode๋ฅผ ๋ณต๊ตฌํ๊ณ ๋ฉํ๋ฐ์ดํฐ ์ ๋ณด๋ฅผ ๋ณต์ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ๋ฐ๋ผ์, Secondary Namenode๋ ์ฃผ Namenode์ ๋ถํ๋ฅผ ์ค์ด๊ณ HDFS ํด๋ฌ์คํฐ์ ์์ ์ฑ์ ๋์ด๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. Standby Namenode: HDFS์ Standby Namenode๋ ์ฃผ Namenode์ ํจ๊ป HDFS์ ๊ณ ๊ฐ์ฉ์ฑ(High Availability, HA)๋ฅผ ์ ๊ณตํฉ๋๋ค. Standby Namenode๋ ์ฃผ Namenode์ ๋ฐ์ดํฐ์ ๋ฉํ๋ฐ..
Prometheus ๋ค์ด๋ก๋ wget https://github.com/prometheus/prometheus/releases/download/v2.35.0/prometheus-2.35.0.linux-amd64.tar.gz tar xvzf prometheus-2.35.0.linux-amd64.tar.gz Prometheus ์คํ nohup ./prometheus --config.file=prometheus.yml >> ./prometheus_run.log 2>&1 & ์ผ๋ฏํ์ผ์ ์ ํ config ๊ฐ๋ค์ ํ ๋๋ก prometheus ์คํ๋จ address=0.0.0.0:9090 Grafana ๋ค์ด๋ก๋ wget https://dl.grafana.com/enterprise/release/grafana-enterp..
์๋ฒ ๊ตฌ์ฑ๋ ์์ Zookeeper HDFS YARN MapReduce Master quorumpeermain journal node /Name Node (active) ResourceManager Job Histroyserver Standby Master quorumpeer journal node/ Name Node (stand by) ResourceManager Worker 1 quorumpeer journal node/ Data Node 1 NodeManager Worker 2 Data Node 2 NodeManager Worker 3 Data Node 3 NodeManager 1. zookeeper ์คํ - ๊ฐ ์๋ฒ zkServer.sh start - quorumpeer, quorumpeermai..
HUE ๋ค์ด๋ก๋ ์ํ๋ ํด ์ ํํ์ฌ ๋ค์ด๋ก๋ https://github.com/cloudera/hue/tags GitHub - cloudera/hue: Open source SQL Query Assistant service for Databases/Warehouses Open source SQL Query Assistant service for Databases/Warehouses - GitHub - cloudera/hue: Open source SQL Query Assistant service for Databases/Warehouses github.com Dependency ๋ฌดํ๊ณ ํต mvn, database ์ค์นํ ๊ธฐ๋ณธ์ ์ธ ์ธํ ์ ์๋ฃ (hue ๋ฐ์ดํฐ ๋ฒ ์ด์ค์ ์ ์ ์์ฑ ์์ ๊น์ง !) python p..
ํด๋น ๊ธ์ ์ ํฌ๋ธ๋ณด๊ณ ๋ฒ์ญ ๋ฐ ์ ๋ฆฌํ ๊ธ์ ๋๋ค. Hive Impala ์ํคํ ์ณ ๋งต๋ฆฌ๋์ค ๊ธฐ๋ฐ์ผ๋ก ์คํ ๋์์ผ๋, ๋ค์ํ ์์ง ์ง์ - ๋งต๋ฆฌ๋์ค - tez - ์คํํฌ ์ต๊ทผ์ tez๊ฐ ๊ธฐ๋ณธ์์ง์ผ๋ก ๋์จ๋ค๊ณ ๋ค์๋๋ฐ ํ์ธํ์ํจ ๋๊ท๋ชจ ๋ณ๋ ฌ ์ปดํจํฐ RAM ๋ง์ด ์ ์ธ์ด ์๋ฐ C++ ์ฌ์ฉ ์์ ETL ๊ณผ๊ฑฐ ์ผ๊ด ์ฒ๋ฆฌ Tez ๋ฐ LLAP๋ฅผ ํตํด interactive query์ ๊ฐ๊น์ด ์ฟผ๋ฆฌ๋ฅผ ์ ๊ณต ์ง์ฐ์๊ฐ ์งง์, interactive query ์ฅ์ Fault Torelance ํฐ ํ ์ด๋ธ๋ผ๋ฆฌ ์กฐ์ธ ๊ฐ๋ฅ interactive query ํฅ์ (Fault Tolerance ์๋) ์คํ ์คํค๋ง ํํ ์กฐ์ธ ์ต์ ํ ์ง์ ํ์ผ ํ์ ํ๋ก ํ์ผ ํฌ๋งท ๋ค์ํ ๊ตฌ์กฐ์ ๋ฐ์ ํ ๋ฐ์ดํฐ ํ์ ๋ค์ํ๊ฒ ์ง์ํ์ง๋ง Parquetํ์์ด ์ ์ผ..
Kudu Cluster ๊ตฌ์ฑ์ ๋ณด ์์ kudu1.com kudu master kudu2.com kudu master kudu3.com kudu tserver kudu4.com kudu tserver kudu5.com kudu tserver Master Server kudu1 ๋ ธ๋ [user@kudu1 ~] ${KUDU_HOME}/sbin/kudu-master/sbin/kudu-master --rpc_bind_addresses=0.0.0.0:7051 \ --log-dir=${KUDU_HOME}/logs/master \ --fs_wal_dir=${KUDU_HOME}/logs/master \ --fs_data_dirs=${KUDU_HOME}/logs/master \ --webserver_port=8051 \ ..
Airflow ์ค์น ํ ์คํ nohup airflow webserver--port 8080 > webserver.log 2>&1 & Airflow Scheduler ์คํ nohup airflow scheduler > scheduler.log 2>&1 & Aiflow DAG ๋ฆฌ์คํธ ํ์ธ airflow dags list ์คํ ํ ๊ฒฐ๊ณผ dag_id | filepath | owner | paused ==============================+===============================+=========+======= example_bash_operator | /usr/local/lib/python3.7/site | airflow | False | -packages/airflow/exam..
List of relations Schema | Name | Type | Owner --------+-------------------------------+-------+------- public | BUCKETING_COLS | table | hive public | CDS | table | hive public | COLUMNS_V2 | table | hive public | CTLGS | table | hive public | DATABASE_PARAMS | table | hive public | DBS | table | hive public | DB_PRIVS | table | hive public | DELEGATION_TOKENS | table | hive public | FUNCS | ta..
kudu๊ฐ ๋ญ์ง, ์ฌ์ฉํด๋ณด์ง๋ ๋ชปํ๊ณ rpm ๋น๋๋ฅผ ํด์ผํ๋ ์ํฉ์์ ๊ธ์ ์ผ๋ค๊ฐ ์ต๊ทผ์ ๋ค์ ์์ ํ๊ฒ ๋์๋ค. ํ์ฌ๋ kudu๋ ์ฌ์ฉํด๋ณด์ง ๋ชปํ๋ค. ๊ทธ๋ฌ๋ ํ๋ก์์ฝ์์คํ ์ ์ฌ์ฉํ๋ค๋ณด๋ฉด ๋๋ถ๋ถ ์ํคํ ์ณ๊ฐ ์ ์ฌํ ๋๋์ด๋ผ ์ดํดํ๋๋ฐ ํฌ๊ฒ ์ด๋ ต์ง๋ ์๋ค. ์ฒ์์ kudu ์ฐพ์๋ดค์ ๋ kudo์ ์ํคํ ์ณ๋ hbase์ ์ ์ฌํ ์ ์ด ์๋ค. ๊ทธ๋์ hbase๋ฅผ ์ฌ์ฉํด๋ดค๊ฑฐ๋ ํ๋ค๋ฉด, kudu์ดํดํ๋๋ฐ์ ํฌ๊ฒ ์ด๋ ค์์ด ์์ ๊ฒ์ด๋ค. kudu์์ ํต์ฌ ํค์๋๋ key-value ์ด๋ค. ์ผ๋จ, kudu๋ฅผ ๊ฒ์ํด์ ์ด๊ฒ ์ ๊ฒ ๋ณด๋ค๋ณด๋ฉด ๊ทธ๋์ hbase๊ฐ์๊ฑฐ๋ผ๋ ๊ฑด๊ฐ? ์๊ฐ์ด ๋ ๋ค. ๋ฐ๋ผ๋ค๋๋ ํค์๋๊ฐ key-value๋ก ์ธ๋ฐ, hbase ๋ํ key-value๊ฐ ํต์ฌํค์๋์ด๋ค. kudu ์ ์ hbase kudu๋ฅผ ์์๋ณด๊ธฐ..