์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- standalone
- airflow
- ๋ฆฌ๋ ์ค RPM
- ansible
- ๋น ๋ฐ์ดํฐ
- aws ccp
- ์๋ผ์คํฑ์์น
- hadoop
- elastic stack
- ํด ์ค์น
- ํ๋ก์์ฝ์์คํ
- ๋ฆฌ๋ ์ค
- ์ํ์น ์คํํฌ
- ํ์ด๋ธ
- ํ๋ก
- ์ฑ๊ธ์๋ฒ
- ์คํํฌ
- ํ๋ก์ค์น
- BIGDATA
- ์ค์๋ธ
- rpmbuild
- kudu
- HBase
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- LeetCode
- ์ค์นผ๋ผ ๋ถ
- ๋ฆฟ์ฝ๋
- CLF-C02
- ์ค์๋ธ ์ค์น
- Apache spark
- Today
- Total
๋ชฉ๋กํ๋ก์์ฝ์์คํ (9)
data_lab
HUE ๋ค์ด๋ก๋ ์ํ๋ ํด ์ ํํ์ฌ ๋ค์ด๋ก๋ https://github.com/cloudera/hue/tags GitHub - cloudera/hue: Open source SQL Query Assistant service for Databases/Warehouses Open source SQL Query Assistant service for Databases/Warehouses - GitHub - cloudera/hue: Open source SQL Query Assistant service for Databases/Warehouses github.com Dependency ๋ฌดํ๊ณ ํต mvn, database ์ค์นํ ๊ธฐ๋ณธ์ ์ธ ์ธํ ์ ์๋ฃ (hue ๋ฐ์ดํฐ ๋ฒ ์ด์ค์ ์ ์ ์์ฑ ์์ ๊น์ง !) python p..
์ฌ์ ์์ ํ์ root ๊ณ์ ์ JAVA_HOME ์ถ๊ฐ ํ์ํจ solr ์ค์น Maven 3.6.3 ์ค์น PostgreSQL ์ค์น ๋ฐ DB - ranger, User - rangeradmin(pw:rangeradmin) ์์ฑ ์์ ๋ค ์คํํ ๋ root ๋๋ ๊ถํ ๊ฐ์ง ๊ณ์ ์ผ๋ก ํด์ผํจ solr ์ค์นํ์! https://n-a-y-a.tistory.com/m/68 [Apache Solr] Apache solr 8.5.0 ์ค์นํ๊ธฐ ranger, atlas๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด ์ ์ค์นํด์ผํ๋ ์คํ์์ค์ด๋ค. https://archive.apache.org/dist/lucene/solr/8.5.0/ Index of /dist/lucene/solr/8.5.0 archive.apache.org ํด๋น ์ฌ์ดํธ์์ 8.5.0๋ฒ์ ์ ..
์ํ์น ์์ด๋ธ๋ก๋ ? - ํน์ ์ธ์ด์ ์ข ์๋์ง ์๋ ์ธ์ด ์ค๋ฆฝ์ ๋ฐ์ดํฐ ์ง๋ ฌํ ์์คํ - ํ๋ก Writable์ ์ฃผ์ ๋จ์ ์ธ ์ธ์ด ์ด์์ฑ ํด๊ฒฐ ์ํด ์๊ฒจ๋จ ์ํ์น ์ฐ๋ฆฌํํธ, ๊ตฌ๊ธ ํ๋กํ ์ฝ ๋ฒํผ์ ๋ค๋ฅธ ์ฐจ๋ณํ๋ ํน์ฑ๊ฐ์ง๊ณ ์์ ๋ฐ์ดํฐ๋ ๋ค๋ฅธ ์์คํ ๊ณผ ๋น์ทํ๊ฒ ์ธ์ด ๋ ๋ฆฝ ์คํค๋ง๋ก ๊ธฐ์ ๋จ ์์ด๋ธ๋ก์์ ์ฝ๋ ์์ฑ์ ์ ํ์ฌํญ์ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ณ ์ฐ๋ ์์ ์ ์คํค๋ง๋ ํญ์ ์กด์ฌํ๋ค ๊ฐ์ ํจ - ๋งค์ฐ ๊ฐ๊ฒฐํ ์ฝ๋ฉ์ด ๊ฐ๋ฅ ์คํค๋ง์ ์์ฑ JSON ๋ฐ์ดํฐ๋ ๋ฐ์ด๋๋ฆฌ ํฌ๋งท์ผ๋ก ์ธ์ฝ๋ฉ ์์ด๋ธ๋ก ๋ช ์ธ - ๋ชจ๋ ๊ตฌํ์ฒด๊ฐ ์ง์ํด์ผ ํ๋ ๋ฒ์ด๋๋ฆฌ ํฌ๋งท์ ๋ํ ์์ธํ ๋ด์ฉ API - ์์ด๋ธ๋ก ๋ช ์ธ์์ ๋น ์ ธ์๋ ๋ด์ฉ์. ๊ฐ ํน์ ์ธ์ด์ ๋ฐ๋ผ ๋ค๋ฅด๊ฒ ์์ฑ๋จ. ์ธ์ด์ ๋ฐ์ธ๋ฉ ํธ์์ฑ ๋์ด๊ณ ์ํธ์ด์์ฑ ์ ํ ๋ฌธ์ ํด๊ฒฐ๋จ ์คํค๋งํด์ - ์ ์คํ๊ฒ ์ ์๋..
hue ์ค์น ํ ๋ ์์ ์๋ ํ๋ก ์์ฝ์์คํ ๋ค์ด ์ด๋์ ๋ ์ค์น๋์๋ค๊ณ ๊ฐ์ ํ๊ณ ์งํํ๊ฒ ๋ค. ํด์ ๊ฒฝ์ฐ ์ค์นํ๊ธฐ์ ์ ์ฌ์ ์์ ์ ํด์ค์ผ ํ๋ค. postgres๋ ๋ค๋ฅธ ํฌ์คํธ์์ ์ค์ ์ ๋ค๋ฃจ๊ธฐ๋ก ํ๊ณ , ํด ์ค์น ๊ฐ์ด๋ ์์๋ ํด์์ ์ฌ์ฉํ ๋ฐ์ดํฐ ๋ฒ ์ด์ค ์์ฑ์ ๋๋ง ๋ค๋ฃฐ ์์ ์ด๋ค. ์ฌ์ ์์ ํด๋ ํ์ด์ฌ์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ํ๊ฒฝ๋ณ์๋ก ํ์ด์ฌ ๋ฒ์ ์ ์ก์์ค์ผํ๋ค. ํ๊ฒฝ๋ณ์๋ .bash_profile ์ ์ถ๊ฐํ์๋ค. ํ์ด์ฌ ํ๊ฒฝ๋ณ์ ์ถ๊ฐ $ sudo vi ~/..bash_profile export PYTHON_VER=python3.8 psycopg2 ์ค์น (์ ์ pip๋ ์ค์น๋์ด ์์ด์ผํจ) $ pip install psycopg2 $ python setup.py build $ sudo python setup.py i..
์ฃผํคํผ๋ ๋ถ์ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํ ๋ถ์ฐ ์ฝ๋๋ค์ด์ ์ด๋ค. znode(์ ๋๋ ธ๋)๊ฐ ๊ฐ๊ฐ์ ์๋ฒ์ ์์นํด ์๋ค.๊ฐ ํ๋ก์ ์๋น์ค๋ค์ด ์ ๋์ํ๊ณ ์๋์ง ํ์ธํ๋ค.์ฃผ๊ธฐ์ ์ผ๋ก ํํธ๋นํธ ์๊ตฌํ์ฌ ๋ฐ๋ ๋ฐฉ์์ผ๋ก, ๋ฐ๋ผ์ ์ฃผ๊ธฐํผ๋ ํ์๋ก ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ฑํ๋๋ฐ์ฌ๊ธฐ์ ๋ค์ด๊ฐ๋ ๊ฐ๋ ์ด ์ฟผ๋ผ์ด๋ค. ์ฟผ๋ผ์ด๋? ๋ค์๊ฒฐ๋ก ์๋ฅผ ๋ค์ด 5๊ฐ์ ์๋ฒ๋ก ๊ตฌ์ฑ ๋์ด์๊ณ ,2๊ฐ์ ์๋ฒ๊ฐ ์ฃฝ๋๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ ์์ ์ผ๋ก ๋์ํ๋ค๊ณ ํ๋จํ๋ค.๊ทธ๋ฆฌ๊ณ 5๊ฐ ์ค 3๊ฐ์ ์๋ฒ๊ฐ ์ฃฝ์์ ๊ฒฝ์ฐ, ๋ค์๊ฒฐ๋ก ์ธํด ๋น์ ์์ด๋ผ๊ณ ํ๋คํ๋ค.๊ทธ๋ก ์ธํด, ์ฃผํคํผ๋ ํ์๋ก ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ฑํ๋ค. zookeeper ํด๋ฌ์คํฐ๋ํ๋์ ์๋ฒ๊ฐ ๋ฆฌ๋์ด๊ณ , ๋ค๋ฅธ ์๋ฒ๋ ํ๋ก์์ด๋ค๋ฆฌ๋ ์๋ฒ๋ฅผ ๊ธฐ์ค์ผ๋ก sync๋ฅผ ๋ง์ถ๋ค. ์์ธํ ๋ด์ฉ์ ๊ณต์ ์ฌ์ดํธ ์ฐธ์กฐ๋ฐ๋ ์ฃผํคํผ ์ค์น ๋ฐฉ๋ฒ์ฃผํคํผ ํ์ผ ..
livy-env.sh export SPARK_HOME=/usr/lib/spark export HADOOP_CONF_DIR=/etc/hadoop/conf livy start ./bin/livy-server start livy ์ ์๋์ํ๋์ง spark์์ ํ ์คํธํ๋ ์์ sudo pip install requests import json, pprint, requests, textwrap host = 'http://localhost:8998' data = {'kind': 'spark'} headers = {'Content-Type': 'application/json'} r = requests.post(host + '/sessions', data=json.dumps(data), headers=headers) r..
https://dlcdn.apache.org/hive/hive-3.1.2/ Index of /hive/hive-3.1.2 dlcdn.apache.org apache mirror ์ฌ์ดํธ์์ ์ํ๋ hive ๋ฒ์ ์ binary ํด๋๋ฅผ ๋ค์ด๋ฐ๋๋ค. ์ฌ์ ์์ - Hadoop Path ์ค์ ๋์ด์์ด์ผํจ export HADOOP_HOME= ์์ถํด์ wget https://dlcdn.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz tar xvzf apache-hive-3.1.2-bin.tar.gz ํ๊ฒฝ๋ณ์ ์ค์ Hive ํ ํ๊ฒฝ๋ณ์๋ฅผ ์ค์ ํด์ผํ๋ค. .bash_prifile์์ ์์ ํ๋ ๋ฐฉ์๋ณด๋จ /etc/profile.d/์ ์ ์คํฌ๋ฆฝํธ๋ฅผ ์ถ๊ฐํด์ค๊ฒ vi /etc/p..
RDBMS ์คํค๋ง์ ์์กด์ฑ ๊ฐํจ ์ผ๋ก ์์ ์ด ์งํ ๋ถ๊ฐ๋ฅํ ๊ฒฝ์ฐ๊ฐ ์์ - ์คํค๋ง๊ฐ ์ ๋๋ก ์ ์๋์ด ์์ง์๊ฑฐ๋ - ์ฟผ๋ฆฌ๋ฅผ ํตํ ์ง์๊ฐ ์คํค๋ง์ ๋ง์ง ์์ ๊ฒฝ์ฐ ๋์ฉ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌํ๋๋ฐ ๋ถ์ ์ ํจ โ ๋ง์ ์๊ฐ ์์๋จ HIVE ๋ฐ์ดํฐ์จ์ด ํ์ฐ์ง ์ธํ๋ผ ๋ฐ์ดํฐ ์ ์ฅ, ์ฒ๋ฆฌ์ ์คํค๋ง ๊ฒ์ฆ ์์ ์คํค๋ง์ ๋ง์ง ์๋ ์ฟผ๋ฆฌ๋ null ๋ฆฌํด SQL๊ณผ ์ ์ฌํ HiveQL ์ฌ์ฉ MapReduce ํ๋ก๊ทธ๋จ ์์ฑ ๋์ ์ฟผ๋ฆฌ ์ธํฐํ์ด์ค ์๋น์ค ์ ๊ณต ์ฟผ๋ฆฌ ์คํ ์ MapReduce ํ๋ก๊ทธ๋จ์ผ๋ก ์ ํ๋์ด ๊ฒฐ๊ณผ ์์ฑ ๋น ์ ํํ๋ ์ ๋ ฅ ์์ค ๋ถ์์๋ ์ ํฉํ์ง ์์ HIVE Architecture -HIVE Client -JDBC ์์ฉ ํ๋ก๊ทธ๋จ ์ง์ , -Thrift ๊ธฐ๋ฐ ์์ฉ ํ๋ก๊ทธ๋จ ์ง์(์๋ก ์ปค๋ฎค๋์ผ์ด์ ํ ์ ์๋ ํต์ ํ๋กํ ์ฝ..
ํ๋ก์ ๋ค์ด๊ฐ๊ธฐ ์์ ๋น ๋ฐ์ดํฐ๊ฐ ๋ญ์ง ์์๋ณด๋ ค ํ๋ค. ๋น ๋ฐ์ดํฐ๋ ? ๊ธฐ์กด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ด๋ฆฌ ๋๊ตฌ ๋ฐฉ๋ฒ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ ๊ท๋ชจ๋ก ๋ณต์กํ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ๊ธฐ์กด์ ๋ฐ์ดํฐ ๋ฒ ์ด์ค๋ OLTP์ฑ์ผ๋ก ๋น ๋ฅด๊ณ ์ ํํ๋ค. ๋น ๋ฐ์ดํฐ๋ ์ ํ์ฑ์ ์ด์ ์ ๋๊ธฐ๋ณด๋ค๋ ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ์ฒ๋ฆฌํ๋๋ฐ์ ์ด์ ์ ๋๊ณ ์๋ค. ๋ฐ๋ผ์ pk, update๋ฑ ์๋๊ณ ๋ฐ์ดํฐ๋ฅผ ์๋ก putํด์ผ ํ๋ค. ๋น ๋ฐ์ดํฐ 3V Volume ๋๊ท๋ชจ์ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. (๊ธฐ์ ๋ง๋ค ์ฐจ์ด๋ ์์ง๋ง ์์ญํ ๋ผ๋ฐ์ดํธ๋ถํฐ ์์ญํํ๋ฐ์ดํฐ ์ด์) Variety ์กด์ฌํ๋ ๋ฐ์ดํฐ์ ๋ฐฉ์์ด ๋ค์ํ๋ค. ์ ํ : ์๋ฏธ ํ์ ํ๊ธฐ ์ฌ์ฐ๋ฉฐ ๊ท์น์ ์ธ ๋ฐ์ดํฐ ๋ฐ์ ํ: HTML, XML,JSON ํํ๋ก ํ ํ ์คํธ์ column, value ๊ฐ์ด ๋น์ ํ:ํ ์คํธ, ์์ฑ, ์์ ..