๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กBIGDATA/ํ•˜๋‘ก์—์ฝ”์‹œ์Šคํ…œ (34)

data_lab

hdfs ๊ตฌ์„ฑ์—์„œ secondary namenode ์™€ HA๋กœ ๋œ stand by namenode์˜ ์—ญํ• ์— ์ฐจ์ด

Secondary Namenode: HDFS์˜ Secondary Namenode๋Š” ์ฃผ Namenode์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ •๋ณด๋ฅผ ์ฃผ๊ธฐ์ ์œผ๋กœ ์ˆ˜์ง‘ํ•˜์—ฌ ๋กœ๊ทธ ํŒŒ์ผ์„ ํ•ฉ์นฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋กœ๊ทธ ํŒŒ์ผ์€ ์ฃผ Namenode๊ฐ€ ๊ณ ์žฅ ๋‚ฌ์„ ๋•Œ, ์ด์ „์— ์ˆ˜์ง‘๋œ ๋กœ๊ทธ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ฃผ Namenode๋ฅผ ๋ณต๊ตฌํ•˜๊ณ  ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ •๋ณด๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, Secondary Namenode๋Š” ์ฃผ Namenode์˜ ๋ถ€ํ•˜๋ฅผ ์ค„์ด๊ณ  HDFS ํด๋Ÿฌ์Šคํ„ฐ์˜ ์•ˆ์ •์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค. Standby Namenode: HDFS์˜ Standby Namenode๋Š” ์ฃผ Namenode์™€ ํ•จ๊ป˜ HDFS์˜ ๊ณ ๊ฐ€์šฉ์„ฑ(High Availability, HA)๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Standby Namenode๋Š” ์ฃผ Namenode์˜ ๋ฐ์ดํ„ฐ์™€ ๋ฉ”ํƒ€๋ฐ..

Imapa VS Hive

ํ•ด๋‹น ๊ธ€์€ ์œ ํˆฌ๋ธŒ๋ณด๊ณ  ๋ฒˆ์—ญ ๋ฐ ์ •๋ฆฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. Hive Impala ์•„ํ‚คํ…์ณ ๋งต๋ฆฌ๋“€์Šค ๊ธฐ๋ฐ˜์œผ๋กœ ์‹คํ–‰ ๋˜์—ˆ์œผ๋‚˜, ๋‹ค์–‘ํ•œ ์—”์ง„ ์ง€์› - ๋งต๋ฆฌ๋“€์Šค - tez - ์ŠคํŒŒํฌ ์ตœ๊ทผ์—” tez๊ฐ€ ๊ธฐ๋ณธ์—”์ง„์œผ๋กœ ๋‚˜์˜จ๋‹ค๊ณ  ๋“ค์—ˆ๋Š”๋ฐ ํ™•์ธํ•„์š”ํ•จ ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ ์ปดํ“จํ„ฐ RAM ๋งŽ์ด ์”€ ์–ธ์–ด ์ž๋ฐ” C++ ์‚ฌ์šฉ ์˜ˆ์‹œ ETL ๊ณผ๊ฑฐ ์ผ๊ด„ ์ฒ˜๋ฆฌ Tez ๋ฐ LLAP๋ฅผ ํ†ตํ•ด interactive query์— ๊ฐ€๊นŒ์šด ์ฟผ๋ฆฌ๋ฅผ ์ œ๊ณต ์ง€์—ฐ์‹œ๊ฐ„ ์งง์Œ, interactive query ์žฅ์  Fault Torelance ํฐ ํ…Œ์ด๋ธ”๋ผ๋ฆฌ ์กฐ์ธ ๊ฐ€๋Šฅ interactive query ํ–ฅ์ƒ (Fault Tolerance ์•„๋‹˜) ์Šคํƒ€ ์Šคํ‚ค๋งˆ ํ˜•ํƒœ ์กฐ์ธ ์ตœ์ ํ™” ์ง€์› ํŒŒ์ผ ํ˜•์‹ ํ•˜๋‘ก ํŒŒ์ผ ํฌ๋งท ๋‹ค์–‘ํ•œ ๊ตฌ์กฐ์™€ ๋ฐ˜์ •ํ˜• ๋ฐ์ดํ„ฐ ํ˜•์‹ ๋‹ค์–‘ํ•˜๊ฒŒ ์ง€์›ํ•˜์ง€๋งŒ Parquetํ˜•์‹์ด ์ œ์ผ..

[kudu] apache kudu ๋ž€ (23.12.01 ์ˆ˜์ •)

kudu๊ฐ€ ๋ญ”์ง€, ์‚ฌ์šฉํ•ด๋ณด์ง€๋„ ๋ชปํ•˜๊ณ  rpm ๋นŒ๋“œ๋ฅผ ํ•ด์•ผํ•˜๋Š” ์ƒํ™ฉ์—์„œ ๊ธ€์„ ์ผ๋‹ค๊ฐ€ ์ตœ๊ทผ์— ๋‹ค์‹œ ์ˆ˜์ •ํ•˜๊ฒŒ ๋˜์—ˆ๋‹ค. ํ˜„์žฌ๋„ kudu๋Š” ์‚ฌ์šฉํ•ด๋ณด์ง€ ๋ชปํ–ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํ•˜๋‘ก์—์ฝ”์‹œ์Šคํ…œ์„ ์‚ฌ์šฉํ•˜๋‹ค๋ณด๋ฉด ๋Œ€๋ถ€๋ถ„ ์•„ํ‚คํ…์ณ๊ฐ€ ์œ ์‚ฌํ•œ ๋Š๋‚Œ์ด๋ผ ์ดํ•ดํ•˜๋Š”๋ฐ ํฌ๊ฒŒ ์–ด๋ ต์ง€๋Š” ์•Š๋‹ค. ์ฒ˜์Œ์— kudu ์ฐพ์•„๋ดค์„ ๋•Œ kudo์˜ ์•„ํ‚คํ…์ณ๋Š” hbase์™€ ์œ ์‚ฌํ•œ ์ ์ด ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ hbase๋ฅผ ์‚ฌ์šฉํ•ด๋ดค๊ฑฐ๋‚˜ ํ–ˆ๋‹ค๋ฉด, kudu์ดํ•ดํ•˜๋Š”๋ฐ์—” ํฌ๊ฒŒ ์–ด๋ ค์›€์ด ์—†์„ ๊ฒƒ์ด๋‹ค. kudu์—์„œ ํ•ต์‹ฌ ํ‚ค์›Œ๋“œ๋Š” key-value ์ด๋‹ค. ์ผ๋‹จ, kudu๋ฅผ ๊ฒ€์ƒ‰ํ•ด์„œ ์ด๊ฒƒ ์ €๊ฒƒ ๋ณด๋‹ค๋ณด๋ฉด ๊ทธ๋ž˜์„œ hbase๊ฐ™์€๊ฑฐ๋ผ๋Š” ๊ฑด๊ฐ€? ์ƒ๊ฐ์ด ๋“ ๋‹ค. ๋”ฐ๋ผ๋‹ค๋‹ˆ๋Š” ํ‚ค์›Œ๋“œ๊ฐ€ key-value๋กœ ์ธ๋ฐ, hbase ๋˜ํ•œ key-value๊ฐ€ ํ•ต์‹ฌํ‚ค์›Œ๋“œ์ด๋‹ค. kudu ์ „์— hbase kudu๋ฅผ ์•Œ์•„๋ณด๊ธฐ..