๋ฐ˜์‘ํ˜•

๋น…๋ฐ์ดํ„ฐ ๋ถ„์•ผ ์ค‘ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋ง์— ๊ด€ํ•œ ์ฑ…๋„ ์ถœ๊ฐ„์ด ๋งŽ์ด ๋Š˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฆฌ๋ทฐํ•  ์ฑ…์€ ํ•œ๋น›๋ฏธ๋””์–ด์˜ "๊ฒฌ๊ณ ํ•œ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋ง"์ž…๋‹ˆ๋‹ค.

https://www.yes24.com/Product/Goods/119712582

 

๊ฒฌ๊ณ ํ•œ ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง - YES24

์‹ค์šฉ์ ์ธ ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ์„ธ๊ณ„๋กœ ์ด๋„๋Š” ์ตœ๊ณ ์˜ ์•ˆ๋‚ด์„œ!๊ณ ๊ฐ ์š”๊ตฌ ์‚ฌํ•ญ์— ๋งž๋Š” ์‹œ์Šคํ…œ์„ ๊ณ„ํšํ•˜๊ณ  ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ๋ถ„์•ผ๊ฐ€ ๋น ๋ฅด๊ฒŒ ์„ฑ์žฅํ•˜๋ฉด์„œ ๋งŽ์€ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด

www.yes24.com

์›์„œ ์ œ๋ชฉ์€ ์˜ค๋ผ์ผ๋ฆฌ์‚ฌ์˜ The Fundamental of Data Engineering ์ž…๋‹ˆ๋‹ค.

 

 

ํ•ด๋‹น ์ฑ…์€ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด์—๊ฒŒ ์ถ”์ฒœ์ด ๋งŽ์€ ์ฑ…์ž…๋‹ˆ๋‹ค. ๊ผญ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๊ฐ€ ์•„๋‹ˆ๋”๋ผ๋„ ํ•ด๋‹น ์ง๋ฌด์— ๊ด€์‹ฌ์ด์žˆ๊ฑฐ๋‚˜ ๋น…๋ฐ์ดํ„ฐ๋ฅผ ๋„์ž…ํ•˜๊ฑฐ๋‚˜ ๊ด€์‹ฌ์ด ์žˆ๋Š” ๋ถ„์—๊ฒŒ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค. ์ €๋„ ์ถœ๊ฐ„๋˜๋Š”๊ฒƒ์„ ๊ธฐ๋‹ค๋ ธ๋Š”๋ฐ, ์ถœ๊ฐ„๋˜๊ณ  ์šด์ด์ข‹๊ฒŒ ์ด๋ฒคํŠธ๋กœ ์ฑ…์„ ๋ฐ›์•„ ๋ณผ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

 

๊ฐ„๋‹จํ•œ ๋ชฉ์ฐจ๋ฅผ ๋ณด๋ฉด ์ด๋ ‡๊ฒŒ ๊ตฌ์„ฑ๋˜์–ด์žˆ์Šต๋‹ˆ๋‹ค.

[PART I ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ๊ธฐ๋ฐ˜ ๊ตฌ์ถ•ํ•˜๊ธฐ]
CHAPTER 1 ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ƒ์„ธ
CHAPTER 2 ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช… ์ฃผ๊ธฐ
CHAPTER 3 ์šฐ์ˆ˜ํ•œ ๋ฐ์ดํ„ฐ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„
CHAPTER 4 ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช… ์ฃผ๊ธฐ ์ „์ฒด์— ๊ฑธ์นœ ๊ธฐ์ˆ  ์„ ํƒ

[PART II ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช… ์ฃผ๊ธฐ ์‹ฌ์ธต ๋ถ„์„]
CHAPTER 5 1๋‹จ๊ณ„: ์›์ฒœ ์‹œ์Šคํ…œ์—์„œ์˜ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ
CHAPTER 6 2๋‹จ๊ณ„: ๋ฐ์ดํ„ฐ ์ €์žฅ
CHAPTER 7 3๋‹จ๊ณ„: ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘
CHAPTER 8 4๋‹จ๊ณ„: ์ฟผ๋ฆฌ ๋ชจ๋ธ๋ง ๋ฐ ๋ฐ์ดํ„ฐ ๋ณ€ํ™˜
CHAPTER 9 5๋‹จ๊ณ„: ๋ถ„์„, ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐ ์—ญ ETL์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ์„œ๋น™


[PART III ๋ณด์•ˆ, ๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ ๋ฐ ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ๋ฏธ๋ž˜]
CHAPTER 10 ๋ณด์•ˆ๊ณผ ๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ
CHAPTER 11 ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ๋ฏธ๋ž˜

์ด์ฑ…์€ ์•ฝ 534ํŽ˜์ด์ง€์ •๋„๋กœ ๋งŽ์€ ๋‚ด์šฉ์„ ๋‹ค๋ฃจ๋Š” ์–‘์ด๊ณ , ๊ด€์‹ฌ์ด ์žˆ์œผ์‹  ๋ถ„๋“ค์€ ๊ผญ! ์„œ์ ์—์„œ ๋ณด๊ฑฐ๋‚˜ ๊ตฌ๋งคํ•ด์„œ ๋ณด๊ธฐ๋ฅผ ์ถ”์ฒœํ•ฉ

๋‚ด์šฉ ์ค‘ ์ฑ•ํ„ฐ 4 "๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช… ์ฃผ๊ธฐ ์ „์ฒด์— ๊ฑธ์นœ ๊ธฐ์ˆ  ์„ ํƒ" ๋ฅผ ๋ฆฌ๋ทฐํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.

 

๋“ค์–ด๊ฐ€๊ธฐ์ „์— ์ƒ๊ฐ ์ •๋ฆฌ

๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋งํŒ€ ๊ฐ ํšŒ์‚ฌ์—์„œ ๋ถ€๋ฅด๋Š” ๋ช…์นญ์ด ๋‹ค์–‘ํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค

๋ฐ์ดํ„ฐํ”Œ๋žซํผํŒ€, ๋ฐ์ดํ„ฐ๊ฐœ๋ฐœํŒ€, ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋งํŒ€ ๋“ฑ๋“ฑ ๋ช…์นญ๋„ ๋‹ค์–‘ํ•˜๊ณ  ๊ทธ ํŒ€์—์„œ ์—…๋ฌด๋˜ํ•œ ํšŒ์‚ฌ๋งˆ๋‹ค ๋ฒ”์œ„๊ฐ€ ๋‹ค๋ฅผ๊ฒƒ๊ฐ™์Šต๋‹ˆ๋‹ค.

ํ•˜๋‘ก์—์ฝ”์‹œ์Šคํ…œ ์šด์˜, ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ ์žฌ, ํƒ€ํŒ€์œผ๋กœ ๋ฐ์ดํ„ฐ ๋”œ๋ฆฌ๋ฒ„๋ฆฌ ๋„“๊ฒŒ๋Š” ์‹œ๊ฐํ™” ๋“ฑ๋“ฑ์˜ ์—…๋ฌด๋„ ํŒ€๋‚ด ์—…๋ฌด๋กœ ์ง€์ •์ด ๋˜์–ด์žˆ์„๊ฒƒ์œผ๋กœ ์ถ”์ธก๋ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐํŒ€์— ์ด๋ฏธ ๊ธฐ์กด์— ๊ตฌ์ถ•๋˜์–ด ์žˆ๋Š” ํ•˜๋‘กํ”Œ๋žซํผ์ด ์žˆ๊ณ  ์ข€ ๋” ํšจ์œจ์ ์ธ ์—…๋ฌด์ง„ํ–‰์„ ์œ„ํ•ด์„œ ์ƒˆ๋กœ์šด ์˜คํ”ˆ์†Œ์Šค ๋„์ž… ๋˜๋Š” ์ถ”๊ฐ€๊ฐœ๋ฐœ์ด ์—†์–ด์ง„ ์˜คํ”ˆ์†Œ์Šค ์ œ๊ฑฐ ๋“ฑ๋“ฑ์œผ๋กœ ๊ธฐ์ˆ  ๊ณ ๋ฏผ์ด ์žˆ์—ˆ์œผ๋ฉฐ ์•ž์œผ๋กœ๋„ ๊ด€๋ จ๋œ ๊ณ ๋ฏผ์ด ๋Š˜์–ด๋‚  ๊ฒƒ์ด๋ผ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๊ฐ€์žฅ ์ตœ๊ทผ์—๋Š” ํด๋ผ์šฐ๋“œ ๋„์ž…์œผ๋กœ ์ธํ•œ ํ•˜๋‘ก๋งˆ์ด๊ทธ๋ ˆ์ด์…˜ ์—…๋ฌด ๋˜๋Š” ์˜คํ”ˆ์†Œ์Šค๊ต์ฒด ๋“ฑ์˜ ์—…๋ฌด๋ฅผ ์ง„ํ–‰ํ•˜๋Š” ๋ถ„๋“ค์ด ๋Š˜์–ด๋‚ฌ์„ ๊ฒƒ์ด๋ผ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๊ฒฌ๊ณ ํ•œ ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ฑ…์€ ์‹ค์ œ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋“ค์ด ํ•˜๋Š” ์—…๋ฌด์™€ ํ˜„์žฌ ์—…๋ฌด์—์„œ ๋ถ€๋”ชํžŒ ๋ฌธ์ œ์— ๊ด€๋ จํ•ด์„œ ํžŒํŠธ๋ฅผ ์ค๋‹ˆ๋‹ค.

์ €๋Š” ๋งŽ์€ ๋‚ด์šฉ ์ค‘์— ํ˜„์žฌ์™€ ๋ฏธ๋ž˜์— ๋Œ€ํ•œ ๊ธฐ์ˆ ๋น„๊ต ๋ฐ์ดํ„ฐ ์ €์žฅ์†Œ์˜ ์œ„์น˜ ๋น„๊ต ๋“ฑ์„ ๋‹ค๋ฃฌ "๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช… ์ฃผ๊ธฐ ์ „์ฒด์— ๊ฑธ์นœ ๊ธฐ์ˆ  ์„ ํƒ" ์ฑ•ํ„ฐ๋ฅผ ์ฝ๊ณ  ๋ฆฌ๋ทฐํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.

 

๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช…์ฃผ๊ธฐ ์ „์ฒด์— ๊ฑธ์นœ ๊ธฐ์ˆ  ์„ ํƒ

์•„ํ‚คํ…์ณ๋ฅผ ์‹คํ˜„ํ•˜๋Š”๋ฐ ์“ฐ์ด๋Š” ๋„๊ตฌ๋Š” "์–ด๋–ป๊ฒŒ" ๊ตฌ์ถ•ํ• ์ง€ ๊ฒฐ์ •ํ•œ

๊ธฐ์ˆ (๋„๊ตฌ)์„ ์„ ํƒํ•  ๋•Œ ๊ณ ๋ คํ•ด์•ผํ•˜๋Š” ์‚ฌํ•ญ์ด๋‹ค.

 

1. ํŒ€์˜ ๊ทœ๋ชจ์™€ ๋Šฅ๋ ฅ

2. ์‹œ์žฅ ์ถœ์‹œ ์†๋„

3. ์ƒํ˜ธ์šด์šฉ์„ฑ

4. ๋น„์šฉ์ตœ์ ํ™” ๋ฐ ๋น„์ฆˆ๋‹ˆ์Šค ๊ฐ€์น˜

5. ํ˜„์žฌ์™€ ๋ฏธ๋ž˜: ๋ถˆ๋ณ€์˜ ๊ธฐ์ˆ ๊ณผ ์ผ์‹œ์  ๊ธฐ์ˆ  ๋น„๊ต

6. ๊ตฌ์ถ•๊ณผ ๊ตฌ๋งค ๋น„๊ต

7. ๋ชจ๋†€๋ฆฌ์‹๊ณผ ๋ชจ๋“ˆ์‹ ๋น„๊ต

8. ์„œ๋ฒ„๋ฆฌ์Šค์™€ ์„œ๋ฒ„์˜ ๋น„๊ต

9. ์ตœ์ ํ™”, ์„ฑ๋Šฅ, ๋ฒค์น˜๋งˆํฌ

10. ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ์ˆ˜๋ช…์ฃผ๊ธฐ์˜ ๋“œ๋Ÿฌ๋‚˜์ง€์•Š๋Š” ์š”์†Œ

 

๊ธฐ์ˆ  ์„ ํƒ์— ๊ณ ๋ คํ•ด์•ผํ•˜๋Š” ์š”์†Œ ์ค‘

5๋ฒˆ ํ•ญ๋ชฉ ํ˜„์žฌ์™€ ๋ฏธ๋ž˜์˜ ๋ถˆ๋ณ€์˜ ๊ธฐ์ˆ ๊ณผ ์ผ์‹œ์ ์ธ ๊ธฐ์ˆ ์— ๋Œ€ํ•ด ๋น„๊ตํ•ด๋ณด์ž ํ•œ๋‹ค.

์ฒ˜์Œ์— ๋ณด๋ฉด ๊ธ€์”จ๋กœ ์ ‘ํ•ด ์กฐ๊ธˆ ์–ด๋ ค์šด๊ฒƒ ๊ฐ™์œผ๋‚˜ ์‰ฝ๊ฒŒ ๋‹ค์‹œ ์ƒ๊ฐํ•ด๋ณด๋ฉด ๋ฐ”๋€Œ์ง€ ์•Š๋Š” ๊ธฐ์ˆ ๋“ค๊ณผ ๊ณ„์†ํ•ด์„œ ํŠธ๋ Œ๋“œ๊ณผ ๋ฐ”๋€Œ๋Š” ๊ธฐ์ˆ ๋“ค์ด ์žˆ๋‹ค.

์‰ฝ๊ฒŒ ๋ฐ”๋€Œ์ง€ ์•Š๋Š” ๊ธฐ์ˆ ๋กœ๋Š” ๋„คํŠธ์›Œํฌ, ๋ณด์•ˆ ๋“ฑ์ด ์žˆ๋‹ค.

์‰ฝ๊ฒŒ ๋ฐ”๋€Œ์ง€์•Š๋Š” ๊ธฐ์ˆ ์— ์ถ”๊ฐ€๋  ๊ธฐ์ˆ ๋กœ๋Š” AWS S3, GCP Bigquery, Azure Blob ๋“ฑ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ์ฒด ์Šคํ† ๋ฆฌ์ง€์— ์ €์žฅํ•˜๋Š” ๊ฒƒ์ด ํ˜„๋ช…ํ•œ ์„ ํƒ์ด๋‹ค.

์ผ์‹œ์ ์ธ ๊ธฐ์ˆ ๋กœ๋Š” ํ”„๋ก ํŠธ์—”๋“œ๋ฅผ ์˜ˆ๋ฅผ ๋“ค ์ˆ˜ ์žˆ๋‹ค. ํ”„๋ก ํŠธ์—”๋“œ์—์„œ ์‚ฌ์šฉ๋˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋ณด๋ฉด ๊ณผ๊ฑฐ์—๋Š” apache ambari ์›น ๊ฐœ๋ฐœ์— ์‚ฌ์šฉ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์ธ ember.js ๋“ฑ ์—์„œ ํ˜„์žฌ๋Š” react๋กœ ํŠธ๋ Œ๋“œ๊ฐ€ ๋ฐ”๋€ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

๋”ฐ๋ผ์„œ, ๋‚˜๋ฅผ ์œ„ํ•œ ๊ธฐ์ˆ (๋„๊ตฌ)๋ฅผ ์„ ํƒํ•  ๋•Œ ๋ถˆ๋ณ€์˜ ๊ธฐ์ˆ ์„ ๋‚ด ๊ธฐ์ˆ ๋กœ ์‚ผ๊ณ  ์ผ์‹œ์ ์ธ ๊ธฐ์ˆ ์€ ๊ธฐ์ˆ ์ฃผ์œ„์˜ ๋„๊ตฌ๋กœ ์‚ผ์•„์•ผํ•œ๋‹ค.

๊ฐœ์ธ์ ์œผ๋กœ๋Š” ๋ถˆ๋ณ€์˜ ๊ธฐ์ˆ ๋กœ๋Š” ์ปดํ“จํ„ฐ ๊ณตํ•™์˜ ๊ธฐ๋ณธ์„ ๋‚ด ๊ธฐ์ˆ ๋กœ ์‚ผ๊ณ  ๊ทธ ์™ธ ์˜คํ”ˆ์†Œ์Šค๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ฒƒ์€ ๊ธฐ์ˆ ์ฃผ์œ„์˜ ๋„๊ตฌ๋กœ ์‚ผ์œผ๋ผํ•˜๋Š” ํ•„์ž์˜ ์กฐ์–ธ์œผ๋กœ ๋А๋‚„ ์ˆ˜ ์žˆ์—ˆ๋‹ค.

๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ๋„๊ตฌ๋ฅผ ์„ ํƒํ•  ๋•Œ๋„ ๋งŒ์— ํ•˜๋‚˜๋ผ๋„ ํ•ด๋‹น ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ์„ ํƒํ•ด์•ผํ•œ๋‹ค.

์˜ˆ๋ฅผ๋“ค๋ฉด ํ”„๋กœ์ ํŠธ๊ฐ€ ์—†์–ด์ง€๊ฑฐ๋‚˜ ํšŒ์‚ฌ๊ฐ€ ์—†์–ด์ง€๊ฑฐ๋‚˜ ๋“ฑ์„ ์—ผ๋ คํ•ด๋‘๊ณ  ๋‹ค๋ฅธ ๋„๊ตฌ๋กœ ์ „ํ™˜ํ•ด์•ผํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ์ธ์ง€ํ•ด์•ผํ•œ๋‹ค.

 

6๋ฒˆ ๊ตฌ์ถ•๊ณผ ๊ตฌ๋งค ๋น„๊ต

์ฑ…์—์„œ OSS (์˜คํ”ˆ์†Œ์Šค์†Œํ”„ํŠธ์›จ์–ด)์™€ ์ƒ์šฉ OSS๋ฅผ ๋น„๊ตํ•ด์ค€๋‹ค.

ํŽธํ•˜๊ฒŒ ์ƒ๊ฐํ•˜๋ฉด OSS ์—์„  apache ์žฌ๋‹จ์˜ ์˜คํ”ˆ์†Œ์Šค๋ฅผ ๋– ์˜ฌ๋ฆฌ๊ณ  ์ƒ์šฉ OSS์—์„  apache spark๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ธŒ๋ฆญ์Šค ์ œํ’ˆ, apache kafka๊ธฐ๋ฐ˜ confluent ์ œํ’ˆ์„ ๋– ์˜ฌ๋ฆด ์ˆ˜ ์žˆ๋‹ค.

๊ตฌ์ถ•๊ณผ ๊ตฌ๋งค ๋น„๊ตํ•ด๋ณด์ž๋ฉด ์žฅ๋‹จ์ ์ด ๋ช…ํ™•ํ•˜๋‹ค.

์ง์ ‘ ๊ตฌ์ถ•์€ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด์—๊ฒŒ ์„ฑ์žฅํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ‘๊ฑฐ๋ฆ„์ด ๋œ๋‹ค. ํ™˜๊ฒฝ ๊ตฌ์„ฑํ•˜๋ฉฐ ๋ถ€๋”ชํžˆ๋Š” ํŠธ๋Ÿฌ๋ธ”์ŠˆํŒ…์ด๋‚˜ ํ™˜๊ฒฝ์—๋Œ€ํ•œ ์ดํ•ด๋„ ๋†’์ผ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์˜คํ”ˆ์†Œ์Šค์ด๋‹ค ๋ณด๋‹ˆ known issue๋˜๋Š” ์ƒˆ๋กœ์šด ์ด์Šˆ๋“ค์ด ์ƒ๊ธธ ์ˆ˜ ์žˆ์œผ๋ฉฐ ์šด์˜์ค‘์ธ ํ™˜๊ฒฝ์—์„œ ์˜คํ”ˆ์†Œ์Šค ์ด์Šˆ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š”๋ฐ ์ƒ๋‹นํžˆ ๋งŽ์€ ์‹œ๊ฐ„์ด ์†Œ์š”๋œ๋‹ค. 

์ƒ์šฉ OSS๋ฅผ ๊ตฌ๋งคํ•˜์—ฌ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ ์šด์˜์— ๋Œ€ํ•œ ๋ถ€๋‹ด์ด ๋œํ•œ ํŽธ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์˜คํ”ˆ์†Œ์Šค์†Œํ”„ํŠธ์›จ์–ด๊ฐ€ ์•„๋‹Œ ์ƒ์šฉ์ด๊ธฐ๋•Œ๋ฌธ์— ์ง€์›์ด๋‚˜ ์ด์Šˆ๋Œ€์‘์„ ๋ฐ›์„ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ฒ˜์Œ๋ถ€ํ„ฐ ์ƒ์šฉ OSS๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค๋ฉด ์ง์ ‘ ๊ตฌ์ถ•์— ๋น„ํ•ด ์ดํ•ด๋„๊ฐ€ ์ข€ ๋–จ์–ด ์งˆ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ์ƒ๊ฐ๋„ ๋“œ๋‚˜ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด ๊ฐœ์ธ์ด ๊ณต๋ถ€๋งŒ ํ•œ๋‹ค๋ฉด ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ์ ๋„ ์žˆ๋‹ค. ๋น„๊ต์  ํฐ ๋น„์šฉ์ด ๋“ค๋ฉฐ ์—…๋ฌด ์ง„ํ–‰ํ•  ๋•Œ ์ง€์›์ด๋‚˜ ๋ฌธ์„œ์ง€์›์— ๋Œ€ํ•ด์„œ๋„ ๊ณ ๋ฏผ์„ ํ•ด๋ด์•ผํ•œ๋‹ค.

 

๋์œผ๋กœ

์ €๋Š” ํ˜„์žฌ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด๋กœ ์žฌ์ง์ค‘์— ์žˆ์Šต๋‹ˆ๋‹ค. ์—…๋ฌด ์ง„ํ–‰ํ•˜๋‹ค ๋ณด๋‹ค๋ณด๋ฉด ๊ถ๊ธˆํ•œ๊ฒŒ ์ƒ๊ธฐ๋ฉด ์›น ๊ฐœ๋ฐœ์— ๋น„ํ•ด ์ •๋ณด๊ฐ€ ๋ถ€์กฑํ•œํŽธ์ด ์‚ฌ์‹ค์ž…๋‹ˆ๋‹ค. ๊ธฐ์ˆ ์™ธ์ ์œผ๋กœ ๊ณ ๋ฏผ๋˜๋Š” ๋‚ด์šฉ๋“ค ํšŒ์‚ฌ ๋™๋ฃŒ์˜ ์ƒ๊ฐ๋„ ๋“ฃ๊ณ , ๋” ๋‚˜์•„๊ฐ€ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์˜ ๊ฒฝํ—˜๊ณผ ์ƒ๊ฐ์„ ์ ‘ํ•˜๊ณ  ์‹ถ์—ˆ๋Š”๋ฐ ์ด ์ฑ…์„ ์ฝ๊ณ  ์–ด๋А์ •๋„ ํ•ด์†Œ๋˜๋Š” ๊ฒƒ ๊ฐ™์•˜์Šต๋‹ˆ๋‹ค.

๋‚ด์šฉ์€ ์•„๋ฌด๋ž˜๋„ ๊ฒฝํ—˜์ด ์ „ํ˜€ ์—†๋Š” ์‚ฌ๋žŒ์—๊ฒŒ๋Š” ์ „๋ถ€ ์ดํ•ด๋Š” ์ข€ ์–ด๋ ค์šธ ๊ฒƒ ๊ฐ™์œผ๋‚˜ ๋ฐ์ดํ„ฐ์—”์ง€๋‹ˆ์–ด์ง๋ฌด๋ฅผ ํฌ๋งํ•˜๋Š” ๋ถ„์€ ๊ผญ ์ฝ์–ด๋ณด๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด ์ฑ…์˜ ๋‚ด์šฉ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

 

ํ•œ๋น›๋ฏธ๋””์–ด์—์„œ ์ฑ…์„ ์ œ๊ณต ๋ฐ›์•„ ์ž‘์„ฑ๋œ ์„œํ‰์ž…๋‹ˆ๋‹ค.

728x90
๋ฐ˜์‘ํ˜•
๋ฐ˜์‘ํ˜•

GCP

 

์ฃผ๋กœ ์‚ฌ์šฉํ•˜๋Š” GCP ํ•ญ๋ชฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

1. ๋น…์ฟผ๋ฆฌ

2. ์Šคํ† ๋ฆฌ์ง€

3. ์ปดํฌ์ €(์—์–ดํ”Œ๋กœ์šฐ)

4. ๋ฐ์ดํ„ฐํ”„๋ก

5. ๋ฐ์ดํ„ฐ์ŠคํŠธ๋ฆผ

 

๋ฐ์ดํ„ฐ์ŠคํŠธ๋ฆผ์€ ์‹ค์ œ๋กœ ์‚ฌ์šฉํ•ด๋ณด๋‹ˆ ์žฅ๋‹จ์ ์ด ๋ช…ํ™•ํ•˜๋‹ค.

 

728x90
๋ฐ˜์‘ํ˜•

'CLOUD' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

GCP - Bigquery  (0) 2023.10.21
Azure  (0) 2023.04.24
azure  (0) 2023.01.14
AWS EMR  (0) 2023.01.13
๋ฐ˜์‘ํ˜•

ํ•ด๋‹น ์ฑ…์€  SQLD  ์ž๊ฒฉ์ฆ ์ทจ๋“์„ ์œ„ํ•œ ์ˆ˜ํ—˜์„œ ์ž…๋‹ˆ๋‹ค

 

SQL-Developer ๋Š” SQL์„ ๋‚ดํฌํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ํ”„๋กœ๊ทธ๋žจ์ด๋‚˜ ์‘์šฉ ์†Œํ”„ํŠธ์›จ์–ด์˜ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๊ฑฐ๋‚˜, ์ด๋Ÿฌํ•œ ์„ฑ๋Šฅ ์ตœ์ ํ™”๋ฅผ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ฐœ์ฒด(๋ทฐ, ์ธ๋ฑ์Šค ๋“ฑ)์˜ ์„ค๊ณ„์™€ ๊ตฌํ˜„ ๋“ฑ์˜ ์ง๋ฌด๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ์ „๋ฌธ๊ฐ€๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

 

์ž๊ฒฉ์ฆ ์‹œํ—˜ ์ผ์ • -> https://www.dataq.or.kr/www/accept/schedule.do

 

๋ฐ์ดํ„ฐ์ž๊ฒฉ์‹œํ—˜

๋ฐ์ดํ„ฐ์•„ํ‚คํ…์ฒ˜ ์ค€์ „๋ฌธ๊ฐ€ ์ œ54ํšŒ - 3.20~24 4.7 4.23(์ผ) 5.12 5.19 -

www.dataq.or.kr

์ด๊ธฐ์  SQL ๊ฐœ๋ฐœ์ž ์ด๋ก ์„œ + ๊ธฐ์ถœ๋ฌธ์ œ

์ปดํ™œ ์ž๊ฒฉ์ฆ ์ค€๋น„ํ•ด๋ณธ ์‚ฌ๋žŒ๋“ค์€ ๋งŽ์ด ์ ‘ํ•ด๋ณธ '์ด๊ธฐ์ '์ž…๋‹ˆ๋‹ค

ํ•ด๋‹น ์ฑ…์€ ๊ฐœ๋ฐœ์ž ๋ฐ ๊ฐœ๋ฐœ์ž ์ค€๋น„ํ•˜๋Š” ์ทจ์ค€์ƒ, ์ปดํ“จํ„ฐ ์ „๊ณต ํ•™์ƒ, ๋งˆ์ผ€ํŒ… ์ง๋ฌด ๋˜๋Š” ์ค€๋น„ํ•˜๋Š” ์ทจ์ค€์ƒ์—๊ฒŒ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค!

์š”์ฆ˜ SQL ์“ฐ๋Š” ์ง๋ฌด๋„ ๋งŽ๊ณ , ์„œ๋กœ ํ˜‘์—…ํ•˜๊ณ  ๋Œ€ํ™”ํ•  ๋•Œ ์ดํ•ด๋ฅผ ๋†’์ด๋ ค๋ฉด ๊ณต๋ถ€ํ•˜๋Š”๊ฒŒ ์ข‹์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค

 

SQLD์ทจ๋“์„ ๋ชฉํ‘œ๋กœ ํ•˜๋ฉด ์ด๊ธฐ์  SQLD ์ฑ… ์ถ”์ฒœ ํ•ฉ๋‹ˆ๋‹ค 

๊ทธ๋ฆฌ๊ณ  ๋™์˜์ƒ ๊ฐ•์˜์™€ ๋ชจ๋ฐ”์ผ/์›น CBT ํ™˜๊ฒฝ๋„ ์ œ๊ณตํ•ด ์ž๊ฒฉ์ฆ ์ทจ๋“์— ๋Œ€ํ•œ ์ฒ ์ €ํ•œ ์ค€๋น„๋ฅผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

์ฑ…์˜ ๋ชฉ์ฐจ๋Š” 5๊ฐœ๋กœ 

SQL ์„ค์น˜ / ๋ฐ์ดํ„ฐ ๋ชจ๋ธ๋ง / SQL๊ธฐ๋ณธ ๋ฐ ํ™œ์šฉ / ์‹ค์ „๋ชจ์˜๊ณ ์‚ฌ 150๋ฌธ์ œ / ์ตœ์‹ ๊ธฐ์ถœ๋ฌธ์ œ 7ํšŒ ๋กœ ๊ตฌ์„ฑ๋˜์–ด์žˆ์–ด

SQL์ด ์ฒ˜์Œ์ธ ์‚ฌ๋žŒ๋„ ์„ค์น˜๋ถ€ํ„ฐ ์ฐฌ์ฐฌํžˆ ๋”ฐ๋ผ์˜ฌ ์ˆ˜ ์žˆ๋Š” ๊ตฌ์„ฑ์ž…๋‹ˆ๋‹ค. SQL๋„ ์ข…๋ฅ˜๋ณ„๋กœ ์„ค์น˜๊ฐ€์ด๋“œ๊ฐ€ ์ฒซ ๋ชฉ์ฐจ์—ฌ์„œ ์•„์˜ˆ ์•ˆ์จ๋ณด๊ฑฐ๋‚˜ ํŠน์ • SQL๋งŒ ์„ค์น˜ํ•ด๋ณธ ์‚ฌ๋žŒ์—๊ฒŒ ๋„์›€์ด ๋งŽ์ด ๋  ๊ฒƒ ๊ฐ™์•˜์Šต๋‹ˆ๋‹ค.

 

์‹ค์ œ ์‹œํ—˜์€ ํƒ€์ž๋กœ ์น˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ ๊ฐ๊ด€์‹์— ์ฃผ๊ด€์‹์ด ์žˆ์–ด, ํƒ€์ž๋กœ ์น˜๋Š” ์—ฐ์Šต๋ฟ ์•„๋‹ˆ๋ผ ์‹ค์ œ ์†์œผ๋กœ๋„ SQL ์ž‘์„ฑํ•˜์—ฌ ๊ฐ์„ ์ตํžˆ๋Š” ๊ฒƒ์„ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค!

 

์ฑ…์—์„œ ์™ธ์›Œ์•ผํ•˜๋Š” ๋ถ€๋ถ„๋„ ์ •๋ฆฌ๊ฐ€ ์ž˜๋˜์–ด์žˆ๊ณ  ๋ฌธ์ œ์˜ ์–‘์ด ๋งŽ๊ธฐ ๋•Œ๋ฌธ์—, ์˜์ง„ ์ด๊ธฐ์  ์ฑ…์œผ๋กœ ๊ณต๋ถ€ํ•˜๋ฉด ์งง์€์‹œ๊ฐ„์— ์ข‹์€ ํšจ์œจ์„ ๋‚ผ ์ˆ˜ ์žˆ์„๊ฒƒ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ฑ…์˜ ์•ž๋ถ€๋ถ„์— ์ž๊ฒฉ์ฆ ์ทจ๋“์— ์žˆ์–ด ๊ณต๋ถ€ํ”Œ๋žœ๋„ ์งœ์—ฌ์ ธ ์žˆ์œผ๋‹ˆ ํ•ด๋‹น ํ”Œ๋žœ ์ฐธ๊ณ ํ•˜์—ฌ ๊ฐœ๊ฐœ์ธ์˜ ์ผ์ •์— ๋งž์ถฐ์„œ ๊ณต๋ถ€ํ•˜๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์‚ฌ์ง„์€ ์ฑ…์—์„œ SQL ์„ค์น˜์™€ ์ด๋ก  ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค.

 

์‚ฌ์‹ค ์ค‘์š”ํ•œ ๋ถ€๋ถ„์ด ์ฑ…์ด ๋„ˆ๋ฌด ๋‘๊ป๊ณ , ํฌ๊ณ  ๊ธ€์”จ๊ฐ€ ์ž‘์œผ๋ฉด ๊ณต๋ถ€ํ•˜๋ฉด์„œ ๋„ˆ๋ฌด ํž˜๋“ ๋ฐ, ์ด๊ธฐ์  SQLD ์ฑ…์€ ๋‘๊ป˜๋„ ์ ๋‹นํ•˜๊ณ  ๊ธ€์”จ๋„ ํฌ๊ณ  ์ƒ‰๋„ ํ‘ธ๋ฅธ์ƒ‰์ด๋ผ ๋ˆˆ์˜ ํ”ผ๋กœ๋„๋„ ๋œํ•ด์„œ ๋„ˆ๋ฌด ์ข‹์•˜์Šต๋‹ˆ๋‹ค

 

 

๋ณธ ๊ฒŒ์‹œ๊ธ€์€ ์˜์ง„์ถœํŒ์‚ฌ ์ฑ… ์„œํ‰ ์ด๋ฒคํŠธ์— ๋‹น์ฒจ๋˜์–ด ์ด๊ธฐ์  SQL ๊ฐœ๋ฐœ์ž ์ฑ…์„ ๋ฌด์ƒ์œผ๋กœ ์ œ๊ณต๋ฐ›์•˜์Šต๋‹ˆ๋‹ค.

728x90
๋ฐ˜์‘ํ˜•

'์ฑ… ์„œํ‰' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

๊ฒฌ๊ณ ํ•œ ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๋ง ๋ฆฌ๋ทฐ  (0) 2023.07.17
๋ฐ˜์‘ํ˜•
  1. ๋ฐ์ดํ„ฐ ๋ธŒ๋ฆญ์Šค - spark ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ถ„์„ ํ”Œ๋žซํผ (ex: aws EMR)
    1. ๋ธํƒ€ ๋ ˆ์ดํฌ - Databricks Lakehouse ํ”Œ๋žซํผ์— ๋ฐ์ดํ„ฐ ๋ฐ ํ…Œ์ด๋ธ”์„ ์ €์žฅํ•˜๊ธฐ ์œ„ํ•œ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์ตœ์ ํ™”๋œ ์Šคํ† ๋ฆฌ์ง€ ๊ณ„์ธต
      1. ํŒŒ์ผ๊ธฐ๋ฐ˜ ํŠธ๋žœ์žญ์…˜ ๋กœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•ด parquet ๋ฐ์ดํ„ฐ ํŒŒ์ผ์„ ํ™•์žฅ โ†’ ACID ํŠธ๋žœ์žญ์…˜ ๋ฐ ์Šค์ผ€์ผ๋ง ๊ฐ€๋Šฅํ•œ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ
      2. ์ผ๊ด„ ์ฒ˜๋ฆฌ ๋ฐ ์ŠคํŠธ๋ฆฌ๋ฐ ์ž‘์—… ๋ชจ๋‘์— ๋‹จ์ผ ๋ฐ์ดํ„ฐ ๋ณต์‚ฌ๋ณธ์„ ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•˜๊ณ  ๋Œ€๊ทœ๋ชจ๋กœ ์ฆ๋ถ„ ์ฒ˜๋ฆฌ๋ฅผ ์ œ๊ณต
      3. ๋ฐ์ดํ„ฐ ๋ธŒ๋ฆญ์Šค์˜ ๊ธฐ๋ณธ ์Šคํ† ๋ฆฌ์ง€ ํ˜•์‹์€ ๋ธํƒ€๋ ˆ์ดํฌ
      4. SQL ๋ฌธ๋ฒ•
        1. https://learn.microsoft.com/ko-kr/azure/databricks/sql/language-manual/#delta-lake-statements
      5. Python API
        1. https://docs.delta.io/latest/api/python/index.html

๋ฐ์ดํ„ฐ๋ ˆ์ดํฌ๋กœ ํ…Œ์ด๋ธ” ์ƒ์„ฑ ์‹œ DBFS์— ์ €์žฅ๋จ

DBFS๋Š” Data Bricks File System

์• ์ € ๋ฐ์ดํ„ฐ ๋ธŒ๋ฆญ์Šค์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๋ถ„์‚ฐ ํŒŒ์ผ ์‹œ์Šคํ…œ์€ DBFS

DBFS, ๋กœ์ปฌ ์„œ๋ฒ„ ์‚ฌ์šฉ ๋ฐฉ๋ฒ•

https://learn.microsoft.com/ko-kr/azure/databricks/files/

๋ฐ์ดํ„ฐํŒฉํ† ๋ฆฌ - ์—ฌ๋Ÿฌ ์ปดํ“จํŒ… ๋ฐ ์Šคํ† ๋ฆฌ์ง€ ์„œ๋น„์Šค ์‚ฌ์ด์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌ ๋ฐ ์ด๋™ํ•˜๊ณ  ์˜จ-ํ”„๋ ˆ๋ฏธ์Šค ๋ฐ์ดํ„ฐ ์›๋ณธ์„ ์ง€์ •๋œ ๊ฐ„๊ฒฉ์œผ๋กœ ์ฒ˜๋ฆฌ ๋ฐ ์ด๋™. ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋งŒ๋“ค๊ธฐ, ์˜ˆ์•ฝ, ์กฐ์ • ๋ฐ ๊ด€๋ฆฌ (ex: aws glue, data pipe line)

728x90
๋ฐ˜์‘ํ˜•

'CLOUD' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

GCP - Bigquery  (0) 2023.10.21
GCP  (0) 2023.05.10
azure  (0) 2023.01.14
AWS EMR  (0) 2023.01.13
๋ฐ˜์‘ํ˜•
  • Secondary Namenode: HDFS์˜ Secondary Namenode๋Š” ์ฃผ Namenode์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ •๋ณด๋ฅผ ์ฃผ๊ธฐ์ ์œผ๋กœ ์ˆ˜์ง‘ํ•˜์—ฌ ๋กœ๊ทธ ํŒŒ์ผ์„ ํ•ฉ์นฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋กœ๊ทธ ํŒŒ์ผ์€ ์ฃผ Namenode๊ฐ€ ๊ณ ์žฅ ๋‚ฌ์„ ๋•Œ, ์ด์ „์— ์ˆ˜์ง‘๋œ ๋กœ๊ทธ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ฃผ Namenode๋ฅผ ๋ณต๊ตฌํ•˜๊ณ  ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ •๋ณด๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, Secondary Namenode๋Š” ์ฃผ Namenode์˜ ๋ถ€ํ•˜๋ฅผ ์ค„์ด๊ณ  HDFS ํด๋Ÿฌ์Šคํ„ฐ์˜ ์•ˆ์ •์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
  • Standby Namenode: HDFS์˜ Standby Namenode๋Š” ์ฃผ Namenode์™€ ํ•จ๊ป˜ HDFS์˜ ๊ณ ๊ฐ€์šฉ์„ฑ(High Availability, HA)๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Standby Namenode๋Š” ์ฃผ Namenode์˜ ๋ฐ์ดํ„ฐ์™€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ •๋ณด๋ฅผ ๋ณต์ œํ•˜์—ฌ ํ•ญ์ƒ ์ตœ์‹  ์ƒํƒœ๋ฅผ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด, ์ฃผ Namenode๊ฐ€ ๊ณ ์žฅ ๋‚ฌ์„ ๋•Œ, Standby Namenode๋Š” ์ฆ‰์‹œ ์ž‘๋™ํ•˜์—ฌ ์ฃผ Namenode ์—ญํ• ์„ ๋Œ€์‹ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ HA ๊ตฌ์„ฑ์€ ์ฃผ Namenode์˜ ๊ณ ์žฅ์ด๋‚˜ ์œ ์ง€ ๋ณด์ˆ˜ ๋•Œ๋ฌธ์— downtime์„ ์ตœ์†Œํ™”ํ•˜๊ณ  HDFS ํด๋Ÿฌ์Šคํ„ฐ์˜ ๊ฐ€์šฉ์„ฑ์„ ๋ณด์žฅํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ, Secondary Namenode์™€ Standby Namenode๋Š” ๋ชจ๋‘ ์ฃผ Namenode์˜ ์•ˆ์ •์„ฑ๊ณผ ๊ฐ€์šฉ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, Secondary Namenode๋Š” HA ๊ตฌ์„ฑ์ด ์•„๋‹ˆ๋ฉฐ, ์ฃผ Namenode๊ฐ€ ๊ณ ์žฅ ๋‚ฌ์„ ๋•Œ ๋” ๋งŽ์€ ๋ณต๊ตฌ ์‹œ๊ฐ„์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์— Standby Namenode๋Š” HA ๊ตฌ์„ฑ์ด๋ฏ€๋กœ ์ฃผ Namenode์˜ ๊ณ ์žฅ ์‹œ๊ฐ„์„ ์ตœ์†Œํ™”ํ•˜๊ณ  ํด๋Ÿฌ์Šคํ„ฐ์˜ ๊ฐ€์šฉ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๋”์šฑ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.

728x90
๋ฐ˜์‘ํ˜•

๋ฐ˜์‘ํ˜•

partitionColumnํŒŒํ‹ฐ์…˜์„ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ์—ด

lowerBound๊ฐ€์ ธ์˜ฌ ๊ฐ’์˜ ๋ฒ”์œ„ ๋ฅผ upperBound๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. 

 

์ „์ฒด ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” ๋‹ค์Œ ์ฟผ๋ฆฌ์— ํ•ด๋‹นํ•˜๋Š” ํ–‰์„ ์‚ฌ์šฉ

 

SELECT * FROM table WHERE partitionColumn BETWEEN lowerBound AND upperBound

  • lowerBound: 0
  • upperBound: 1000
  • numPartitions: 10

Stride๋Š” 100์ด๊ณ  ํŒŒํ‹ฐ์…˜์€ ๋‹ค์Œ ์ฟผ๋ฆฌ์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.

  • SELECT * FROM table WHERE partitionColumn BETWEEN 0 AND 100
  • SELECT * FROM table WHERE partitionColumn BETWEEN 100 AND 200
  • SELECT * FROM table WHERE partitionColumn BETWEEN 900 AND 1000

 

 

 

upperBound / numPartitions - lowerBound / numPartitions

 

upperbound ๊ตฌํ•˜๋Š” ๋ฒ•

query = f"""SELECT MIN({partitionColumn}), MAX({partitionColumn}) FROM ({db.table})"""
min_max_df = spark.read \
	.format("jdbc") \
	.option("url", "jdbc:postgresql:postgres") \
	.option("dbtable", "db.table") \
	.option("user", "user")\
	.option("password", "pass") \
	.option("query", query) \
	.load()
lowerBound, upperBound = min_max_df.collect()[0]
728x90
๋ฐ˜์‘ํ˜•
๋ฐ˜์‘ํ˜•

์ŠคํŒŒํฌ ์„ธ์…˜ ์ƒ์„ฑ

val spark = SparkSession
    .appName("Spark Session")
    .config("config.name",congfig.value")
    .getOrCreate()

 

 

์ŠคํŒŒํฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ -> ์ŠคํŒŒํฌ ๋“œ๋ผ์ด๋ฒ„ ํ”„๋กœ๊ทธ๋žจ -> ์ŠคํŒŒํฌ ์„ธ์…˜ ๊ฐ์ฒด

 

์ŠคํŒŒํฌ ๋“œ๋ผ์ด๋ฒ„๋Š” ์ŠคํŒŒํฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ํ•˜๋‚˜์ด์ƒ์˜ ์žก์œผ๋กœ ๋ณ€ํ™˜ 

์žก์—๋Š” ์—ฐ์‚ฐ์ด ์—ฌ๋Ÿฌ๊ฐœ์˜ ์ŠคํŒŒํฌ ์Šคํ…Œ์ด์ง€๋กœ ๋‚˜๋‰จ

๊ฐ ์Šคํ…Œ์ด์ง€๋Š” ์ตœ์†Œ ์‹คํ–‰ ๋‹จ์œ„์ด๋ฉฐ ์—ฐํ•ฉ ์‹คํ–‰๋˜๋Š” ์ŠคํŒŒํฌ ํƒœ์Šคํฌ๋“ค๋กœ ์ด๋ฃจ์–ด์ง

 

728x90
๋ฐ˜์‘ํ˜•
๋ฐ˜์‘ํ˜•
728x90
๋ฐ˜์‘ํ˜•

'CLOUD' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

GCP - Bigquery  (0) 2023.10.21
GCP  (0) 2023.05.10
Azure  (0) 2023.04.24
AWS EMR  (0) 2023.01.13
๋ฐ˜์‘ํ˜•

AWS EMR ์€ ๋น…๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ ์ด๋‹ค. (ํ•˜๋‘ก ํ”Œ๋žซํผ)

 

ํด๋Ÿฌ์Šคํ„ฐ ๊ตฌ์„ฑ

- ๋งˆ์Šคํ„ฐ 

Hadoop ์˜ HDFS Namenode, YARN Resource Manger๊ฐ€ ์‹คํ–‰๋˜๋Š” ์ธ์Šคํ„ด์Šค ์ด๋‹ค.

- ์ฝ”์–ด

๋งˆ์Šคํ„ฐ ๋…ธ๋“œ์—์„œ ๊ด€๋ฆฌํ•˜๋ฉฐ, Hadoop ์˜ HDFS Datanode, Yarn Nodemanager, MapReduce Task Tracker, Spark Executor ์‹คํ–‰ํ•จ

- ํƒœ์Šคํฌ 

Datanode ์‹คํ–‰ํ•˜์ง€ ์•Š์œผ๋ฉฐ, HDFS์— ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜์ง€๋„ ์•Š์Œ

Spark executor, MapReduce ์™€ ๊ฐ™์€ ์ž‘์—…์„ ์‹คํ–‰ํ•จ

 

728x90
๋ฐ˜์‘ํ˜•

'CLOUD' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

GCP - Bigquery  (0) 2023.10.21
GCP  (0) 2023.05.10
Azure  (0) 2023.04.24
azure  (0) 2023.01.14

+ Recent posts