๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กApache spark (2)

data_lab

Azure

๋ฐ์ดํ„ฐ ๋ธŒ๋ฆญ์Šค - spark ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ถ„์„ ํ”Œ๋žซํผ (ex: aws EMR) ๋ธํƒ€ ๋ ˆ์ดํฌ - Databricks Lakehouse ํ”Œ๋žซํผ์— ๋ฐ์ดํ„ฐ ๋ฐ ํ…Œ์ด๋ธ”์„ ์ €์žฅํ•˜๊ธฐ ์œ„ํ•œ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์ตœ์ ํ™”๋œ ์Šคํ† ๋ฆฌ์ง€ ๊ณ„์ธต ํŒŒ์ผ๊ธฐ๋ฐ˜ ํŠธ๋žœ์žญ์…˜ ๋กœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•ด parquet ๋ฐ์ดํ„ฐ ํŒŒ์ผ์„ ํ™•์žฅ โ†’ ACID ํŠธ๋žœ์žญ์…˜ ๋ฐ ์Šค์ผ€์ผ๋ง ๊ฐ€๋Šฅํ•œ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์ผ๊ด„ ์ฒ˜๋ฆฌ ๋ฐ ์ŠคํŠธ๋ฆฌ๋ฐ ์ž‘์—… ๋ชจ๋‘์— ๋‹จ์ผ ๋ฐ์ดํ„ฐ ๋ณต์‚ฌ๋ณธ์„ ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•˜๊ณ  ๋Œ€๊ทœ๋ชจ๋กœ ์ฆ๋ถ„ ์ฒ˜๋ฆฌ๋ฅผ ์ œ๊ณต ๋ฐ์ดํ„ฐ ๋ธŒ๋ฆญ์Šค์˜ ๊ธฐ๋ณธ ์Šคํ† ๋ฆฌ์ง€ ํ˜•์‹์€ ๋ธํƒ€๋ ˆ์ดํฌ SQL ๋ฌธ๋ฒ• https://learn.microsoft.com/ko-kr/azure/databricks/sql/language-manual/#delta-lake-statements Python API https://docs.del..

CLOUD 2023. 4. 24. 20:49