관리 메뉴

data_lab

도메인 1: 데이터 μˆ˜μ§‘ 및 λ³€ν™˜ νƒœμŠ€ν¬ μ„€λͺ… λ³Έλ¬Έ

CLOUD/AWS

도메인 1: 데이터 μˆ˜μ§‘ 및 λ³€ν™˜ νƒœμŠ€ν¬ μ„€λͺ…

🐰히히 2024. 3. 14. 14:33
더보기

1.1: 데이터 μˆ˜μ§‘μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€. 

κ΄€λ ¨ 지식: 

• 데이터λ₯Ό μˆ˜μ§‘ν•˜λŠ” AWS μ„œλΉ„μŠ€μ˜ μ²˜λ¦¬λŸ‰ 및 지연 μ‹œκ°„ νŠΉμ„± 

• 데이터 μˆ˜μ§‘ νŒ¨ν„΄(예: λΉˆλ„ 및 데이터 기둝) • 슀트리밍 데이터 μˆ˜μ§‘ 

• 배치 데이터 μˆ˜μ§‘(예: μ˜ˆμ•½λœ μˆ˜μ§‘, 이벀트 기반 μˆ˜μ§‘) 

• 데이터 μˆ˜μ§‘ νŒŒμ΄ν”„λΌμΈμ˜ 반볡 μž¬μƒ κ°€λŠ₯μ„± • μŠ€ν…Œμ΄νŠΈν’€ 및 μŠ€ν…Œμ΄νŠΈλ¦¬μŠ€ 데이터 νŠΈλžœμž­μ…˜


슀트리밍 μ†ŒμŠ€μ—μ„œ 데이터 읽기

 

μ‹€μ‹œκ°„ 데이터 슀트리밍 ?

https://aws.amazon.com/ko/what-is/real-time-data-streaming/

μ‹€μ‹œκ°„ 데이터 μŠ€νŠΈλ¦¬λ°μ€ λ‹€μ–‘ν•œ 데이터 μ†ŒμŠ€μ—μ„œ 일련의 데이터λ₯Ό μ·¨ν•© 및 μˆ˜μ§‘ν•˜κ³  ν•΄λ‹Ή 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μ²˜λ¦¬ν•˜μ—¬ μ˜λ―Έμ™€ μΈμ‚¬μ΄νŠΈλ₯Ό μΆ”μΆœν•˜λŠ” 것을 포함

 

슀트리밍 데이터 ?

https://aws.amazon.com/ko/what-is/streaming-data/

슀트리밍 λ°μ΄ν„°λŠ” 짧은 λŒ€κΈ° μ‹œκ°„ 처리λ₯Ό λͺ©ν‘œλ‘œ κ³„μ†ν•΄μ„œ μ¦λΆ„ν•˜λŠ” λ°©μ‹μœΌλ‘œ λ‚΄λ³΄λ‚΄μ§€λŠ” λŒ€μš©λŸ‰ 데이터

  • μ‹œκ°„μˆœ μ€‘μš”μ„± : ν˜„μž¬μœ„μΉ˜ 기반 μŒμ‹μ  μΆ”μ²œ
  • 지속적 흐름 : μ„œλ²„ ν™œλ™λ‘œκ·ΈλŠ” μ„œλ²„κ°€ ν™œλ™ν•˜λŠ” λ™μ•ˆ 계속 λ“€μ–΄μ˜΄
  • κ³ μœ μ„± : μž¬μ „μ†‘ λΆˆκ°€
  • λΉ„κ· μ§ˆμ„± : 데이터 λ³€ν™˜ ν•„μš”
  • λΆˆμ™„μ „μ„± : 데이터 손상 λ˜λŠ” λˆ„λ½μ΄ μžˆμ„ 수 있음 > 데이터 검증 ν•„μš”

 

Amazon Kinesis

: μ‹€μ‹œκ°„ λΉ„λ””μ˜€ 및 데이터 슀트림 μˆ˜μ§‘, 처리, 뢄석

Amazon Managed Streaming for Apache Kafka(Amazon MSK)

 : μ™„μ „κ΄€λ¦¬ν˜• μ„œλΉ„μŠ€, 

Amazon DynamoDB Streams

 : DynamoDB ν…Œμ΄λΈ”μ—μ„œ μ‹œκ°„ μˆœμ„œμ— 따라 ν•­λͺ© μˆ˜μ€€ μˆ˜μ •μ„ μΊ‘μ²˜ν•˜κ³  이 정보λ₯Ό μ΅œλŒ€ 24μ‹œκ°„ λ™μ•ˆ λ‘œκ·Έμ— μ €μž₯

AWS Database Migration Service(AWS DMS)

 : λ°μ΄ν„°λ² μ΄μŠ€ 및 뢄석 μ›Œν¬λ‘œλ“œλ₯Ό AWS둜 λΉ λ₯΄κ³  μ•ˆμ „ν•˜κ²Œ μ΄λ™ν•˜μ—¬ 가동 쀑단 μ‹œκ°„ 및 데이터 손싀을 λ°©μ§€ν•˜λŠ” 데 도움이 λ˜λŠ” κ΄€λ¦¬ν˜• λ§ˆμ΄κ·Έλ ˆμ΄μ…˜ 및 볡제 μ„œλΉ„μŠ€

AWS Glue

 : μ„œλ²„λ¦¬μŠ€ 데이터 톡합

Amazon Redshift

 : ν΄λΌμš°λ“œμ—μ„œ μ™„μ „νžˆ κ΄€λ¦¬λ˜λŠ” νŽ˜νƒ€λ°”μ΄νŠΈκΈ‰ 데이터 μ›¨μ–΄ν•˜μš°μŠ€ μ„œλΉ„μŠ€


 

배치 μ†ŒμŠ€μ—μ„œ 데이터 읽기

 

Amazon S3

AWS Glue

Amazon EMR

AWS DMS

Amazon Redshift

AWS Lambda

Amazon AppFlow


배치 μˆ˜μ§‘μ„ μœ„ν•œ μ μ ˆν•œ ꡬ성 μ˜΅μ…˜ κ΅¬ν˜„

https://docs.aws.amazon.com/ko_kr/prescriptive-guidance/latest/modern-data-centric-use-cases/data-collection.html

 

데이터 μˆ˜μ§‘ - AWS κ·œλ²”μ  지침

이 νŽ˜μ΄μ§€μ— μž‘μ—…μ΄ ν•„μš”ν•˜λ‹€λŠ” 점을 μ•Œλ € μ£Όμ…”μ„œ κ°μ‚¬ν•©λ‹ˆλ‹€. μ‹€λ§μ‹œμΌœ λ“œλ € μ£„μ†‘ν•©λ‹ˆλ‹€. 잠깐 μ‹œκ°„μ„ λ‚΄μ–΄ μ„€λͺ…μ„œλ₯Ό ν–₯μƒμ‹œν‚¬ 수 μžˆλŠ” 방법에 λŒ€ν•΄ 말씀해 μ£Όμ‹­μ‹œμ˜€.

docs.aws.amazon.com

 

데이터 API μ‚¬μš©

Amazon EventBridge, Apache Airflow λ˜λŠ” μž‘μ—… 및 ν¬λ‘€λŸ¬μ— λŒ€ν•œ μ‹œκ°„ 기반 일정을 μ‚¬μš©ν•˜μ—¬ μŠ€μΌ€μ€„λŸ¬ μ„€μ •

이벀트 트리거 μ„€μ •(예: Amazon S3 이벀트 μ•Œλ¦Ό, EventBridge) 

Amazon Kinesis μ—μ„œ Lambda ν•¨μˆ˜ 호좜

데이터 원본에 μ—°κ²°ν•  수 μžˆλ„λ‘ IP μ£Όμ†Œμ— λŒ€ν•œ ν—ˆμš© λͺ©λ‘ λ§Œλ“€κΈ°

μŠ€λ‘œν‹€λ§ κ΅¬ν˜„ 및 속도 μ œν•œ 극볡(예: DynamoDB, Amazon RDS, Kinesis)

슀트리밍 데이터 배포λ₯Ό μœ„ν•œ 팬인 및 νŒ¬μ•„μ›ƒ 관리

728x90
λ°˜μ‘ν˜•

'CLOUD > AWS' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

DEA (DataEngineer Associate)  (0) 2024.03.14
CLF #200 - #209  (0) 2024.03.12
CLF #190 - #199  (0) 2024.03.12
CLF #180 - #189  (0) 2024.03.12
CLF #170 - #179  (0) 2024.03.12