data_lab

hdfs 구성에서 secondary namenode 와 HA로 된 stand by namenode의 역할에 차이 본문

BIGDATA/하둡에코시스템

hdfs 구성에서 secondary namenode 와 HA로 된 stand by namenode의 역할에 차이

🐰히히 2023. 4. 6. 12:01
  • Secondary Namenode: HDFS의 Secondary Namenode는 주 Namenode의 메타데이터 정보를 주기적으로 수집하여 로그 파일을 합칩니다. 이러한 로그 파일은 주 Namenode가 고장 났을 때, 이전에 수집된 로그 정보를 사용하여 주 Namenode를 복구하고 메타데이터 정보를 복원하는 데 사용됩니다. 따라서, Secondary Namenode는 주 Namenode의 부하를 줄이고 HDFS 클러스터의 안정성을 높이는 데 도움이 됩니다.
  • Standby Namenode: HDFS의 Standby Namenode는 주 Namenode와 함께 HDFS의 고가용성(High Availability, HA)를 제공합니다. Standby Namenode는 주 Namenode의 데이터와 메타데이터 정보를 복제하여 항상 최신 상태를 유지합니다. 이를 통해, 주 Namenode가 고장 났을 때, Standby Namenode는 즉시 작동하여 주 Namenode 역할을 대신합니다. 이러한 HA 구성은 주 Namenode의 고장이나 유지 보수 때문에 downtime을 최소화하고 HDFS 클러스터의 가용성을 보장하는 데 도움이 됩니다.

따라서, Secondary Namenode와 Standby Namenode는 모두 주 Namenode의 안정성과 가용성을 높이는 데 중요한 역할을 합니다. 하지만, Secondary Namenode는 HA 구성이 아니며, 주 Namenode가 고장 났을 때 더 많은 복구 시간이 필요할 수 있습니다. 반면에 Standby Namenode는 HA 구성이므로 주 Namenode의 고장 시간을 최소화하고 클러스터의 가용성을 높이는 데 더욱 효과적입니다.

728x90
반응형

'BIGDATA > 하둡에코시스템' 카테고리의 다른 글

Airflow 스터디  (0) 2023.08.29
Grafana + Prometheus 모니터링 구축  (0) 2022.05.25
Hadoop HA 실행  (0) 2022.05.25
[Hue] Hue 4.10.0 설치 가이드  (1) 2022.05.13
Imapa VS Hive  (0) 2022.03.30