[Hadoop] HDFS Architecture

0001-01-01

2 minute read

[Programming] HDFS Architecture

Secondary NameNode

NameNode가 망가지면 데이터가 어디에 저장되어 있는지 알 수 없기때문에 읽어들일 수 없으므로, NameNode를 백업해 두었다가 NameNode가 망가지면 다시 복구해 주는 역할
HDFS와 MapReduce는 둘다 Master/Slave 구조

HDFS
- Master : Name node(메타정보관리)
- Slave : Data node(실제 데이터)
MapReduce
- Master : JobTracker(TaskTracker의 상태 및 전체 작업의 진행 상황등을 지속적으로 감시하며 일 시적인 장애에 대해 자동 복구 기능 제공)
- Slave : TaskTracker
- Map Task
  
  레코드 단위로 처리해야 하는 작업을 담당
- Reduce Task
  
  관련된 데이터 끼리 묶어서 처리해야 하는 작업 담당
MapReduce만 코딩. 나머지는 자동.