[빅데이터] 요약 - 하둡 이란?, HDFS 동작과정

HADOOP 이란?

Hadoop은 데몬 자체를 뜻하고, HDFS는 Hadoop클러스터로 이루어진 File System 지칭합니다.
통상 같은 의미로 사용합니다

애플리케이션이 HDFS 클라이언트에 파일저장 요청
HDFS 클라이언트가 네임노드에 사용자가 요청한 파일경로 생성 요청
네임노드가 데이터노드들(파이프라인) 반환 (복제개수만큼)
첫번째 데이터노드에 저장, 첫번째 데이터노드는 두번째 데이터노드로 전송, 로컬 저장후 세번쨰로 전송... 완료 후 첫번 째 데이터노드에 완료 사실 반환
데이터노드장애 시 파이프라인에서 제거 후 네임노드가 다른 데이터노드 배치
첫번째 데이터노드가 클라이언트에게 저장완료 응답
클라이언트가 애플리케이션에 완료 응답

사진 출처 : http://www.corejavaguru.com/bigdata/hadoop

[Hadoop] hadoop 커맨드 실행시 Permission denied 해결.(root 계정 없이 실행) (0)	2020.03.09
[빅데이터]요약 - Resource Manager ? Node Manager? (0)	2020.03.09
[빅데이터]데이터 엔지니어 - 하둡 에코 시스템의 이해(요약 본) (0)	2020.02.18
[Redis] In memory DB Redis 설치 (CentOS 6.9, NoSQL, Master - Slave 구조) (0)	2020.02.14
[CDH] 클라우데라 Hadoop - Open JDK 교체(oracle jdk -> open jdk) (0)	2020.02.14