본문 바로가기

기타

HDFS

HDFS 


   - Master /Salve 구조를 가지고 있다. 

   - HDFS 클러스터는 싱글 NameNode로 구성된다. 

     Master는 파일 시스템을 관리하고 클라이언트의 파일 access를 제한한다. 

 

 

클러스터 안에 하나의 노스에 수 많은 데이터 노드들이 있다.

 

HDFS는 내부적으로 파일시스템을 드러내고 파일안에 저장 될 유저데이터를 허용한다. 

하나의 파일은 하나 혹은 그 이상의 블럭으로 쪼개지고 그 조각들은 데이터 노드의 집합안에 저장된다. 

NameNode는 파일과 디렉토리의 이름변경, 열기, 닫기 같은 파일시스템 동작을 한다. 

또한 데이터 노드의 맵핑을 결정짓는다. 

 

데이터 노드들은 파일시스템의 클라이언트로 부터 요청받은 읽기 및 쓰기에 대한 응답을 하는 역할을 하게 되며 

데이터 노드들은 또한 block의 생성 삭제 

 

 

FileSystem NameSpace 

 

HDFS는 하드링크나 소프트링크를 지원하지 않는다. 

그러나 HDFS는 이러한 기능들을 못하게 하지는 않는다. 

 

NameNode는 파일 시스템 공간을 관리한다. 파일 시스템의 공간이나 이 속성들의 어떤 변화기 는 NameNode에 기록된다. 

하나의 어플리케이션은 replicase of a file(HDFS에서 관리되어야 하는 파일)의 수를 지정할 수 있다. 

파일 복제의 수는 그 파일의 replication fator라고 불린다. 

이 정보는 NameNode에 저장된다. 

 

Date Replication 

 

HDFS는 매우 큰 파일이 큰 클러스터 안의 머신들을 지나 신뢰성있게 저장될 수 있도록 디자인되었다. 

각 파일은 블록의 시퀀스로 저장된다. 파일의 블록들은 복제된다 fault tolerance(결함 감내?)를 위해. 

블록 사이즈와 replication fator는 파일마다 설정 가능하다. 

 

파일안의 모든 블록들은  마지막 들록이 같은 크기이기를 기대한다. 사용자들은 

 

replication factor는 파일생성 타임에 지정될 수 있고 그 이후에 바뀔 수 있따. 

 

NameNode는 모든 결정을 내린다. 블럭들의