Hadoop3.0

정보관리기술사/DB 데이터분석

기술기술 2024. 1. 12. 12:05

1. 정의

Erasure Coding 도입
- Fault Tolerance를 위한 Replication factor 3 이용 -> HDFS 3배 오버해드 발생(2.0기준) -> 1.4배로 축소
- Read Solomon 알고리즘
- FEC(오류 시에 정정할 수 있는 기술/전진 오류 수정/Forward Error Correction)) 기능을 넣어, 원본 데이터를 복원할 수 있는 기술
YARN Timeline Service v.2 도입
- 기존 타임라인 서비스보다 많은 정보를 확인 가능
- 데이터 쓰기와 읽기 분리, HBase 활용 : 분산처리 가능 확장성과 신뢰성을 확보
- flows와 aggregation : YARN 애플리케이션에 대한 단계별 정보를 확인하는 기능 추가
MapReduce task-level native optimization
- JNI(Java Native Interface) 적용 30프로 이상 성능 개선

HDFS(Hadoop Distributed File System) (0)	2024.01.12
빅데이터 보안 (0)	2024.01.12
아파치 카프카 (0)	2024.01.12
빅데이터 아키텍처/기술요소 (0)	2024.01.12
분석 모델 평가 방법 (0)	2024.01.12

기술기술

ISO 26262, 비지도, 암호화, XaaS, SDLC, 프로젝트 관리, TEST, 지도학습, agile, csap, 암호학적 해시함수, UML, 오류제어, 인더스트리 4.0, 혼잡제어, SDX, 블록체인, RNN, 가상화, Cloud,