데이터 중복제거(Data De-duplication(

3. 자료처리/데이터모델링

SWExpert 2022. 10. 26. 20:51

I. 데이터중복제거(Data De-duplication)

-. 두개 이상의 중복 데이터가 있으면 하나만 저장하고 나머지는 포인터로 대체하여 중복되는 부분을 제거하는 기술

-. 데이터의 세그먼트를 분할, 중복된 영역을 제거하여 유일한 고유블록을 단 한번만 저장하는 백업기술

-. 특징: data 무결성 해소, data 복제시 중복 문제 해소

II. 데이터 중복제거 동작 메커니즘과 기술요소

가. 데이터 중복제거 동작 메커니즘

나. 데이터 중복 제거 기술요소

기술요소	설명
fingerprint	유일성, 진본성 여부 확인
해시 알고리즘	SHA-1, MD5 통한 비트레벨 비교
Fiber Channel	Giga Bit 데이터 전송, SAN 구성
데이터 압축	엔트로피 무손실 압축 적용
메타 데이터	중복확인 Repository 구성, Chunk별 indexing

III. 중복 제거 기술

가. 고정 블록 중복제거

나. 가변 블록 중복제거

SWExpert

OX,

SWExpert