티스토리 뷰

728x90
반응형

Data Integrity

 

데이터 무결성은 데이터의 생애주기 동안 정확성과 일관성을 보장하고 관리하는 것을 말한다.

 

당연하게도 DB를 설계 및 구현할 때 최우선 순위로 확보해야 할 가치이며, 반대말로 'Data Corruption'이 있다.

 

여기서 정확성과 일관성이란 쉽게 말하면 언제나 의도한 대로 데이터가 저장되어야 하고

 

추후 복구나 조회 시 처음 상태와 같아야 한다는 뜻이며,

 

한 마디로 줄이자면 의도치 않은 데이터의 변경을 막는 것을 말한다.

 

계속해서 데이터 무결성은 두 가지 계층으로 나뉘는데, 짧게 요약하면 아래와 같다.

 

  • 물리적 무결성(Physical Integrity)

    • 실제 데이터를 안전하게 저장하고 불러오는 것에 대한 무결성
    • 디자인 결함과 휴먼 에러에서 발생할 수 있음
    • 물리적 저장장소를 각종 예외상황에 대해 보고하고 대비하는 것
    • DB 관리 및 장비 전환 등에서 다양한 알고리즘이 사용됨
  • 논리적 무결성(Logical Integrity)

    • 저장된 데이터의 정확성과 일관성, 합리성에 대한 무결성
    • 소프트웨어 버그나 디자인 결함, 휴먼 에러 등에서 데이터를 지키는 것
    • 실제로 백엔드 개발자가 신경 써서 확보해야 하는 영역
    • 병렬 연산 시 데이터 일관성 확보를 위한 동기화 처리 등

일반적으로 데이터 무결성이라고 하면 물리적이 아닌 논리적 무결성을 가리킨다.

 

계속해서 데이터의 논리적 무결성을 보장하기 위한 제약조건을 정리하자.

 

참고로 아래에 등장하는 제약조건은 전부 RDB 환경을 상정하고 만들어진 것들이다.

 

  • 엔티티 무결성(Entity Integrity)

    • 테이블의 모든 행은 고유하면서 null이 아닌 PK 값을 가져야 한다.
    • 이는 하나의 테이블은 하나의 엔티티를 나타내야 한다는 것과 같은 말이다.
  • 참조 무결성(Referential Integrity)

    • 말 그대로 참조 관계에 있는 데이터의 논리적 무결성을 가리킨다.
    • 이는 특정 컬럼이 다른 테이블의 특정 컬럼을 참조할 때, FK가 반드시 존재한다는 말과 같다.
    • FK가 PK를 참조하고 있지 않으면 null이 될 가능성이 있다. 이 경우 테이블 간의 관계가 불명확해진다.
    • 이를 지키기 위해 다른 FK가 참조하고 있는 행을 지우는 것은 기본적으로 금지된다.
  • 도메인 무결성(Domain Integrity)

    • DB에 들어갈 수 있는 데이터에 대한 논리적 무결성이다.
    • 각 컬럼에 들어갈 수 있는 데이터의 제약조건은(타입, 크기, 고유성, null 가능 등) 도메인에서 반드시 선언되어야 한다.

많은 부분이 DB를 설계할 때 지켜야 할 원칙과 겹치는 것은 기분 탓이 아니다.

 

무결성이 보장되지 않는 DB란 존재 의미가 없기 때문이다.

 

계속해서 데이터 무결성을 지키면서 DB를 설계하기 위한 개념인 스키마 정제 및 정규화에 대해..

 

보려고 했으나 새로운 개념이 너무 많이 등장해서 안 되겠다. 다음 글로!

반응형
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/06   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
글 보관함