본문 바로가기

DB

데이터 모델링의 이해

데이터 모델링의 이해

1. 모델링: 현실세계에 대해서 표현하는 것

1) 현실세계를 일정한 형식에 맞추어 표현하는 추상화의 의미를 가짐

2) 복잡한 현실을 제한된 언어나 표기법을 통해 이해하기 쉽게 하는 단순화의 의미를 가짐

3) 애매모호함을 배재하고 누구나 이해가 가능하도록 정확하게 현상을 기술하는 정확화의 의미를 가짐

4) 시스템 구현을 포함한 업무 분석 및 업무 형상화의 목적이 있음

 

2. 데이터 모델링이 필요한 이유

1) 업무 정보를 구성하는 기초가 되는 정보를 일정한 표기법으로 표현하여 정보시스템의 구축 대상이 되는 업무 내용을 정확하게 분석함

2) 분석된 모델을 가지고 데이터베이스를 생성하여 개발 및 데이터 관리에 사용

3) 데이터모델링 자체로서 업무의 흐름을 설명하고 분석하는 부분에 의미를 가짐

 

3. 데이터 모델링 유의사항

1) 여러 장소의 데이터베이스에 같은 정보를 저장하지 않도록 하여 중복성을 최소화 -> 중복 최소

2) 데이터의 정의를 데이터의 사용 프로세스와 분리하여 유연성을 높임 -> 유연성

3) 데이터 간 상호 연관관계를 명확하게 정의하여 일관성 있게 데이터가 유지되도록함 -> 일관성 

 

4. 데이터 모델링 개념

1) 개념적 데이터 모델링: 추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링, 전사적 데이터모델링과 EA(Enterprise Architecture) 수립 시 많이 이용

2) 논리적 데이터 모델링: 시스템으로 구축하고자 하는 업무에 대해 key, 속성, 관계 등을 정확하게 표현하며 재사용성이 높음

3) 물리적 데이터 모델링: 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계

 

5. ANSI-SPARC에서 정의한 3단계 스키마 구조

1) 외부 스키마(External): View 단계 여러개의 사용자 관점으로 구성(개인적 DB스키마), 개별 사용자나 응용프로그래머가 접근하는 DB정의 

2) 개념 스키마(Conceptual): 모든 사용자 관점을 통합한 조직 전체 관점의 통합적 표현으로 모든 응용 시스템들이나 사용자들이 필요로 하는 데이터를 통합한 조직 전체의 DB를 기술한 것으로 DB에 저장되는 데이터와 그들 간의 관계를 표현하는 스키마

3) 내부 스키마(Internal): 내부단계로 DB가 물리적으로 저장된 형식, 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마

 

6. ERD(Entity-Relationship Diagram)

1) 1976년 피터첸(Peter Chen)에 의해 Entity-Relationship Model(E-R Model)이라는 표기법이 만들어짐

2) 작성 순서: 엔터티를 그림 -> 엔터티 배치 -> 엔터티 관계 설정 -> 관계명 기술 -> 관계 참여도 기술 -> 관계 필수여부 기술

3) 관계의 명칭은 관계 표현에 있어서 매우 중요함

4) 엔터티 배치: 필수 사항은 아니지만, 사람의 눈은 왼쪽에서 오른쪽, 위에서 아래쪽으로 이동하는 경향이 있기 때문에 가장 중요한 엔터티를 왼쪽 상단에 배치하고 이것을 중심으로 다른 엔터티를 나열하면 사람의 눈이 따라가기에 편리한 데이터 모델을 작성할 수 있음

 

엔터티(Entity)

1. 엔터티의 특징

1) 반드시 해당 업무에서 필요하고 관리하고자하는 정보이어야 함

2) 유일한 식별자에 의해 식별이 가능해야 함

3) 영속적으로 존재하는 2개 이상의 인스턴스의 집합이어야 함

4) 업무 프로세스에 의해 이용되어야 함

5) 반드시 속성이 있어야 함

6) 다른 엔터티와 최소 1개 이상 관계가 있어야 함

 

2. 발생시점에 따른 엔터티 분류

1) 기본/키 엔터티(Fundamental Entity, Key Entity): 업무에 원래 존재하는 정보로서 다른 엔터티와 관계에 의해 생성되지 않고, 독립적으로 생성 가능하고 자신은 타엔터티의 부모 역할을 하게 됨, 다른 엔터티로부터 주식별자를 상속받지 않고 자신의 공유한 주식별자를 갖음

2) 중심 엔터티(Main Entity): 기본 엔터티로부터 발생되고, 그 업무에 있어서 중심적인 역할을 함, 데이터 양이 많이 발생되고 다른 엔터티와의 관계를 통해 많은 행위 엔터티를 생성함

3) 행위 엔터티(Active Entity): 2개 이상의 부모 엔터티로부터 부터 발생되고 자주 내용이 바뀌거나 데이터량이 증가 됨, 분석 초기 단계에서는 잘 나타나지 않으며 상세 설계단계나 프로세스와 상관 모델링을 진행하면서 도출될 수 있음

 

3. 엔터티의 이름 부여 방법

1) 현업 업무에서 사용하는 용어를 사용 함

2) 가능한 한 약어를 사용하지 않음

3) 단수명사 사용

4) 모든 엔터티를 통틀어서 유일하게 이름 부여(ex. 교수 엔터티, 학생 엔터티가 있고 두 엔터티 모두 이름 속성이 있을 때 교수이름, 학생이름 이렇게 모든 엔터티 통틀어서 유일한 이름이 되게 함)

5) 엔터티 생성 의미대로 이름 부여

 

속성(Attribute)

1. 속성의 의미

사전적 의미: 사물의 성질/특징 또는 본질적인 성질(어떤 사물 또는 개념에 없어서는 안될 징표의 전부)이며 다른 것과 구별하는 성질

데이터모델링 관점 의미: 업무에서 필요로 하는 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소 데이터 단위

 

2. 속성의 특징

1) 엔터티에 대한 자세하고 구체적인 정보를 나타냄

2) 하나의 엔터티는 2개 이상의 속성을 갖음

3) 하나의 인스턴스에서 각각의 속성은 1개의 속성 값을 가져야 함

4) 속성도 집합임

 

3. 속성의 특성에 따른 분류

1) 기본 속성(Basic Attrubute): 업무 분석을 통해 바로 정의한 속성

2) 설계 속성(Designed Attrubute): 원래 업무상 존재하지 않지만 설계를 하면서 도출해내는 속성, 기본 속성 외에 데이터 모델링, 업무 규칙화를 위해 새로 만들거나 변형하여 정의하는 속성(ex. 코드성 속성, 일련번호 속성)

3) 파생 속성(Derived Attrubute): 다른 속성으로부터 계산이나 변형이 되어 생성되는 속성

 

4. 도메인(Domain): 속성이 가질 수 있는 값의 범위로 엔터티 내에서 속성에 대한 데이터 타입, 크기, 제약사항을 지정하는 것 

 

5. 속성의 명칭 부여 방법

1) 해당업무에서 사용하는 이름 부여

2) 서술식 속성명은 사용하지 않음

3) 약어사용은 가급적 제한

4) 전체 데이터모델에서 유일성 확보

 

관계

1. 관계의 분류 

1) 존재에 의한 관계: 팀-멤버의 관계로 존재의 형태에 의한 관계

2) 행위에 의한 관계: 회원-주문의 관계로 행위에 의한 관계

 

2. 데이터 모델링의 관계

1) ERD: 존재적 관계, 행위적 관계로 구분 하지않고 단일화된 표기법 사용

2) UML(Unified Modeling Language): 클래스 다이어그램의 관계 중 연관관계(Association), 의존관계(Dependency)가 있음

- 연관관계(Association): 존재적 관계에 해당, 실선으로 표현, 소스코드에서는 멤버변수로 선언하여 사용

- 의존관계(Dependency): 상대방 클래스의 행위에 의한 관계, 점선으로 표현, method에서 파라미터 등으로 이용

 

3. 관계의 표기법

1) 관계명(Membership): 관계의 이름

2) 관계 차수(Cardinality): 1:1, 1: m, m:n

3) 관계 선택사양(Optionality): 필수 관계, 선택 관계

 

4. 관계 체크사항

1) 두 개의 엔터티 사이에 관심있는 연관규칙이 존재하는가?

2) 두 개의 엔터티 사이에 정보의 조합이 발생되는가?

3) 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?

4) 업무기술서, 장표에 관계연결을 가능하게 하는 동사(Verb)가 있는가?

 

5. 관계 읽기

1) 기준(Source) 엔터티를 한 개 또는 각(Each)으로 읽음

2) 대상(Target) 엔터티의 관계참여도 즉 개수(하나, 하나 이상)를 읽음

3) 관계선택사양과 관계명을 읽음

 

식별자(Identifiers)

1. 식별자의 정의

1) 엔터티내에서 인스턴스들을 구분할 수 있는 구분자

2) 엔터티에 구성되어 있는 여러 개의 속성 중 엔터티를 대표할 수 있는 속성

 

2. 식별자의 종류

분류 식별자 설명
대표성 여부 주 식별자 엔터티 내 각 어커런스를 구분할 수 있는 구분자, 타 엔터티와 참조관계를 연결할 수 있는 식별자
보조 식별자 엔터티 내 각 어커런스를 구분할 수 있는 구분자, 대표성을 가지지 못해 참조관계 연결 불가한 식별자
스스로 생성 여부 내부 식별자 엔터티 내부에서 스스로 만들어지는 식별자
외부 식별자 타 엔터티와의 관계를 통해 타 엔터티로부터 받아오는 식별자
속성의 수 단일 식별자 하나의 속성으로 구성된 식별자
복합 식별자 둘 이상의 속성으로 구성된 식별자
대체여부 본질 식별자 업무에 의해 만들어지는 식별자
인조 식별자 업무적으로 만들어지지는 않지만 원조 식별자가 복잡한 구성을 가지고 있어 인위적으로 만든 식별자

 

3. 주 식별자 도출 기준

1) 해당 업무에서 자주 이용되는 속성을 주식별자로 지정

2) 명칭, 내역 등과 같이 이름으로 기술되는 것들을 가능하면 주식별자로 지정하지 않음

3) 복합으로 주식별자로 구성할 경우 너무 많은 속성이 포함되지 않도록 함

 

4. 주 식별자의 특징

1) 유일성: 주 식별자에 의해 엔터티내에 모든 인스턴스들을 유일하게 구분함

2) 최소성: 주 식별자를 구성하는 속성의 수는 유일서을 만족하는 최소의 수가 되어야 함

3) 불변성: 주 식별자가 한 번 특정 엔터티에 지정되면 그 식별자의 값은 변하지 않아야 함

4) 존재성: 주 식별자가 지정되면 반드시 데이터 값이 존재 함(not Null)

 

5. 식별자 관계 & 비식별자 관계

항목 식별자 관계 비식별자 관계
목적 강한 연결 관계 약한 연결 관계
자식 주식별자 영향 자식 주식별자의 구성에 포함 자식 일반 속성에 포함
표기법 실선 점선
연결 고려사항 - 반드시 부모 엔터티 종속
- 자식 주식별자 구성에 부모 주식별자 포함 필요
- 상속받은 주식별자 속성을 타 엔터티에 이전 필요
- 약한 종속 관계
- 자식 주식별자 구성을 독립적으로 구성
- 자식 주식별자 구성에 부모 주식별자 부분 필요
- 상속받은 주식별자 속성을 타 엔터티에 차단 필요
- 부모쪽의 관계 참여가 선택 관계

 

 

레퍼런스

https://dataonair.or.kr/db-tech-reference/d-guide/sql/?pageid=5&mod=list 

 

SQL – DATA ON-AIR

 

dataonair.or.kr

 

'DB' 카테고리의 다른 글

SQLD 자격증 문제 풀이 정리 3-4  (2) 2022.11.01
SQLD 자격증 문제 풀이 정리 1-2  (0) 2022.10.30
데이터 모델과 성능  (0) 2022.10.27
엑셀보다 쉬운 SQL 4주차 강의  (0) 2022.10.26
엑셀보다 쉬운 SQL 1~3주차 강의  (0) 2022.10.24