반응형

정규화

- 정규화란 함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어 가는 과정이다.

- 하나의 종속성이 하나의 릴레이션에 표현될 수 있도록 분해해가는 과정이라고 할 수 있다.

- 정규형에는 제1정규형, 제2정규형, 제3정규형, BCNF형, 제4정규형, 제5정규형이 있으며 차수가 높아질수록 만족시켜야 할 제약 조건이 늘어난다.

- 정규화는 데이터베이스의 논리적 설계 단계에서 수행한다.

- 정규화는 논리적 처리 및 품질에 큰 영향을 미친다.

 

정규화의 목적

- 데이터 구조의 안정성을 최대화한다.

- 어떠한 릴레이션이라도 데이터베이스 내에서 표현 가능하게 만든다.

- 효과적인 검색 알고리즘을 생성할 수 있다.

- 중복을 배제하여 삽입, 삭제, 갱신 이상의 발생을 방지한다.

- 데이터 삽입 시 릴레이션을 재구성할 필요성을 줄인다.

 

Anomaly(이상)의 개념 및 종류

- 삽입 이상(Insertion Anomaly) : 릴레이션에 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들도 함께 삽입되는 현상

- 삭제 이상(Deletion Anomaly) : 릴레이션에서 한 튜플을 삭제할 때 의도와는 상관없는 다른 값들도 함께 삭제되는 연쇄 삭제 현상

- 갱신 이상(Update Anomaly) : 릴레이션에서 튜플에 있는 속성값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 모순이 생기는 현상

 

정규화의 원칙

- 정보의 무손실 표현, 즉 하나의 스키마를 다른 스키마로 변환할 때 정보의 손실이 있어서는 안 된다.

- 분리의 원칙, 즉 하나의 독립된 관계성은 하나의 독립된 릴레이션으로 분리시켜 표현해야 한다.

- 데이터의 중복성이 감소되어야 한다.

 

정규화 과정

1) 1NF : 도메인이 원자값만으로 되어 있는 릴레이션이다.

2) 2NF : 1NF에서 부분적 함수 종속을 제거한다.

3) 3NF : 2NF에서 이행적 함수 종속을 제거한다.

4) BCNF : 결정자이면서 후보키가 아닌 것을 제거한다.

5) 4NF : 다치 종속을 제거한다.

6) 5NF : 조인 종속성을 이용한다.

반응형
반응형

관계대수

- 관계대수는 관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어이다.

- 관계대수는 릴레이션을 처리하기 위해 연산자와 연산규칙을 제공하는 언어로 피연산자가 릴레이션이고 결과도 릴레이션이다.

- 질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다.

 

순수 관계 연산자

- 종류 : Select, Project, Join, Division

 

일반 집합 연산자

- 종류 : UNION(합집합), INTERSECTION(교집합), DIFFERENCE(차집합), CATESIAN PRODUCT(교차곱)

 

관계해석

- 관계 데이터 모델의 제안자인 코드(E. F. Codd)가 수학 술어 해석에 기반을 두고 관계 데이터베이스를 위해 제안했다.

- 관계해석은 관계 데이터의 연산을 표현하는 방법으로 원하는 정보를 정의할 때는 계산 수식을 사용한다.

- 관계해석은 원하는 정보가 무엇이라는 것만 정의하는 비절차적 특성을 지닌다.

- 튜플 관계해석과 도메인 관계해석이 있다.

- 기본적으로 관계해석과 관계대수는 관계 데이터베이스를 처리하는 기능과 능력면에서 동등하며 관계대수로 표현한 식은 관계해석으로 표현할 수 있다.

- 질의어로 표현한다.

반응형
반응형

제약조건

1) 후보키(Candidate Key) : 후보키는 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분집합, 즉 기본키로 사용할 수 있는 속성들을 말하며 유일성과 최소성을 만족시켜야 한다.

* 유일성(Unique) : 하나의 키 값으로 하나의 튜블만을 유일하게 식별할 수 있어야 한다.

* 최소성(Minimality) : 모든 레코드들을 유일하게 식별하는 데 꼭 필요한 속성으로만 구성되어야 한다.

2) 기본키 (Primary Key) : 기본키는 후보키 중에서 선택한 주 키(Main Key)로 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있으며 Null값을 가질 수 없고 기본키로 정의된 속성에는 동일한 값이 중복되어 저장될 수 없다.

3) 대체키 (Alternate Key) : 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키들을 말하며 보조키라고도 한다.

4) 슈퍼키(Super key) : 슈퍼키는 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키로써 릴레이션을 구성하는 모든 튜플들 중 슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않는다. 

* 슈퍼키는 유일성은 만족시키지만 최소성은 만족시키지 못한다.

5) 외래키(Foreign Key) : 관계를 맺고 있는 릴레이션 R1, R2에서 릴레이션 R1이 참조하고 있는 R2의 기본키와 같은 R1의 속성을 외래키라고 한다.

반응형
반응형

데이터베이스 설계 시 고려 사항

1) 무결성 : 삽입, 삭제, 갱신 등의 연산 후에도 데이터베이스에 저장된 데이터가 정해진 제약 조건을 항상 만족해야 한다.

2) 일관성 : 데이터베이스에 저장된 데이터들 사이나 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정해야 한다.

3) 회복 : 시스템에 장애가 발생했을 때 장애 발생 직전의 상태로 복구할 수 있어야 한다.

4) 보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호할 수 있어야 한다.

5) 효율성 : 응답시간의 단축 및 시스템의 생산성, 저장 공간의 최적화 등이 가능해야 한다.

6) 데이터베이스 확장 : 데이터베이스 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 한다.

 

데이터베이스 설계 순서 및 역할

1) 요구 분석 : 요구 조건 명세서 작성

- 데이터베이스를 사용할 사람들로부터 필요한 용도를 파악한다.

- 데이터베이스 사용자에 따른 수행 업무와 필요한 데이터의 종류, 용도, 형태, 흐름, 제약 조건을 수집한다.

- 수집된 정보를 바탕으로 요구 조건 명세를 작성한다.

 

2) 개념적 설계 : 개념 스키마, 트랜잭션 모델링, E-R 모델 설계

- 개념적 설계란 정보의 구조를 얻기 위하여 현실 세계의 무한성과 계속성을 이해하고 다른 사람과 통신하기 위하여 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정이다.

 

3) 논리적 설계 : 논리 스키마 설계, 트랜잭션 인터페이스 설계

- 논리적 설계 단계에서는 현실 세계에서 발생하는 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적 저장장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정이다.

- 관계형 데이터베이스라면 테이블을 설계하는 단계이다.

 

4) 물리적 설계 : 물리적 구조로 데이터 변환

- 논리적 설계 단계에서 논리적 구조로 표현된 데이터를 디스크 등의 물리적 저장 장치에 저장할 수 있는 물리적 구조의 데이터로 변환화는 과정이다.

- 처리 성능을 얻기 위해 데이터베이스 파일의 저장 구조 및 엑세스 경로를 결정한다.

- 저장 레코드의 형식, 순서, 접근 경로와 같은 정보를 사용하여 데이터가 컴퓨터에 저장되는 방법을 묘사한다.

- 물리적 설계 단계에 꼭 포함되어야 할 것은 저장 레코드의 양식 설계, 레코드 집중의 분석 및 설계, 접근 경로 설계 등이다.

- 물리적 데이터베이스 구조의 기본적인 데이터 단위는 저장 레코드이다.

- 물리적 데이터베이스 구조는 여러 가지 타입의 저장 레코드 집합이라는 면에서 단순 파일과 다르다.

- 물리적 데이터베이스 구조는 데이터베이스 시스템의 성능에 중대한 영향을 미친다.

 

물리적 설계 시 주의 사항

- 인덱스의 구조, 레코드의 크기, 파일에 존재하는 레코드의 개수, 파일에 대한 트랜잭션의 갱신과 참조 성향 ,성능 상향을 위한 개념 스키마의 변경 여부 검토, 수행속도를 높이기 위한 고려, 시스템 운용 시 파일 크기의 변화 가능성

1) 반응 시간(Response Time) : 트랜잭션 수행을 요구한 시점부터 처리 결과를 얻을 때까지의 경과 시간

2) 공간 활용도(Space Utilization) : 데이터베이스 파일과 엑세스 경로 구조에 의해 사용되는 저장 공간의 양

3) 트랜잭션 처리량(Transaction Throughput) : 단위시간 동안 데이터베이스 시스템에 의해 처리될 수 있는 트랜잭션의 평균 개수

 

5) 구현 : DDL로 데이터베이스 생성, 트랜잭션 작성

- 구현 단계에서는 논리적 설계와 물리적 설계 단계에서 도출된 데이터베이스 스키마를 파일로 생성하는 단계이다.

- 사용하려는 특정 DBMS의 DDL을 이용하여 데이터베이스 스키마를 기술한 후 컴파일하여 빈 데이터베이스 파일을 생성한다.

- 생성된 빈 데이터베이스 파일에 데이터를 입력한다.

- 응용 프로그램을 위한 트랜잭션을 작성한다.

- 데이터베이스 접근을 위한 응용 프로그램을 작성한다.

반응형

+ Recent posts