数据库——范式
第一范式
属性不可分。
stu_id | stu_name | dept | dept_manager | course_name | grade |
---|---|---|---|---|---|
1 | 学生-1 | 学院-1 | 院长-1 | 课程-1 | 90 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-2 | 80 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-1 | 100 |
3 | 学生-3 | 学院-2 | 院长-2 | 课程-2 | 95 |
此表关系的函数依赖为 {stu_id, course_name} -> {stu_name, dept, dept_manager, grade},键码为 {stu_id, course_name}。也就是说,确定学生和课程之后,就能确定其它信息。
不符合范式的关系,会产生很多异常,主要有以下四种异常:
- 冗余数据:例如 学生-2 出现了两次。
- 修改异常:修改了一个记录中的信息,但是另一个记录中相同的信息却没有被修改。
- 删除异常:删除一个信息,那么也会丢失其它信息。例如删除了 课程-1 需要删除第一行和第三行,那么 学生-1 的信息就会丢失。
- 插入异常:例如想要插入一个学生的信息,如果这个学生还没选课,那么就无法插入。
第二范式
每个非主属性完全函数依赖于键码。
可以通过分解来满足。
以上学生课程关系中,{stu_id, course_name} 为键码,有如下函数依赖:
- stu_id -> stu_name, dept
- dept -> dept_manager
- stu_id, course_name -> grade
grade 完全函数依赖于键码,它没有任何冗余数据,每个学生的每门课都有特定的成绩。
stu_name, dept 和 dept_name 都部分依赖于键码,当一个学生选修了多门课时,这些数据就会出现多次,造成大量冗余数据。
分解后
关系-1
stu_id | stu_name | dept | dept_manager |
---|---|---|---|
1 | 学生-1 | 学院-1 | 院长-1 |
2 | 学生-2 | 学院-2 | 院长-2 |
2 | 学生-2 | 学院-2 | 院长-2 |
3 | 学生-3 | 学院-2 | 院长-2 |
有以下函数依赖:
- stu_id -> stu_name, dept
- dept -> dept_manager
关系-2
stu_id | course_name | grade |
---|---|---|
1 | 课程-1 | 90 |
2 | 课程-2 | 80 |
2 | 课程-1 | 100 |
3 | 课程-2 | 95 |
有以下函数依赖:
- stu_id, course_name -> grade
第三范式
非主属性不传递函数依赖于键码。
上面的 关系-1 中存在以下传递函数依赖:
- stu_id -> dept -> dept_name
分解后
关系-11
stu_id | stu_name | dept |
---|---|---|
1 | 学生-1 | 学院-1 |
2 | 学生-2 | 学院-2 |
3 | 学生-3 | 学院-2 |
关系-12
dept | dept_manager |
---|---|
学院-1 | 院长-1 |
学院-2 | 院长-2 |