数据库有关概念整理
数据库的四个基本概念
数据、数据库、数据库管理系统和数据库系统
数据
数据是数据库中存储的基本对象。
数据的定义:描述事物的符号记录称为数据。
数据的种类:描述事物的符号可以是数字、文字、图形、图像、声音、学生的档案、处方单等。
数据是信息的载体,信息内涵数据。
数据的特点:数据与其语义是不可分的
数据的含义称为数据的语义,数据与其语义是不可分的。
数据的表现形式还不能完全表达其内容,需要经过解释。
数据库
数据库的定义:数据库是长期存储在计算机内、有组织的、可共享的大量的数据集合。
数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
概括的说,数据库数据具有:永久存储、有组织和可共享的三个基本特点。
数据库管理系统
什么是数据库管理系统:数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
数据库管理系统的用途:科学的组织和存储数据高效的获取和维护数据
数据库管理系统的主要功能:
(1)数据定义功能(数据定义语言DDL)
(2)数据组织、存储和管理
(3)数据操纵功能(DML
(4)数据库的事务管理和运行管理
(5)数据库的建立和维护功能
(6)其他功能
数据库系统
数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。
数据库的建立、使用和维护等工作只靠一个数据库管理系统是不够的,需要专门的人员来管理,这些人称为数据库管理员
数据库管理员(DBA)的职责:
- 决定数据库中的信息内容和结构
- 定义数据安全性要求和完整性约束条件
- 数据库的改进和重组、重构
- 备份和恢复数据库
- 监控和优化数据库的性能
- 控制和监控用户对数据库的存取访问
- 维护数据库的安全性
- 等
数据管理技术的生产和发展
人工管理阶段 | 文件系统阶段 | 数据库系统阶段 | ||
---|---|---|---|---|
应用背景 | 科学计算 | 科学计算、数据管理 | 大规模数据管理 | |
背 | 硬件背景 | 无法直接存取存储设备 | 磁盘、磁鼓 | 大容量磁盘、磁盘阵列 |
软件背景 | 没有操作系统 | 有文件系统 | 有数据库管理系统 | |
景 | 处理方式 | 批处理 | 联机实时处理、批处理 | 联机实时处理、分布处理、批处理 |
数据的管理者 | 用户(程序员) | 文件系统 | 数据库管理系统 | |
特 | 数据面向的对象 | 某一应用程序 | 某一应用 | 现实世界(一个部门、企业、跨国组织等) |
数据的共享程度 | 无共享,冗余度极大 | 共享性差、冗余度大 | 共享性高,冗余度小 | |
点 | 数据的独立性 | 不独立,完全依赖于程序 | 独立性差 | 具有高度的物理独立性和一定的逻辑独立性 |
数据的结构化 | 无结构 | 记录内有结构、整体无结构 | 整体结构化,用数据模型描述 | |
数据控制能力 | 应用程序自己控制 | 应用程序自己控制 | 由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力 | |
数据的保存 | 数据不保存 | 数据可长期保存 | 数据可长期保存 |
人工管理阶段
文件系统阶段
数据库系统阶段
数据库系统的特点
数据结构化
主要特征之一,是数据库系统与文件系统的本质区别
数据共享性高,冗余度低且易扩充
数据独立性高
数据独立性
数据的独立性是数据库系统的最基本的特征之一 。数据独立性是指应用程序和数据结构之间相互独立, 互不影响。
物理独立性
是指用户的应用程序域数据库中数据的物理存储是相互独立的。
逻辑独立性
是指用户的应用程序与数据库的逻辑结构是相互独立的
数据由数据库管理系统统一管理和控制
数据库管理系统还必须提供以下几个方面的数据控制功能
1.数据的安全性保护
数据的安全性是指保护数据以防止不合法使用造成的数据泄密和破坏。
2.数据的完整性检查
数据的完整性是指数据的正确性、有效性和相容性。
3.并发控制
4.数据库恢复
综上所述,数据库是长期存储在计算机内有组织、大量、共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证是高于行业的完整性和安全性,并在多用户同时使用数据库是进行并发控制,在发生故障后对数据库进行修复。
数据模型
数据模型是对现实世界数据特征的抽象,使用来描述数据、组织数据和对数据进行操作的,是数据库系统的核心和基础。
两类数据模型:第一类是概念模型,第二类是逻辑模型和物理模型。
概念模型
是现实世界到机器世界的一个中间层次
实体
客观存在并可相互区别的事物成为实体
属性
实体具有的某一特性
码
能唯一表示实体的属性集
实体型
用实体名及其属性名集合来抽象和刻画同类实体,称为实体型
具有相同属性的实体必然具有共同的性质和特征
实体集
同一类型实体的集合称为实体集
联系
实体(型)内部的联系 和 实体(型)之间的联系。
实体内部的联系通常是指组成实体的个属性之间的联系,实体之间的联系通常是指不同实体集之间的联系。
实体之间的联系有一对一、一对多、多对多等类型。
概念模型的一种表示方法:实体-联系(Entity-Relationship)法 也就是ER模型,或称ER图,详见下方概念模型设计。
数据模型的组成要素
数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。
数据结构
数据结构描述数据库的组成对象以及对象之间的联系。
数据操作
数据操作是指对数据库中各对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。
数据的完整性约束条件
数据的完整性约束条件是一种完整性规则。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
层次模型的优缺点
优点:
- 数据结构比较简单清晰
- 查询效率高
- 提供了良好的完整性支持
缺点:
- 现实世界中存在很多非层次性的,不适合表示多对多的性质。
- 如果一个节点具有多个双亲节点时,则层次模型限制较多,且易造成冗余。
- 查询子节点必须通过双亲结点
- 由于结构严密,层次命令趋于结构化
网状模型的优缺点
优点:
- 能够更为直接的描述现实世界
- 具有良好的性能,存取效率高
缺点:
- 结构比较复杂
- 网状模型的DDL,DML复杂,并且需要嵌入某一种高级语言,用户不容易掌握,不容易使用。
- 由于记录之间的联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,因此用户必须了解系统结构的细节,增加了编写应用程序的负担。
关系模型的优缺点
优点
- 关系模式和格式化模型不同
- 关系模型的概念单一
- 关系模型的存取路径对用户透明,具有较高的数据独立性、更好的安全保密性,简化了程序员工作和数据库开发建立的工作。
缺点:
由于存取路径隐蔽,查询效率会降低
数据库系统的结构
数据库系统模式
模式是数据库中全体数据的逻辑结构和特征的描述,他仅仅设计型的描述,不涉及具体的值。
模式是相对稳定的,而实例是相对变动的。
数据库系统的三级模式
模式
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
他是数据库系统模式结构的中间层,既不涉及数据的物理存储细节和硬件环境,又与具体的应用程序、所使用的开发工具及高级程序设计语言无关。
模式实际上是数据库数据在逻辑上的视图。一个数据库只有一个模式。
外模式
外模式也称子模式或用户模式,他是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据可用户的数据视图,是与某一应用有关的数据的逻辑表示。
外模式通常是模式的子集。一个数据库可以有多个外模式。
内模式
内模式也称存储模式,一个数据库只有一个内模式。他是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
数据库的二级映像功能和数据独立性
为了能够在系统内部是实现以上三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映像:外模式/模式映像、模式/内模式映像。