数据库

数据是存储对象,数据库(DB)是存放数据的仓库,数据库管理系统(DBMS)是位于用户和操作系统间的数据管理软件,如Access,Oracle,DB2等,属于系统软件
数据库系统(DBS)包括上述以及管理员和用户,构成的系统
按照定义划分,可分为关系数据库(MongoDB不同于MySQL等是非关系数据库),层次数据库和网状数据库,按照控制方式划分,可分为集中式数据库,分布式数据库和并行数据库
access提供了五种查询方式,包括选择,参数,交叉表,操作和SQL查询
数据库管理系统有七大功能:数据定义(框架),数据操作(增删改查),运行管理,数据组织存储和管理,保护,维护,通信

数据模型是数据库结构的基础,三要素为数据结构、数据操作和数据完整性约束
(1)概念数据模型,从用户角度,如实体联系模型(E-R模型)
(2)基本数据模型,按照计算机系统角度,如层次、网状、关系模型
E-R模型:实体,联系,属性
关系模型:关系数据结构,关系操作集合,关系完整性约束,列为属性行为元组,关键字为唯一表示元组的属性
实体完整性:关键字不能为空  参照完整性:外部关键字不能一个关系引用另一个关系  用户自定义完整性:用户自己定义的

X为自变量称为X函数决定Y,或者Y函数依赖于X
关系模式中的码:
候选码;包含候选码的为主属性,候选码就是自变量
主码:候选码选一个作为主码
范式:规定数据关系,第一范式表示属性均为简单属性,不可再分;在满足第一范式情况下,每个非主属性均完全函数依赖主码,成为第二范式,在此基础上,所有非主属性不传递依赖主码,成为第三范式

SQL语言的功能是数据的查询操纵控制,两种使用方式交互式和嵌入式,三种模外模式视图,内模式存储文件,全局模式基本表
from:指定从其中选择的数据表名
where:指定查询条件
group by:指定按什么分组
order by:按哪个字段进行排序和排序方式(ask升序desc降序)
count:统计所选记录的个数
sum:计算总和
avg:平均数
max/min:最大值最小值
创建表:create table <表名> (<列名><数据类型>[列约束])[表约束]  可使用主码约束primary key,唯一性约束unique,非空值约束not null等
修改表:alter
删除表:drop
建立索引:create [unique] [cluster] index (索引名) (on<表名><列名>[次序]
删除索引 drop index
查询:select [all | distinct去掉重复项]
插入:insert into
修改:update  set
删除数据:delete from

事务是用户定义的操作集合,是数据恢复和并发控制的基本单位
事务四个特性:原子性(要么全做要么全不做),一致性(数据不会被事务毁坏),隔离性(一个事务的执行不能被其他事务干扰),持久性(效果是永久的)
begin transaction用于定义事务的开始,commit用于提交事务,表示该事务已经正常结束,rollback回滚事务,表示事务执行失败
使用并发操作可能带来的问题是丢失修改,不可重复读和读取脏数据,通过封锁技术进行控制
排他锁(X锁),只允许某一事务进行读取和修改数据
共享锁(S锁),使自己和其他事务都只能读取不能修改
造成数据损失的原因:存储介质故障,用户错误操作和服务器彻底崩溃
数据库的备份主要通过磁盘、磁带和命名管道
备分方式包括完全备份、差异备份、日志备份、文件和文件组备份
恢复模式包括简单恢复、完整恢复和大容量日志恢复
数据库四类故障:内部故障、系统故障、介质故障和计算机病毒

数据仓库是面向主题的,集成的,数据随时间变化的,不可修改的(稳定的)
数据库和数据仓库的区别是OLTP和OLAP的区别:联机事务处理OLTP,提供增删改查,联机分析处理OLAP,重分析
数据仓库三层体系,最下面为数据仓库服务器,OLAP服务器,前端工具

数据挖掘步骤:分类(建立分类模型),估计(不同于离散值,是连续值的输出),预测(通过分类或估值起作用),相关性分组或关联规则(决定哪些事情同时发生),聚类(对记录分组,把相似的记录在聚类中,是主动的),描述和可视化
全部评论

相关推荐

04-02 14:40
浙江大学 设计
无语😓&nbsp;就喜欢找我茬,研究生怎么了&nbsp;研究生就是天才吗&nbsp;就得所有报告文件都会,最烦做表
我推的MK:是这样的,那些领导就是自己什么都不懂就把所有东西扔给你,指望白嫖你的劳动力,如果你的表现不如预期就启动攻击学历模式,这都学不会是怎么考上浙大的
点赞 评论 收藏
分享
漂亮的海豚在炒股:把西电加粗
点赞 评论 收藏
分享
评论
7
11
分享

创作者周榜

更多
牛客网
牛客企业服务