用了这么久mysql,你mysql中一行数据是怎么存储的吗?
众所周知,mysql的数据文件是保存在磁盘上的,但中间的数据具体保存在哪个文件夹下面呢?
其实不然,了解过数据库索引的小伙伴都知道,mysql中有不同种类的索引,哪这些索引与mysql存储数据又有什么关系?今天就解决这个问题
一、mysql数据存放在哪?
在本地mysql中建了leetcode库,中间创建了实例表t_order,具体如下图所示:
在存储表数据的目录中会出现如下的文件:
其中:
db.opt:存储了当前数据库的默认字符集和字符校验规则
t_order.frm:存储了表结构,在mysql的InnoDB引擎规则下,新建一张表,就会生成一个以表名开头,以.frm结尾的文件;
t_order.ibd:会存储该表中的具体数据,每一张表的数据都存存放在该文件夹下,新建一张表,就会生成一个以表名开头,以.ibd结尾的文件;
二、数据以什么样的形式存放?
在InnoDB引擎中,表空间由段(segment),区(extent),页(page),行(row)组成,他们之间的关系是:一个段由多个区组成,一个区由多个页组成,一个页由多个行组成
行:数据库表中的记录都是按照行来存储的,根据不同的引擎,有不同的存储结构
页:在读取数据的时候,是按照页为单位进行读取的,并不以行读取;一个页默认大小是16kb,也就是最多能保证16kb的连续存储;当我们客户端读取数据的时候,并不是把行数据读取,而是把该行所在的页全部读取到内存中;在这里,我们只需要知道数据读取的最小单位是页即可;
区:在B+数中,每一层都是通过双向链表进行链接;在页的定义中,我们知道,一个页里面的数据一定是连续,页与页之间不一定是连续的,如果页与页之间的物理位置并不是连续的,那么读取数据时候就会产生大量的磁盘IO,导致性能下降;那么该怎么解决这个问题?
既然不相邻会产生大量的磁盘IO,那么我们让页与页之间彼此相邻,不就解决了吗?为此,在表中数据量很大的时候,为某个索引分配空间的时候就不再按照以页为单位进行分配,而是以区为单位进行分配,每个区的大小默认为1MB,对于16kb大小的页来说,连续的64页会被分到同一个区中,这样就使得链表中相邻的页的物理位置相邻,减少磁盘IO
段:包括数据段(B+树种叶子节点的集合),索引段(B+树中非叶子节点的集合),回滚段
#牛客创作赏金赛##悬赏#不定期分享大数据相关技术面经,本着免费原则,随意白嫖