2021-10-12 14:05 已编辑小米_存储平台_数据库管理员

关注

<span>026-B树(一)</span>

数据库系统的设计者巧妙利用了磁盘预读原理：

将一个节点的大小设为等于一个页，这样每个节点需要一次I/O就可以完全载入

这是数据库最为重要且极为巧妙的设计。

为了达到这个目的，在实际实现B-Tree还需要使用如下技巧：

每次新建节点时，直接申请一个页的空间，这样就保证一个节点物理上也存储在一个页里，加之计算机存储分配都是按页对齐的，就实现了一个node只需一次I/O。

而B+树内把真实的数据全部放在了叶子节点中，非叶子节点中只存放了索引的数据，保证了数据项尽可能的多。保证树的高度。

定义：

描述一颗 B树时需要指定它的阶数，阶数表示此树的结点最多有多少个孩子结点（子树），一般用字母 M 表示阶数。

M 阶的B树：以【子树】讨论

上限：每个节点最多有 M 个子树
下限：
根节点至少2个子树，
非根节点至少有⌈M /2⌉个子树

所以也称 M 阶B树为 ( ⌈M /2⌉ , M ) 树，即超级节点（除根节点）的子树数的上下限。

注：超级节点关键码的个数 = 节点子树数 - 1 。

例：

M = 4 阶，（2, 4）树。 最多含有 3个关键字 和 4个子树 M = 5 阶，（3, 5）树。 最多含有 4个关键字 和 5个子树 M = 6 阶，（3, 6）树。 最多含有 5个关键字 和 6个子树

所以，M阶可理解为 M树，即内含（M-1）个关键字和 M 个子树。

通过这个结构我们可以看见，在叶子节点中存储的数据是age,name,address的值（假设这些数据都是按照顺序排列好的，图中是随意写的），那么如果我们只想要这几个值的话，都不需要再进行主键定位查询了，提高了一些效率。

小结：

InnoDB的聚集索引是按照主键搜索，是最高效的，辅助索引需要走两次索引，首先查询辅助索引得到主键，再跟进主键查询获得记录。

问题1：不建议主键字段过长：原因上面第2点也讲过一些，过长会造成数据项空间变大，每个节点数据项数目变少，高度增加。

另外我们发现辅助索引的data域记录的也是主键，因此简介造成辅助索引变大，查询困难。

问题2：非单调字段：如果不是单调字段的话，会造成B+树不断的调整，十分低效，上一篇分析过插入和删除。使用自增字段的话会保持一个相对稳定的顺序。

1、内节点：非根非叶子节点,即非根的分支节点。

2、名称：B-树=B树=平衡多路查找树。

3、定义：m阶B树。

（0）、根节点孩子数rootChildNum范围：若没有孩子节点则孩子数为0，若有孩子则：2 <= rootChildNum <= m

（1）、树中每个节点的孩子树个数childNum范围：2 <= childNum <= m

（2）、内节点孩子个数innerChildNum的范围： ceil(m/2) <= innerChildNum <= m

（3）、节点数据个数dataNum与节点孩子个数childNum关系：childNum = dataNum + 1。而且数据递增排列。

（4）、所有叶子节点处于同一层次。

4、一颗B树的高度h与节点数n的不等关系建立：

第一层节点数：最少 1

第二层节点数：最少 2

第三层节点数：最少 2 × ceil(m/2)

第四层节点数：最少 2 × ceil(m/2) × ceil(m/2)

依次类推。。。。。。。。。

第h层节点数：最少 2 × [ ceil(m/2) ]^h-2

因此高度为h的B树中节点树的最小值为：

全部评论

推荐最新楼层

04-01 14:23

蚌埠坦克学院嵌入式软件开发

我感觉我现在每天至少AI 100次以上

我现在每天就用AI写代码，真的就是躺平了，已经不想思考了，只需要等待AI帮我把代码写好，我自己直接躺平。每天可以干一周的活了，简直爽爆了。

你现在一天AI几次？

点赞评论收藏

04-04 17:33

同济大学 Java

去年后端暑期实习拿了5+个大厂offer，面试被问最多的全在这了

全文约 4400 字 | 预计阅读 11 分钟目录先交个底：我是谁，拿了什么结果45 场面试，被问最多的后端八股全在这了手撕题：写不出来基本就挂了暑期实习和春招，考的真不一样最后说两句上一篇春招五周，我面了四十多场，最后想说的全在这了发出来之后，反馈比我预想的好很多。很多同学私信问我：暑期实习也有这种汇总吗？刚好清明假期有空，把去年暑期实习的面经全部翻出来整理了一遍。43 篇精修面经，每一篇我都重新读了，把所有被问到的问题按频率和重要性做了归类。先说一句：这是去年的面经，时效性肯定不如今年的新鲜。但八股文和算法题这东西，一年前和一年后差别不大，核心考点就那些。我两篇文章加起来不到 100 道八...

一人分享一道面试手撕题

点赞评论收藏

04-02 13:42

已编辑

北京航空航天大学后端工程师

字节暑期已offer

算上这次也是三战字节了timeline3.24一面 当晚约二面3.25二面 当晚约三面3.27三面 3.30约HR面4.1HR面4.2 oc+offer加油加油，希望暑期能活下来

点赞评论收藏

03-02 15:48

南华大学游戏后端

双废大学生，不愿认输

我选没有，我的目标offer是字节跳动，❤️和字节，当然选字节。大二在校，没背过面经，只练过一点算法，算法根本不会写，写了几十道，还是菜鸡，之前boss投递300+没有人回我，有几个回我的要我会全栈才行。继续沉淀吧

程序员酥皮蛋：字节目标明确

春招开局，你有保底off...

点赞评论收藏

04-06 11:05

门头沟学院 Java

3.30美团ai应用一面

1.skills和tools是怎么区分的？2.skills真正的优点是什么？能做到什么？3.mcp的讲解？ mcp要定义接口的话，必须把参数那些都定义到上下文中，他是一个比较冗余的信息，会污染到上下文。正常的工具调用是不需要这些冗杂语义的，而skill会隔离这些东西在上下文里面会去隔离这些东西，不光是token消耗量。还有一个重点就是做到按需加载，渐进式加载的问题。4.长期记忆是怎么做的？用户的记忆属于实体记忆，实体记忆应该更偏向于关键词记忆，并非rag。5.接触过融合检索吗？融合检索是什么？6.混合检索的融合算法是什么样的？他的比重是什么样子的？有可能rag找回了top5，es召回了top5...

查看5道真题和解析

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #

# 总结:offer选择，我是怎么选的 #

280083次浏览 1547人参与

# Agent面试会问什么？ #

3760次浏览 95人参与

# 机械人，你的秋招第一份简历被谁挂了 #