03-28 12:12 辽宁工业大学 C++ 发布于北京

关注

SQL 中的正则表达式

正则表达式

正则表达式（Regular Expression，简称 Regex 或 Regexp）是一种用于匹配字符串中字符组合的模式。它们在文本处理、数据验证和搜索操作中非常有用。以下是一些常见的正则表达式及其用途：

一. 常见的正则表达式

1. 字符类

字符类用于匹配特定的字符集合。

.：匹配任何单个字符（除换行符外）。
- 示例：a.b 匹配 a 后面跟着任何字符，再跟着 b，如 a1b、a-b。
[abc]：匹配方括号内的任意一个字符。
- 示例：[abc] 匹配 a、b 或 c。
[^abc]：匹配不在方括号内的任意一个字符。
- 示例：[^abc] 匹配除 a、b 和 c 之外的任何字符。
[a-z]：匹配指定范围内的任意一个字符。
- 示例：[a-z] 匹配任何小写字母。
[A-Z]：匹配任何大写字母。
- 示例：[A-Z] 匹配任何大写字母。
[0-9]：匹配任何数字。
- 示例：[0-9] 匹配任何单个数字。

2. 预定义字符类

预定义字符类是一些常用的字符类的简写形式。

\d：匹配任何数字，等价于 [0-9]。
- 示例：\d 匹配任何单个数字。
\D：匹配任何非数字字符，等价于 [^0-9]。
- 示例：\D 匹配任何非数字字符。
\s：匹配任何空白字符，包括空格、制表符、换行符等。
- 示例：\s 匹配任何空白字符。
\S：匹配任何非空白字符。
- 示例：\S 匹配任何非空白字符。
\w：匹配任何字母数字字符，等价于 [a-zA-Z0-9_]。
- 示例：\w 匹配任何字母数字字符或下划线。
\W：匹配任何非字母数字字符。
- 示例：\W 匹配任何非字母数字字符。

3. 边界匹配

边界匹配用于匹配字符串的开始或结束位置。

^：匹配字符串的开始位置。
- 示例：^abc 匹配以 abc 开头的字符串。
$：匹配字符串的结束位置。
- 示例：abc$ 匹配以 abc 结尾的字符串。
\b：匹配单词边界。
- 示例：\bword\b 匹配完整的单词 word，而不是 word 的子字符串。

4. 量词

量词用于指定前面的字符或字符类可以出现的次数。

*：匹配前面的字符或字符类 0 次或多次。
- 示例：a* 匹配 0 个或多个 a，如 a、aa、aaa 或空字符串。
+：匹配前面的字符或字符类 1 次或多次。
- 示例：a+ 匹配 1 个或多个 a，如 a、aa、aaa，但不匹配空字符串。
?：匹配前面的字符或字符类 0 次或 1 次。
- 示例：a? 匹配 0 个或 1 个 a，如 a 或空字符串。
{n}：匹配前面的字符或字符类恰好 n 次。
- 示例：a{3} 匹配恰好 3 个 a，如 aaa。
{n,}：匹配前面的字符或字符类至少 n 次。
- 示例：a{3,} 匹配 3 个或更多 a，如 aaa、aaaa。
{n,m}：匹配前面的字符或字符类至少 n 次，但不超过 m 次。
- 示例：a{2,4} 匹配 2 到 4 个 a，如 aa、aaa、aaaa。

5. 分组和捕获

分组和捕获用于将正则表达式的一部分分组，并捕获匹配的内容。

()：分组和捕获。
- 示例：(abc) 匹配 abc，并捕获匹配的内容。
(?:...)：非捕获分组。
- 示例：(?:abc) 匹配 abc，但不捕获匹配的内容。

6. 选择

选择用于匹配多个模式中的一个。

|：选择。
- 示例：abc|def 匹配 abc 或 def。

7. 贪婪和非贪婪

量词的贪婪和非贪婪模式决定了匹配的长度。

贪婪模式：默认情况下，量词是贪婪的，尽可能多地匹配字符。
- 示例：a+ 匹配尽可能多的 a。
非贪婪模式：在量词后加 ?，使其变为非贪婪模式，尽可能少地匹配字符。
- 示例：a+? 匹配尽可能少的 a。

8. 断言

断言用于指定匹配的条件，但不消耗字符。

前瞻断言：
- 正前瞻：(?=...)，匹配后面跟着指定模式的字符。
  - 示例：abc(?=def) 匹配 abc，但只有在其后面跟着 def 时才匹配。
- 负前瞻：(?!...)，匹配后面不跟着指定模式的字符。
  - 示例：abc(?!def) 匹配 abc，但只有在其后面不跟着 def 时才匹配。
后顾断言：
- 正后顾：(?<=...)，匹配前面跟着指定模式的字符。
  - 示例：(?<=abc)def 匹配 def，但只有在其前面跟着 abc 时才匹配。
- 负后顾：(?<!...)，匹配前面不跟着指定模式的字符。
  - 示例：(?<!abc)def 匹配 def，但只有在其前面不跟着 abc 时才匹配。

示例

假设有一个字符串 123abc456def789，我们想匹配其中的数字和字母组合。

匹配数字：\d+
- 匹配结果：123、456、789
匹配字母：[a-z]+
- 匹配结果：abc、def
匹配数字和字母组合：\d+[a-z]+
- 匹配结果：123abc、456def

二. 使用语法

在 MySQL 中，可以使用 REGEXP 或 RLIKE 操作符来使用正则表达式。

语法：

REGEXP

SELECT column1, column2 
FROM table_name 
WHERE column1 REGEXP 'pattern';

RLIKE

SELECT column1, column2, ...
FROM table_name
WHERE column_name RLIKE 'pattern';

三. 使用 `LIKE` 和正则表达式的区别

LIKE 操作符：
- 适用于简单的模式匹配，支持 % 和 _ 两个通配符。
- 性能较好，适用于大多数简单的文本匹配需求。
正则表达式：
- 适用于复杂的模式匹配，支持更广泛的模式匹配功能。
- 性能可能稍差，但在处理复杂模式时非常强大。

示例

假设有一个 employees 表，包含以下数据：

employee_id first_name last_name salary department_id

1	Alice	Smith	60000	101
2	Bob	Johnson	70000	101
3	Charlie	Brown	NULL	102
4	David	Davis	80000	102
5	Eve	White	90000	103

假设我们想查询名字以字母 "A" 开头，且名字长度为 5 个字符的员工。使用 LIKE 操作符可以这样写：

SELECT * 
FROM employees
WHERE first_name LIKE 'A____';

结果：

employee_id first_name last_name salary department_id

1	Alice	Smith	60000	101

使用正则表达式可以这样写：

SELECT * 
FROM employees
WHERE first_name REGEXP '^A.{4}$';

结果：

employee_id first_name last_name salary department_id

1	Alice	Smith	60000	101

总结

LIKE 操作符：适用于简单的模式匹配，支持 % 和 _ 通配符，性能较好。
正则表达式：适用于复杂的模式匹配，支持更广泛的模式匹配功能，但性能可能稍差。

全部评论

推荐最新楼层

03-06 09:24

浙江大学 C++

有人懂字节的穿山甲部门吗？

前两天面了字节的穿山甲部门，面试官和hr和我说是做广告投放的。但是不是给站内做广告投放，是个别的APP做广告投放的(比如爱奇艺之类的)。我听上去更像是通过卖广告投放技术来赚钱的？不太清楚这个部门怎么样，有没有懂的兄弟说一下的

沙福林：穿山甲我知道，鸡汤来喽！

投递字节跳动等公司10个岗位 >

点赞评论收藏

03-28 12:11

江南大学算法工程师

每日互动

📍面试公司：每日互动👜面试岗位：NLP/大模型算法📖面试问题：实习做的语音模型微调，问语音大模型和其他大模型区别。问了实习，介绍研究方向。🙌面试体验：面试官全程听我讲，没有反问，大概方向不一致。#软件开发笔面经#

查看2道真题和解析软件开发笔面经

点赞评论收藏

03-06 13:58

南京大学 Java

2025年03月06日 fly as you are（研二下）

听说今年南软考研分数线爆炸了，甚至有个考了430的老哥联系我导，朋友说是抄底干到山顶上了不过说不定哪天南软改三年了，就降温了，然后大把老哥来抄底，说不定又全干山顶上了这种事哪里能说的准你看厂长都选不明白，deepseek扇了所有闭源模型一巴掌，我认为百度是被扇的最狠的在DeepSeek以前，百度是闭源的忠实拥趸者。百度创始人、董事长兼首席执行官李彦宏曾在去年7月接受采访时表示，开源其实是一种智商税。“当你理性地去想，大模型能够带来什么价值，以什么样的成本带来价值的时候，就会发现，你永远应该选择闭源模型。今天无论是ChatGPT还是文心一言等闭源模型，一定比开源模型更强大，推理成本更低。”所以考...

只想搞钱的无尾熊很好奇：“读了好多年书，如果能顺利毕业的话我就要毕业了，这话看起来没那么信息量，和我读的硕士一样”。两年制真挺羡慕的.

我的进厂/读研经历工作中，努力重要还是选择重要？如果再来一次，你还会选择这个工作吗？

点赞评论收藏

03-13 21:13

已编辑

门头沟学院 Java

携程笔试第一场题解

1.直接模拟2.从小到大排序，从后往前遍历i，每次取i~n这段数组看看答案会不会更大，即不断更新ans=max(ans, a[i] + n - i + 1)。3.先预处理每个数的质因子个数a[i]。对a数组求前缀和。然后枚举长度为k的滑动窗口往后移动，更新答案4.树形dp，记dp[i]为从结点i往下走的路径为偶数的方案数。可以发现，只有所有数都为偶数时，这些数的gcd才可能为偶数，因此只需要判断数的奇偶性就行，不用去算gcd。dfs每个结点u，枚举以u为路径最高点时路径为偶数的方案数，累加起来就是答案。对于每个偶数结点u，dp[u]=u的儿子的dp和 + 1，这样就完成了dp的更新；累加答案的话，就是枚举u的每个儿子dp[i]，和他左边儿子的dp和sum，ans+=sum*dp[i]，然后sum+=dp[i]，因为以u为最高点的话，u左边和u右边的路径是可以组合起来的；第四题可能讲的不是很清楚，但属于树形dp挺常见的类型

投递携程等公司10个岗位

点赞评论收藏

03-09 21:29

已编辑

南京大学 Java

阿里云0309笔试、拼多多0309笔试、蚂蚁0309笔试

阿里云选择若干（单选，多选，分值：3 分* 15）+编程*3（分值：15，15，25），选择不是太好做。为什么要默认大家都知道你说的“排列”就是从1开始呢？如果把题目说明白一点，是怕大家都用一维dp做出来吗？不会, 暴力骗了25%；不会，暴力加贪心骗了75%；拼多多编程*4（分值：25，25，25，25）。模拟，注意负数最大输出时取绝对值；二维dp只过了66%，考虑60%的数据小于10^3， 对这部分数据暴力，其余部分沿用二维dp，最终过了80%；二维dp，dp[i][j]表示前i页书用j小时去读，最大的知识量；注意很多状态都是无用的，给定当前页数为k时，遍历时间j的时候定义时间的上界为min...

G了的牛可乐很爱吃烤肠：饿了么给了我虚假的信心。阿里云又把我打回了现实

投递拼多多集团-PDD等公司10个岗位 > 拼多多求职进展汇总阿里求职进展汇总

点赞评论收藏

全站热榜

腾讯最新进展！

热聊中

创作者周榜

正在热议

SQL 中的正则表达式

正则表达式

一. 常见的正则表达式

1. 字符类

2. 预定义字符类

3. 边界匹配

4. 量词

5. 分组和捕获

6. 选择

7. 贪婪和非贪婪

8. 断言

示例

二. 使用语法

语法：

REGEXP

RLIKE

三. 使用 LIKE 和正则表达式的区别

示例

总结

全站热榜

创作者周榜

三. 使用 `LIKE` 和正则表达式的区别