mysql必知必会用通配符进行过滤
用通配符进行过滤
LIKE操作符
LIKE指示MySQL后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较
%百分号通配符
%表示任何字符出现任意次数。、
例:为了找出以词jet起头的产品:
SELECT prod_id,prod_name FROM products WHERE prod_name LIKE 'jet%';
例:通配符可以在搜索模式的任意位置使用,并且可以使用多个通配符。
SELECT prod_id,prod_name FROM products WHERE prod_name LIKE '%anvil%';
:rainbow_flag:需要注意的是,%是可以匹配0个字符的。%代表搜索模式中给定位置的0个,1个,或多个字符。
:ideograph_advantage:还需要注意的一点是,尾部空格是会干扰通配符的匹配的。如果在保存anvil时尾部有几个空格,‘%anvil’就没有办法匹配成功的。解决方法就是你在末尾也加上一个%。或者更好的方法是使用函数。
:office:虽然似乎%可以匹配任何东西,但是有一个例外,那就是NULL。即使是WHERE prod_name LIKE '%'也不能匹配用值为NULL的产品名。
_下划线通配符
下划线只匹配单个字符。
SELECT prod_id ,prod_name FROM products WHERE prod_name LIKE '_ ton anvil';
:e-mail:和%不一样,下划线只能匹配一个字符,不能多也不能少。
使用通配符的技巧
- 不要过度使用通配符,如果其他操作符能达到同样的目的,应该使用其他的操作符。
- 在确实需要使用统配符的时候,尽量不要把他们用到搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
- 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。
用正则表达式进行搜索
使用MySQL正则表达式
基本字符匹配
例:检索列prod_name 包含文本1000的所有行。
SELECT prod_name FROM products WHERE prod_name REGEXP '1000' ORDER BY prod_name;
:yellow_heart:REGEXP告诉MySQL,它后面跟着的是正则表达式。
SELECT prod_name FROM products WHERE prod_name REGEXP '.000' ORDER BY prod_name;
:warning:这个 . 可以说是正则表达式的一部分用途了。它表示匹配任一一个字符。
LIKE 和 REGEXP的区别
- LIKE是匹配整个列,完全一样或者带通配符才可以匹配成功
- REGEXP是只要列中包含文本就可以匹配成功。当然REGEXP也可以匹配整个列值。
区分大小写
- 正则表达式的匹配是不区分大小写的。为区分大小写可使用BINARY关键字。
- 如:WHERE prod_name REGEXP BINARY 'JetPack .000'
进行OR匹配
使用符号 |
SELECT prod_name FROM products WHERE prod_name REGEXP '1000|2000' ORDER BY prod_name;
匹配几个字符串之一
如果你只想匹配特定的字符,可以通过指定一组用 [ ] 括起来的字符完成。
SELECT prod_name FROM products WHERE prod_name REGEXP '[123] Ton' ORDER BY prod_name;
上面这个结果,还想说明一个问题,就是REGEXP虽然是可以匹配尾巴和头部的空格,但是你在单引号之间的空格还是需要你自己写上去的,单引号之间的空格你不写可是匹配不到结果的。
如上面结果所示,[]其实就是另一种方式的or语句,【123】其实也就是【1|2|3】。当然你写后者也是没有任何问题的。
下面我们再看一个例子:
SELECT prod_name FROM products WHERE prod_name REGEXP '1|2|3 Ton' ORDER BY prod_name;
从结果上我们不难看出,你不用【】括起来,MySQL就会理解为1or2or3 Ton这样的形式
而下面那三行能匹配到也就是因为里面有1or2。
:warning:字符集也可以被否定:[ ^123 ]的意思就是匹配除了这些以外的任何东西。
这个 ^ 在【】括号里,就是除了的1,2,3,的意思,但是如果没有【】,那就是定位符是文本的开始位置的意思。
你比如说下面这两结果就是一样的哟:
你再看一个理解定位符^
当时我有一个这样的例子不明白,后来想明白了。
上面这个当时我就不明白,为什么都不包含1了,红框里还有,这就是REGEXP,你不包含1or2or3.你有其他的元素呀,所以你就得显示出来。
匹配范围
集合可以用来定义要匹配的一个或者多个字符。
例如:下面的集合将匹配数字0到9
【0123456789】
为了简化这种类型的集合,可使用 - 来定义一个范围。
【0-9】
SELECT prod_name FROM products WHERE prod_name REGEXP '[1-5] Ton' ORDER BY prod_name;
匹配特殊字符
也就是转义。我们要匹配特殊字符必须用\\为前导。
SELECT vend_name FROM vendors WHERE vend_name REGEXP '\\.' ORDER BY vend_name;
:warning:多数的正则表达式实现使用单个反斜杠转义特殊字符,以便能使用这些字符本身。但是mysql要求两个反斜杠(mysql自己解释一个,正则表达式库解释一个)。
匹配字符类
存在找出你自己经常使用的数字,所有字母字符或所有数字字母字符等的匹配。为方便工作,可以使用预定义的字符集,称为字符类。
类 | 说明 |
---|---|
【:alnum:】 | 任意字母和数字(同【a-zA-Z0-9】) |
【:alpha:】 | 任意字符【a-zA-Z】 |
【:blank:】 | 空格和制表【\\t】 |
[:cntrl:] | ASCII控制字符(ASCII0到31和127) |
【:digit:】 | 任意数字(【0-9】) |
【:graph:】 | 与【:print:】相同,但不包括空格 |
【:lower:】 | 任意小写字母【a-z】 |
【:print:】 | 任意可打印字符 |
【:punct:】 | 既不在【:alnum:】也不在【:cntrl:】中的任意字符 |
【:space:】 | 包括空格在内的任意空白符(同【\\f\\n\\r\\t\\v】) |
[:upper:] | 任意大写字母【A-Z】 |
【:xdigit:】 | 任意十六进制数字(同【a-fA-F0-9】) |
匹配多个实例
重复元字符
元字符 | 说明 |
---|---|
* | 0个或者多个匹配 |
+ | 1个或多个匹配(等于{1,}) |
? | 0个或1个匹配(等于{0,1}) |
{n} | 指定数目的匹配 |
{n,} | 不少于指定数目的匹配 |
{n,m} | 匹配数目的范围 |
SELECT prod_name FROM products WHERE prod_name REGEXP '\\([0-9] sticks?\\)' ORDER BY prod_name;
:jack_o_lantern:我觉得难理解的点就在于,那个?的匹配(s后的?使s可选,因为?匹配他前面的的任何字符0次或者1次)。这也就是会有第一条结果的原因。
例:匹配连在一起的的4位数字。
SELECT prod_name FROM products WHERE prod_name REGEXP '[[:digit:]]{4}' ORDER BY prod_name;
定位符
之前的例子都是匹配任一一个串中任意位置的文本。为了匹配特定位置的文本,我们需要使用定位符。
元字符 | 说明 |
---|---|
^ | 文本的开始 |
$ | 文本的结束 |
[[:<:]] | 词的开始 |
[[:>:]] | 词的结束 |
例:找一个以数或小数点开始的所有产品
SELECT prod_name FROM products WHERE prod_name REGEXP '^[0-9\\.]' ORDER BY prod_name;