实例解析ptython正则表达式（基本篇）

作用:简化匹配机制，增加匹配灵活度

假设我们要判定一个字符串是不是电话号码
格式是 xxx-xxx-xxxx
那么如果我们用if elif语句的话，要先判定前三个，然后判定第四个……
而且这样灵活性很差，一堆代码只能检查一种格式

所以正则表达式粉墨登场，re是正则表达式引用的类库，我们可以在命令行中 pip install re安装好

 # 接下来这三行代码很重要
    # 首先re.compile()传入一个我们需要的格式，每个\d表示一个整数
    # 然后在phoneNumber中搜索传入的number,此时返回的对象mo,就是搜到的对象，也即电话号码
    #最后通过mo.group()获得字符，并打印，mo本身包含了很多信息，你也可以打印出来看看
import re
def checkNumber(number):
    phoneNumber = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
    mo=phoneNumber.search(number)
    print(mo.group())

print(checkNumber('444-123-1234'))
#如果没有，返回none
print(checkNumber('12345678'))

打印结果，即会用re.compile(r’),search(),group()

现在你已经会了一点正则，但是继续往下其实还有很多问题
比如如果传入的字符串中有多个目标字符要怎么返回？
有些字符不管存不存在都不影响目标字符怎么办？……
再看这段代码

#在\d后面用{}包含的数字表示相同的整数
#同时在第一个\d周围加上括号，后面两个共同加括号，就可以实现分离出目标字符的功能
phoneNumber=re.compile(r'(\d{3})-(\d{3}-\d{4})')
mo=phoneNumber.search("444-122-1232")
#
#传入参数0，打印出整个字符串
print(mo.group(0))
#传入参数2，打印出第二个字符串
print(mo.group(2))
#通过元祖形式，打印出目标字符串的内容
print(mo.groups())
#这里是最让我惊艳的，可以将mo中包含的字符串分别传入两个字符串，就是按括号分的
first,second=mo.groups()
print(first+","+second)

效果如下，就是()可以分割字符，{}可以设定同样的字符有多少个，group()传参可以决定输出的字符

如果你理解了上面，接下来就势如破竹，对你来说已经没有困难了

| 表示当搜索到其中一个就返回

phoneNumber=re.compile(r'chensong|kangxin')
mo=phoneNumber.search('chensong with kangxin')
mo2=phoneNumber.search('kangxin with chensong')
print(mo.group())
print(mo2.group())

？表示前面被括号包含的字符有就输出，没有也没关系

phoneNumber2=re.compile(r'chensong(wo)?')
mo3=phoneNumber2.search('chensong')
mo4=phoneNumber2.search('chensongwo')
print("mo3="+mo3.group())
print(“mo4="+mo.group())

*号表示前面的字符可以出现零次或多次,都可以一起打印

phoneNumber3=re.compile(r'chensong(wo)*')
mo5=phoneNumber3.search('chensongwowowow')
mo6=phoneNumber3.search('chensong')
print("mo5="+mo5.group())
print("mo6="+mo6.group())

+和类似，加号表示一次或多次，但是号可以没有

phoneNumber4=re.compile(r'chensong(wo)+man')
#现在是搜索不到的情况
mo7=phoneNumber4.search('chensong')
mo8=phoneNumber4.search('chensongwomanman')
#判定mo7是否为空
print(mo7 is None)
print(mo8.group())