正则匹配---函数篇

一、正则模块：

import re

二、正则函数：

1.re.match函数：

re.match(pattern,string,flags)
尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none

1.pattern:匹配的正则表达式
2.string：要匹配的字符串
3.flags:标志位，用于控制正则表达式的匹配方式，是否区分大小写，多行匹配等

匹配成功后返回的是一个对象或者None。可用group()或groups()匹配对象函数来匹配表达式
- group(num=0)匹配整个表达式的字符串，group()可用一次输入多个组号，在这种情况下它返回一个包含那些组所对应值得元组。
- groups()返回一个包含所有小组字符串组成得元组，从1到所含得小组号
```
content = 'Hello 123 4567 World_This is a Regex Demo'
result = re.match('[a-zA-Z0-9 _]*', content)
print(result) #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
print(result.group()) #Hello 123 4567 World_This is a Regex Demo
print(result.span()) #(0, 41)
```

2.re.findall函数

re.findall(pattern,string,flags)
在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表.

注意： match 和 search 是匹配一次 findall 匹配所有。

3.re.split函数

re.split(pattern,string,maxsplit,flags)
根据模式匹配项来分割函数

4.re.sub函数

re.sub(pattern,repl,string,count,flags)
用于替换

pattren:是正则表达式，一般使用r''
repl:是被替换的字符
string:被匹配的字符串

count:被替换的最大次数，默认是0，会替换所有。

dd = 'attn: X\nDear X,'
print(re.sub(r'X','Mr.smith', dd))
#结果：
#attn: Mr.smith
#Dear Mr.smith,

5.re.subn函数

re.subn(pattern,repl,string,count,flags)
与sub相同，但返回的是一个元组，其中包含新字符串和替换次数。

dd = 'attn: X\nDear X,'
print(re.subn(r'X','Mr.smith', dd))
#结果：
#('attn: Mr.smith\nDear Mr.smith,', 2)

6.re.search()函数

re.search(pattern,string,flags)
在字符串中寻找模式，与match相似，但是search可以不从位置0开始匹配

content = 'Hello 123456789 Word_This is just a test 666 Test'
result = re.search(r'(\d+).*?(\d+).*', content)

print(result)  #<_sre.SRE_Match object; span=(6, 49), match='123456789 Word_This is just a test 666 Test'>
print(result.group())  # print(result.group(0)) 同样效果字符串
print(result.groups()) #('123456789', '666')
print(result.group(0))#123456789 Word_This is just a test 666 Test
print(result.group(1)) #123456789
print(result.group(2))  #666

7.re.compile()

re.compile(pattern,flags)
根据包含正则表达式的字符串创建模式对象
返回一个匹配对象，单独使用没有任何意义，需要和findall(),match(),search()搭配使用。

与findall一起使用返回一个列表

content = '''Hello,
  I am Jerry, 
  from Chongqing,
  a montain city, 
  nice to meet you……'''
regex = re.compile('\w*o\w*',re.M)
x = regex.findall(content)
print(x)  #['Hello', 'from', 'Chongqing', 'montain', 'to', 'you']

与match一起使用，可返回一个class，str，tuple，但是match是从位置0开始匹配，匹配不到就返回None。

content = 'Hohi, I am lily,nice to meet you....'
regex = re.compile('\w*i\w?')
y = regex.match(content)
print(y)  #<_sre.SRE_Match object; span=(0, 4), match='Hohi'>
print(type(y)) #<class '_sre.SRE_Match'>
print(y.group())  #Hohi
print(y.span())  #(0, 4)

与search一起使用，返回的与match差不多，但不同的是search可以不是从位置0开始匹配。但匹配一个之后也会结束。

content = 'Hihi, I am lily,nice to meet you....'
regex = re.compile('\w*o\w?')
y = regex.search(content)
print(y)  #<_sre.SRE_Match object; span=(21, 23), match='to'>
print(type(y))  #<class '_sre.SRE_Match'>
print(y.group())  #to
print(y.span())  #(21, 23)

全部评论

推荐最新楼层

昨天 10:50

已编辑

门头沟学院 Java

华为秋招炮灰有感

鼠鼠华子无线实习，bg双九，通软岗位，论文，专利，竞赛都水过一点，秋招《非all in》选手，《泡池子泡到肿》选手，分享一下自己的时间线，给大家多一个参考。---实习末期，接口人电话沟通，最终决定求稳继续投递实习原部门---免机试，九月走完线下流程，开始入池---十月起开始保温，打听手中已拿offer，比较薪资，给出华子的预估职级和薪资（完全不给A的空间）---十月第二次保温，询问签约情况，各种暗示劝说留空白三方---十月底签约另一家公司，遂被降低优先级---十一月若干次常规保温信息（还有机会/稍晚一点/等这周。。。）---十二月告知部门有13的指标，愿意接受可以立刻发offer（难绷，妄图性...

蓦然回首一枝花：能体会楼主的心情，我投了华为无线的成研所，双9bg，被华子最后开了个13级的侮辱价 12.3打oc电话的时候接口人表示乐观等待就行，然后中间4周就开始不回消息或者拖四五天才回，翻来覆去就是“等审批结果”。 12月27号，我看应该是泡不出来了所以联系了部门流转，这时候接口人开始主动给我打电话告诉我马上就能出结果了，于是我也没继续流转。 12.31给我打电话说得降薪审批，薪资大概就是对应着13级的样子，但我当时因为投的是成都的，没有意识到薪资是按照上海开的，还以为这个薪资在成都是14级，加上那个时候我也“孝”劲上来了，想着能收我就行，于是答应了。 1.13开了出来，联系我了薪资，确认了下发现是13级，当时实在是接受不了，于是最终还是拒了。拒的时候接口人告诉我说这个hc真的是他们争取了很久才争取到的，不过我一想到我12.3就打了oc电话，中间4周一直不搭理我或吊着我，最后12.31才告诉我争取不下来14级要降薪，也许争取真的要争取那么久吧，呵。这个过程中也为华为拒了不少offer，大厂的、央企的、银行的都拒过，网上总说“华为没有发小奖状之前hr的话一个字都不要信”，当时没有放在心上，以为不会摊到我头上，现在来看当时也挺年轻气盛的。我感觉要不是中途我一直在烦hr，可能我就和楼主一样被泡死了吧，不过最后给开了个13级也和泡死没差，不过是被多侮辱了一次。最后借楼主这个贴就只想跟后面的人提一个建议吧，还是那句说烂了的，“华为没有发小奖状之前hr的话一个字都不要信”，真的不要以为这样的情况不会出现在自己身上，不要拿自己的一辈子前途去送华为hr业绩。

点赞评论收藏