正则表达式的常见用法

以下是Python正则表达式的元字符和函数的详细示例:

元字符

  • .:匹配除换行符以外的任意字符。
import re
print(re.findall('.', 'abc'))  # 输出:['a', 'b', 'c']

  • ^:匹配字符串的开头。
print(re.findall('^a', 'abc'))  # 输出:['a']

  • $:匹配字符串的结尾。
print(re.findall('c$', 'abc'))  # 输出:['c']

  • *:对它前面的正则式匹配0到任意次重复。
print(re.findall('a*', 'aaabc'))  # 输出:['aaa', '', '', '', '']

  • +:对它前面的正则式匹配1到任意次重复。
print(re.findall('a+', 'aaabc'))  # 输出:['aaa']

  • ?:对它前面的正则式匹配0到1次重复。
print(re.findall('a?', 'aaabc'))  # 输出:['a', 'a', 'a', '', '', '', '']

  • {m}:对其之前的正则式指定匹配 m 个重复。
print(re.findall('a{2}', 'aaabc'))  # 输出:['aa']

  • {m,n}:对正则式进行 m 到 n 次匹配,在 m 和 n 之间取尽量多。
print(re.findall('a{1,2}', 'aaabc'))  # 输出:['aa']

  • \\:转义特殊字符或表示特殊序列。
print(re.findall('\\$', 'a$bc'))  # 输出:['$']

  • []:用于指定一个字符类,你希望匹配的字符的一个集合。
print(re.findall('[abc]', 'abcdef'))  # 输出:['a', 'b', 'c']

  • |:表示或,匹配前面的或后面的表达式。
print(re.findall('a|b', 'abcdef'))  # 输出:['a', 'b']

  • ():标记一个子表达式的开始和结束位置。
print(re.findall('(ab)', 'abcdef'))  # 输出:['ab']

特殊序列

  • \\d:匹配任何十进制数字,等价于字符类 [0-9]。
print(re.findall('\\d', 'abc123'))  # 输出:['1', '2', '3']
  
  • \\D:匹配任何非数字字符,等价于字符类 [^0-9]。
print(re.findall('\\D', 'abc123'))  # 输出:['a', 'b', 'c']

  • \\s:匹配任何空白字符,等价于字符类 [ \t\n\r\f\v]。
print(re.findall('\\s', 'a b\nc'))  # 输出:[' ', '\n']

  • \\S:匹配任何非空白字符,等价于字符类 [^ \t\n\r\f\v]。
print(re.findall('\\S', 'a b\nc'))  # 输出:['a', 'b', 'c']

  • \\w:匹配任何字母与数字字符,等价于字符类 [a-zA-Z0-9_]。
print(re.findall('\\w', 'abc_123'))  # 输出:['a', 'b', 'c', '_', '1', '2', '3']

  • \\W:匹配任何非字母与数字字符,等价于字符类 [^a-zA-Z0-9_]。
print(re.findall('\\W', 'abc_123.!'))  # 输出:['.', '!']

函数

  • re.match(pattern, string):确定是否匹配字符串的开始部分。如果匹配则返回表示匹配的对象,如果不匹配则返回 None。# match().span()返回匹配的字符串范围
print(re.match('a', 'abc'))  # 输出:<re.Match object; span=(0, 1), match='a'>

  • re.search(pattern, string):搜索字符串中第一次出现的正则表达式的匹配项。如果匹配则返回表示匹配的对象,如果不匹配则返回 None。
print(re.search('b', 'abc'))  # 输出:<re.Match object; span=(1, 2), match='b'>

  • re.findall(pattern, string):在字符串中查找与模式匹配的所有子字符串,并以列表形式返回。
print(re.findall('a', 'abc'))  # 输出:['a']
 
  • re.finditer(pattern, string):在字符串中查找与模式匹配的所有子字符串,并返回一个迭代器。
for match in re.finditer('a', 'abc'):
    print(match)  # 输出:<re.Match object; span=(0, 1), match='a'>

  • re.split(pattern, string, maxsplit=0):根据模式的匹配项来分割字符串,如果在模式中使用括号,则模式中的所有组的文本也将作为结果列表的一部分。如果maxsplit非零,最多进行 maxsplit 次分割,并返回剩余的字符串。
print(re.split(',', 'a,b,c'))  # 输出:['a', 'b', 'c']

  • re.sub(pattern, repl, string, count=0):使用 repl 替换在字符串中找到的正则表达式的所有匹配项。如果模式中没有找到匹配项,则字符串将保持不变。如果count非零,最多替换 count 次。
print(re.sub('a', 'b', 'abc'))  # 输出:'bbc'

全部评论

相关推荐

03-15 14:55
已编辑
门头沟学院 golang
bg:双非学院本&nbsp;ACM银&nbsp;go选手timeline:3.1号开始暑期投递3.7号第二家公司离职顽岩科技&nbsp;ai服务中台方向&nbsp;笔试➕两轮面试,二面挂(钱真的好多😭)厦门纳克希科技&nbsp;搞AI的,一面OC猎豹移动&nbsp;搞AIGC方向&nbsp;一面OC北京七牛云&nbsp;搞AI接口方向&nbsp;一面OC上海古德猫宁&nbsp;搞AIGC方向&nbsp;二面OC上海简文&nbsp;面试撞了直接拒深圳图灵&nbsp;搞AIGC方向一面后无消息懒得问了,面试官当场反馈不错其他小厂没记,通过率80%,小厂杀手😂北京字节&nbsp;具体业务不方便透露也是AIGC后端方向2.28约面&nbsp;(不知道怎么捞的我,我也没在别的地方投过字节简历哇)3.6一面&nbsp;一小时&nbsp;半小时拷打简历(主要是AIGC部分)剩余半小时两个看代码猜结果(经典go问题)➕合并二叉树(秒a,但是造case造了10分钟哈哈)一天后约二面3.12&nbsp;二面,让我挑简历上两个亮点说,主要说的docker容器生命周期管理和raft协议使用二分法优化新任leader上任后与follower同步时间。跟面试官有共鸣,面试官还问我docker底层cpu隔离原理和是否知道虚拟显存。之后一道easy算法,(o1空间解决&nbsp;给定字符串含有{和}是否合法)秒a,之后进阶版如何用10台机加快构建,想五分钟后a出来。面试官以为45分钟面试时间,留了18分钟让我跟他随便聊,后面考了linux&nbsp;top和free的部分数据说什么意思(专业对口了只能说,但是当时没答很好)。因为当时手里有7牛云offer,跟面试官说能否快点面试,马上另外一家时间到了。10分钟后约hr面3.13,上午hr面,下午走完流程offer到手3.14腾讯技术运营约面,想直接拒😂感受:&nbsp;因为有AIGC经验所以特别受AI初创公司青睐,AIGC后端感觉竞争很小(指今年),全是简历拷打,基本没有人问我八股(八股吟唱被打断.jpeg),学的东西比较广的同时也能纵向深挖学习,也运气比较好了哈哈可能出于性格原因,没有走主流Java路线,也没有去主动跟着课写项目,项目都是自己研究和写的哈哈
烤点老白薯:你根本不是典型学院本的那种人,贵了你这能力
查看7道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务