python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > python正则表达式包含且不包含某字符串

python正则表达式如何解决包含且不包含某字符串问题

作者:jk775800

文章介绍了如何使用Python正则表达式中的断言功能来匹配不包含特定字符串的文本,通过零宽度正先行断言`(?=X)`和零宽度负先行断言`(?!X)`,可以实现更复杂的匹配需求,文章通过多个例子展示了如何应用这些断言来匹配或排除特定子字符串

正则表达式解决包含且不包含某字符串

python简单正则里只介绍到了不包含某字符的正则:[^1-9a-z],[^abc]也只能完成不匹配a、b、c三个字母的功能,但是这个并不能实现不匹配"abc“字符串的功能

这里要用到正则表达式中的断言知识

(?=X )

零宽度正先行断言。仅当子表达式 X 在 此位置的右侧匹配时才继续匹配。例如,/w+(?=/d) 与后跟数字的单词匹配,而不与该数字匹配。此构造不会回溯。

(?!X)

零宽度负先行断言。仅当子表达式 X 不在 此位置的右侧匹配时才继续匹配。例如,例如,/w+(?!/d) 与后不跟数字的单词匹配,而不与该数字匹配 。

(?<=X)

零宽度正后发断言。仅当子表达式 X 在 此位置的左侧匹配时才继续匹配。例如,(?<=19)99 与跟在 19 后面的 99 的实例匹配。此构造不会回溯。

(?<!X)

零宽度负后发断言。仅当子表达式 X 不在此位置的左侧匹配时才继续匹配。例如,(?<!19)99 与不跟在 19 后面的 99 的实例匹配

从断言的表达形式可以看出

它用的就是分组符号,只不过开头都加了一个问号,这个问号就是在说这是一个非捕获组,这个组没有编号,不能用来后向引用,只能当做断言。(对于正则表达式的断言感兴趣的同学,可以再查一查资料,这里不多做赘述)

所以这里我们不想匹配abc字符串就得用这个表达式: (?!abc)

测试代码:

import re
p = re.compile(r'error(?!abc)'
print p.search("errorabc")
print p.search("errorab")

结果:

None

<_sre.SRE_Match object at 0x7f129ce34b90>

那么我想不匹配"error123bsc"这个字符串呢?你是不是以为 error.*(?!abc) 这么写这个正则就可以了,我们来试试

import re
p = re.compile(r'error.*(?!abc)'
print p.search("error123abc")

结果:

<_sre.SRE_Match object at 0x7f129ce34bf8>

看,失败了吧!那怎么写呢?这么写:error((?!abc).)*$

知道了(?!abc),那么可以理解((?!abc).)*  的意思就是匹配  不含abc的字符(?!abc) 跟 任意字符. 的组合,出现任何次* 

很多人会问,"$"不是匹配行末尾么,确实是这个意思,不明白请精度上面一句话再来看正则,然后我们来测一下:

import re
p = re.compile(r'error((?!abc).)*$')
print p.search("error123abc")
print p.search("error123abc123")
print p.search("error123ab123")

结果:

None

None

<_sre.SRE_Match object at 0x7f129ce81a08>

明白了吧!

以此类推,你要是想匹配包含error不包含error前后的abc,那么应该是这么写这个正则: 

测一下

import re
p = re.compile(r'^((?!abc).)*error((?!abc).)*$')
print p.search("123abc123error123")
print p.search("123ab123error123")

结果:

None

<_sre.SRE_Match object at 0x7f129ce81a08>

我们要是想匹配包含error不包含多个字符串,比如abc和def,这么写正则: error((?!(abc|def)).)*$

测试:

import re
p = re.compile(r'error((?!(abc|def)).)*$')
print p.search("error123abc234")
print p.search("error123ab234")
print p.search("error123def234")

结果:

None

<_sre.SRE_Match object at 0x7f87973eccf0>

None

测试完成!

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文