python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python 正则表达式

Python 正则表达式中的`^`和`[]`及常见含义

作者:shengchao0920

文章解析Python正则中^和[]的用途:^在字符集前取反,外表示开头;[]定义字符集,支持范围、取反及特殊字符处理,需注意与锚点及预定义类的区别,本文给大家介绍Python 正则表达式中的^和[]及含义,感兴趣的朋友一起看看吧

一、正则表达式:符号^

在正则表达式中有两种常见的含义,具体取决于它的位置:

1. 在字符集 [ ] 的开头时,表示取反(negation)。

例如:

2. 在字符集之外时,表示字符串的开始(anchor)。

例如:

总结:

二、正则表达式:字符集[ ]

[ ] 在正则表达式中表示字符集(character set),用于匹配其中任意一个字符。下面详细讲解其具体用法和规则:

1. 基本用法

字符集 [ ] 中的每个字符都是独立的匹配选项。例如:

示例:

import re
text = "a1b2c3"
print(re.findall(r'[abc]', text))  # 输出: ['a', 'b', 'c']
print(re.findall(r'[0-9]', text))  # 输出: ['1', '2', '3']

2. 取反(Negation)

如果 ^ 出现在字符集的开头(即 [^...]),表示匹配不在该字符集中的任意字符。例如:

示例:

text = "a1b2c3!@#"
print(re.findall(r'[^abc]', text))  # 输出: ['1', '2', '3', '!', '@', '#']
print(re.findall(r'[^0-9]', text))  # 输出: ['a', 'b', 'c', '!', '@', '#']

3. 范围(Range)

在字符集中,可以用 - 表示字符范围(需确保 - 不在开头或结尾,否则会被视为普通字符)。例如:

示例:

text = "Hello World 123"
print(re.findall(r'[a-z]', text))  # 输出: ['e', 'l', 'l', 'o', 'o', 'r', 'l', 'd']
print(re.findall(r'[A-Z]', text))  # 输出: ['H', 'W']
print(re.findall(r'[0-9]', text))  # 输出: ['1', '2', '3']

4. 特殊字符在字符集中的处理

示例:

text = "a*b+c?d]"
print(re.findall(r'[*+?]', text))  # 输出: ['*', '+', '?']
print(re.findall(r'[]]', text))    # 输出: [']']

5. 与预定义字符类的关系

字符集 [ ] 可以实现类似预定义字符类(如 \d\w\s)的功能,但更灵活:

示例:

text = "abc123 _!@#"
print(re.findall(r'\w', text))    # 输出: ['a', 'b', 'c', '1', '2', '3', '_']
print(re.findall(r'[a-zA-Z0-9_]', text))  # 效果相同

6. 与锚点 ^ 的区别

示例:

text = "abc123 xyz"
print(re.findall(r'^abc', text))    # 输出: ['abc'](匹配开头)
print(re.findall(r'[^abc]', text))  # 输出: ['1', '2', '3', ' ', 'x', 'y', 'z'](取反)

总结

到此这篇关于Python 正则表达式中的`^`和`[]`的文章就介绍到这了,更多相关Python 正则表达式内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文