java

关注公众号 jb51net

关闭
首页 > 软件编程 > java > 正则表达式Pattern用法

Java中Pattern用法实例(正则表达式)

作者:woniu317

Pattern在java.util.regex包中,是正则表达式的编译表示形式,此类的实例是不可变的,可供多个并发线程安全使用,下面这篇文章主要给大家介绍了关于Java正则表达式Pattern用法的相关资料,需要的朋友可以参考下

1. 正则表达式的应用

在给用户发送消息时通常情况会有相同的消息模板,但其中部分信息跟用户相关,因此需要对消息模板中的变量部分进行替换。而对于一个系统而言可能有很多套完全不同的模板。因此需要一个通用的根据实际信息替换消息模板中变量的方法。消息模板的变量与velcity中的变量规范相同。

publicstatic <K, V> String replacePlaceHolderWithMapValue(String msg,Map<K,V> placeHolderMap) {
              Patternpattern = Pattern.compile("\\$*!?\\{([\\w]+)\\}");
              Matchermatcher = pattern.matcher(msg);
              Map<String,String> replaceList = new HashMap();
              while(matcher.find()) {
                     StringplaceHolder = matcher.group(0);
                     Stringkey = matcher.group(1);
                     Objectvalue = placeHolderMap.get(key);
                     if(value != null) {
                            replaceList.put(placeHolder,value.toString());
                     }
              }
              for(Entry<String, String> keyValue:replaceList.entrySet()) {
                     msg= msg.replace(keyValue.getKey(), keyValue.getValue());
              }
              returnmsg;
       }

方法中先获取所有的需要替换的变量存入replaceList中,然后再依次替换。上述方法的正则表达式中,([\\w]+)表示对匹配的内容中进行捕获,捕获值存入matcher.group中,当然也可以有多个捕获。

2. 常用正则表达式

[abc]     a、b 或 c(简单类)

[^abc]   任何字符,除了 a、b 或 c(否定)

[a-zA-Z] a到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]]   a到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]]       d、e 或 f(交集)

[a-z&&[^bc]]      a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]]   a 到 z,而非 m 到 p:[a-lq-z](减去)

.      任何字符(与行结束符可能匹配也可能不匹配)

\d   数字:[0-9]

\D  非数字: [^0-9]

\s   空白字符:[\t\n\x0B\f\r]

\S   非空白字符:[^\s]

\w  单词字符:[a-zA-Z_0-9]

\W 非单词字符:[^\w]

\p{Lower}   小写字母字符:[a-z]

\p{Upper}  大写字母字符:[A-Z]

X?   X,一次或一次也没有

X*   X,零次或多次

X+  X,一次或多次

X{n}      X,恰好 n 次

X{n,}     X,至少 n 次

X{n,m}  X,至少 n 次,但是不超过 m 次

(X) X,作为捕获组

非捕获

(?=X)    X,通过零宽度的正lookahead

(?!X)      X,通过零宽度的负lookahead

(?<=X)  X,通过零宽度的正lookbehind

(?<!X)   X,通过零宽度的负lookbehind

(?>X)    X,作为独立的非捕获组

3 贪婪匹配与懒惰匹配

考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。

a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。

public static void main(String[] args) {
        String str = "北京市(海淀区)(朝阳区)";
        String paternStr = ".*(?=\\()";
        Pattern pattern = Pattern.compile(paternStr);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println(matcher.group(0));
        }
}

上述方法的输出为:北京市(海淀区)

public static void main(String[] args) {
        String str = "北京市(海淀区)(朝阳区)";
        String paternStr = ".*?(?=\\()";
        Pattern pattern = Pattern.compile(paternStr);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println(matcher.group(0));
        }
}

上述方法输出:北京市

补充:其它的一些用法

Pattern.split(CharSequence input)

这个方法跟String.split()方法效果类似

Pattern p2 = Pattern.compile("[a-z]+");
// str的长度为2,返回"我爱"和"哈哈",跟 String[] arr = "我爱java哈哈".
String[] arr = p2.split("我爱java哈哈");
Arrays.stream(arr).forEach(System.out::println);

Pattern.matcher(String regex,CharSequence input)

一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串,效果与Pattern.compile(regex).matcher(input).matches() 类似

Pattern p = Pattern.compile("\\d+");
// 返回\d+
System.out.println(p.pattern());
// p.pattern()返回\d+, 这里为true,只有当全部满足则为true
System.out.println(Pattern.matches(p.pattern(), "2223"));
// 返回false,只要一个不满足,则返回false
System.out.println(Pattern.matches(p.pattern(), "2223b"));

总结

到此这篇关于Java中Pattern用法实例的文章就介绍到这了,更多相关正则表达式Pattern用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文