JavaScript RegExp 正则表达式对象详细说明

2010-12-12 19:10:04 作者：

RegExp 对象表示正则表达式，它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法：

var obj=new RegExp(pattern,attributes);

事例1：

 
var pattern=/a/; 
document.write(pattern.exec("asdas")); 

事例2：

复制代码代码如下:

 
var obj=new RegExp("a"); 
document.write(obj.exec("asdas")); 

事例1和事例2的执行结果是相同的；
参数
参数 pattern 是一个字符串，指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串，包含属性 "g"(执行全局匹配查找所有匹配而非在找到第一个匹配后停止。)、"i":执行对大小写不敏感的匹配。和 "m":执行多行匹配。，分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前，不支持 m 属性。如果 pattern 是正则表达式，而不是字符串，则必须省略该参数。

返回值
一个新的 RegExp 对象，具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串，那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。

如果不用 new 运算符，而将 RegExp() 作为函数调用，那么它的行为与用 new 运算符调用时一样，只是当pattern 是正则表达式时，它只返回 pattern，而不再创建一个新的 RegExp 对象。

抛出
SyntaxError - 如果 pattern 不是合法的正则表达式，或 attributes 含有 "g"、"i" 和 "m" 之外的字符，抛出该异常。

TypeError - 如果 pattern 是 RegExp 对象，但没有省略 attributes 参数，抛出该异常。
RegExp 对象方法:
1、test():检索字符串中指定的值。返回 true 或 false。

复制代码代码如下:

 
var patt1=new RegExp("e"); 
document.write(patt1.test("The best things in life are free")); 

2、exec():检索字符串中指定的值。返回找到的值，并确定其位置。

复制代码代码如下:

方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配，则返回 null。 

3、compile():既可以改变检索模式，也可以添加或删除第二个参数。

复制代码代码如下:

 
var patt1=new RegExp("e"); 
document.write(patt1.test("The best things in life are free")); 
patt1.compile("d"); 
document.write(patt1.test("The best things in life are free")); 

修饰符:

1、g:执行全局匹配查找所有匹配而非在找到第一个匹配后停止;
在使用 "g" 参数时，exec() 的工作原理如下：
找到第一个 "e"，并存储其位置
如果再次运行 exec()，则从存储的位置开始检索，并找到下一个 "e"，并存储其位置

复制代码代码如下:

 
var patt1=new RegExp("e","g"); 
do 
{ 
result=patt1.exec("The best things in life are free"); 
document.write(result); 
} 
while (result!=null) 

RegExp 对象属性
1:global:RegExp 对象是否具有标志 g。
2:ignoreCase:RegExp 对象是否具有标志 i。
3:lastIndex:一个整数，标示开始下一次匹配的字符起始位置。
4:multiline:RegExp 对象是否具有标志 m;
5:source:正则表达式的源文本。

复制代码代码如下:

 
var obj=new RegExp(/s/); 
document.write(obj.source); 

支持正则表达式的 String 对象的方法
1：search() 方法用于检索字符串中指定的子字符串，或检索与正则表达式相匹配的子字符串。
忽略大小写事例：

复制代码代码如下:

 
<script type="text/javascript"> 
var str="Visit W3School!" 
document.write(str.search(/w3school/i)) 
</script> 

返回值

stringObject 中第一个与 regexp 相匹配的子串的起始位置。

注释：如果没有找到任何匹配的子串，则返回 -1。

说明

search() 方法不执行全局匹配，它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性，并且总是从字符串的开始进行检索，这意味着它总是返回 stringObject 的第一个匹配的位置。

2：match() 方法可在字符串内检索指定的值，或找到一个或多个正则表达式的匹配。该方法类似 indexOf() 和 lastIndexOf()，但是它返回指定的值，而不是字符串的位置。

返回值

存放匹配结果的数组。该数组的内容依赖于 regexp 是否具有全局标志 g。

说明

match() 方法将检索字符串 stringObject，以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。

如果 regexp 没有标志 g，那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本， match() 将返回 null。否则，它将返回一个数组，其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本，而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外，返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置，input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g，则 match() 方法将执行全局检索，找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串，则返回 null。如果找到了一个或多个匹配子串，则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同，它的数组元素中存放的是 stringObject 中所有的匹配子串，而且也没有 index 属性或 input 属性。

注意：在全局检索模式下，match() 即不提供与子表达式匹配的文本的信息，也不声明每个匹配子串的位置。如果您需要这些全局检索的信息，可以使用 RegExp.exec()。

参数为字符串的事例：

复制代码代码如下:

 
var str="Hello world!" 
document.write(str.match("world") + "<br />") 

参数为正则表达式的事例：

复制代码代码如下:

 
var str="1 plus 2 equal 3" 
document.write(str.match(/\d+/g)) 

3：replace() 方法用于在字符串中用一些字符替换另一些字符，或替换一个与正则表达式匹配的子串。

stringObject.replace(regexp/substr,replacement)

参数	描述
regexp/substr	必需。规定子字符串或要替换的模式的 RegExp 对象。请注意，如果该值是一个字符串，则将它作为要检索的直接量文本模式，而不是首先被转换为 RegExp 对象。
replacement	必需。一个字符串值。规定了替换文本或生成替换文本的函数。

参数

描述

regexp/substr

必需。规定子字符串或要替换的模式的 RegExp 对象。

请注意，如果该值是一个字符串，则将它作为要检索的直接量文本模式，而不是首先被转换为 RegExp 对象。

replacement

必需。一个字符串值。规定了替换文本或生成替换文本的函数。

返回值

一个新的字符串，是用 replacement 替换了 regexp 的第一次匹配或所有匹配之后得到的。

说明

字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串，然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g，那么 replace() 方法将替换所有匹配的子串。否则，它只替换第一个匹配子串。

replacement 可以是字符串，也可以是函数。如果它是字符串，那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示，它说明从模式匹配得到的字符串将用于替换。

字符	替换文本
$1、$2、...、$99	与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
$&	与 regexp 相匹配的子串。
$`	位于匹配子串左侧的文本。
$'	位于匹配子串右侧的文本。
$$	直接量符号。

注意：ECMAScript v3 规定，replace() 方法的参数 replacement 可以是函数而不是字符串。在这种情况下，每个匹配都调用该函数，它返回的字符串将作为替换文本使用。该函数的第一个参数是匹配模式的字符串。接下来的参数是与模式中的子表达式匹配的字符串，可以有 0 个或多个这样的参数。接下来的参数是一个整数，声明了匹配在 stringObject 中出现的位置。最后一个参数是 stringObject 本身。

字符串替换：

复制代码代码如下:

 
var str="Visit Microsoft!" 
document.write(str.replace(/Microsoft/, "W3School")) 

全局替换：

复制代码代码如下:

 
var str="Welcome to Microsoft! " 
str=str + "We are proud to announce that Microsoft has " 
str=str + "one of the largest Web Developers sites in the world." 
document.write(str.replace(/Microsoft/g, "W3School")) 

返回的结果：Welcome to W3School! We are proud to announce that W3Schoolhas one of the largest Web Developers sites in the world.使用正则表达式：

复制代码代码如下:

 
name = '"a", "b"'; 
name.replace(/"([^"]*)"/g, "'$1'"); 

使用函数：

复制代码代码如下:

 
name = 'aaa bbb ccc'; 
uw=name.replace(/\b\w+\b/g, function(word){ 
return word.substring(0,1).toUpperCase()+word.substring(1);} 
); 

4：split() 方法用于把一个字符串分割成字符串数组。

语法

stringObject.split(separator,howmany)

参数	描述
separator	必需。字符串或正则表达式，从该参数指定的地方分割 stringObject。
howmany	可选。该参数可指定返回的数组的最大长度。如果设置了该参数，返回的子串不会多于这个参数指定的数组。如果没有设置该参数，整个字符串都会被分割，不考虑它的长度。

返回值

一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括 separator 自身。

但是，如果 separator 是包含子表达式的正则表达式，那么返回的数组中包括与这些子表达式匹配的字串（但不包括与整个正则表达式匹配的文本）。

提示和注释

注释：如果把空字符串 ("") 用作 separator，那么 stringObject 中的每个字符之间都会被分割。

注释：String.split() 执行的操作与 Array.join 执行的操作是相反的。

修饰符

修饰符	描述
i	执行对大小写不敏感的匹配。
g	执行全局匹配（查找所有匹配而非在找到第一个匹配后停止）。
m	执行多行匹配。

方括号

方括号用于查找某个范围内的字符：

表达式	描述
[abc]	查找方括号之间的任何字符。
[^abc]	查找任何不在方括号之间的字符。
[0-9]	查找任何从 0 至 9 的数字。
[a-z]	查找任何从小写 a 到小写 z 的字符。
[A-Z]	查找任何从大写 A 到大写 Z 的字符。
[a-Z]	查找任何从小写 a 到大写 Z 的字符。
[adgk]	查找给定集合内的任何字符。
[^adgk]	查找给定集合外的任何字符。
[red\|blue\|green]	查找任何指定的选项。

元字符

元字符（Metacharacter）是拥有特殊含义的字符：

元字符	描述
.	查找单个字符，除了换行和行结束符。
\w	查找单词字符。
\W	查找非单词字符。
\d	查找数字。
\D	查找非数字字符。
\s	查找空白字符。
\S	查找非空白字符。
\b	查找位于单词的开头或结尾的匹配。
\B	查找不处在单词的开头或结尾的匹配。
\0	查找 NUL 字符。
\n	查找换行符。
\f	查找换页符。
\r	查找回车符。
\t	查找制表符。
\v	查找垂直制表符。
\xxx	查找以八进制数 xxx 规定的字符。
\xdd	查找以十六进制数 dd 规定的字符。
\uxxxx	查找以十六进制数 xxxx 规定的 Unicode 字符。

量词

量词	描述
n+	匹配任何包含至少一个 n 的字符串。
n*	匹配任何包含零个或多个 n 的字符串。
n?	匹配任何包含零个或一个 n 的字符串。
n{X}	匹配包含 X 个 n 的序列的字符串。
n{X,Y}	匹配包含 X 或 Y 个 n 的序列的字符串。
n{X,}	匹配包含至少 X 个 n 的序列的字符串。
n$	匹配任何结尾为 n 的字符串。
^n	匹配任何开头为 n 的字符串。
?=n	匹配任何其后紧接指定字符串 n 的字符串。
?!n	匹配任何其后没有紧接指定字符串 n 的字符串。

JavaScript RegExp 对象参考手册

JavaScript RegExp 正则表达式对象详细说明

返回值

说明

返回值

说明

返回值

说明

语法

返回值

提示和注释

修饰符

方括号

元字符

量词

您可能感兴趣的文章: