标签:
转载的目的在于:增加一些自己看不懂的解释.内容只加不改,灰色字体是自己寻找并增加的。
正则表达式可以: 
•测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证 
•替换文本。可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字 
•根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字 
正则表达式语法 
一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。 
创建正则表达式 
RegExp构造函数第一个参数为正则表达式的文本内容,而第一个参数则为可选项标志.标志可以组合使用 
•g (全文查找) 表示该表达式将用来在输入字符串中查找所有可能的匹配,返回的结果可以是多个。如果不加/g最多只会匹配一个
•i (忽略大小写) 表示匹配的时候不区分大小写
•m (多行查找) 表示多行匹配,什么是多行匹配呢?就是匹配换行符两端的潜在匹配。影响正则中的^$符号
正则表达式还有另一种正则表达式字面量的声明方式 
和正则表达式相关的方法和属性 
正则表达式对象的方法 
•test,返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在则返回 true,否则就返回 false。 
•exec,用正则表达式模式在字符串中运行查找,并返回包<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含该查找结果的一个数组。 
•compile,把正则表达式编译为内部格式,从而执行得更快。 
正则表达式对象的属性 
•source,返回正则表达式模式的文本的复本。只读。 
•lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的开始位置。 
•1...9,返回九个在模式匹配期间找到的、最近保存的部分。只读。 
•input ($_),返回执行规范表述查找的字符串。只读。 
•lastMatch ($&),返回任何正则表达式搜索过程中的最后匹配的字符。只读。 
•lastParen ($+),如果有的话,返回任何正则表达式查找过程中最后括的子匹配。只读。 
•leftContext ($`),返回被查找的字符串中从字符串开始位置到最后匹配之前的位置之间的字符。只读。 
•rightContext ($‘),返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符。只读。 
String对象一些和正则表达式相关的方法 
•match,找到一个或多个正则表达式的匹配。 
•replace,替换与正则表达式匹配的子串。 
•search,检索与正则表达式相匹配的值。 方法指明是否存在相应的匹配。如果找到一个匹配,search 方法将返回一个整数值,指明这个匹配距离字符串开始的偏移位置。如果没有找到匹配,则返回 -1
•split,把字符串分割为字符串数组。 
测试正则表达式是如何工作的! 
当然,仅仅知道了字符串是否匹配模式还不够,我们还需要知道哪些字符匹配了模式 
更复杂的用法,使用子匹配 
注意,当字符串不匹配re时,exec方法将返回null  
String对象的一些和正则表达式有关的方法 
注意,当search方法没有找到匹配时,将返回-1 
类似于exec方法,String对象的match方法也用于将字符串与正则表达式进行匹配并返回结果数组 
RegExp对象实例的一些属性 
每个RegExp对象的实例具有lastIndex属性,它是被查找字符串中下一次成功匹配的开始位置,默认值是-1。 lastIndex 属性被 RegExp 对象的 exec 和 test 方法修改.并且它是可写的. 
当匹配失败(后面没有匹配),或lastIndex值大于字符串长度时,再执行exec等方法会将lastIndex设为0(开始位置) 
RegExp对象的静态属性 
multiline属性返回正则表达式是否使用多行模式,这个属性不针对某个正则表达式实例,而是针对所有正则表达式,并且这个属性可写.(IE与Opera不支持这个属性) 
使用元字符注意事项:元字符是正则表达式的一部分,当我们要匹配正则表达式本身时,必须对这些元字符转义.下面是正则表达式用到的所有元字符 
( [ { \ ^ $ | ) ? * + . 
使用RegExp构造函数与使用正则表达式字面量创建正则表达式注意点 
既然双重转义这么不友好,所以还是用正则表达式字面量的声明方式 
如何在正则表达式中使用特殊字符? 
另处,还有一些其它的预定义特殊字符,如下表所示: 
字符    描述 
\n      换行符 
\r      回车符 
\t      制表符 
\f      换页符(Tab) 
\cX     与X对应的控制字符 
\b      退格符(BackSpace) 
\v      垂直制表符 
\0      空字符("") 
\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 后向引用、或一个八进制转义符。例如,‘n‘ 匹配字符 "n"。‘\n‘ 匹配一个换行符。序列 ‘\\‘ 匹配 "\" 而 "\(" 则匹配 "("。
^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 ‘\n‘ 或 ‘\r‘ 之后的位置。
字符类 ---〉简单类,反向类,范围类,组合类,预定义类 
下面是正则表达式中的预定义类 
代码  等同于                  匹配 
.     IE下[^\n],其它[^\n\r]  匹配除换行符之外的任何一个字符 
\d    [0-9]                   匹配数字 
\D    [^0-9]                  匹配非数字字符 
\s    [ \n\r\t\f\x0B]         匹配一个空白字符 
\S    [^ \n\r\t\f\x0B]        匹配一个非空白字符 
\w    [a-zA-Z0-9_]            匹配字母数字和下划线 
\W    [^a-zA-Z0-9_]           匹配除字母数字下划线之外的字符 
量词(下表量词单个出现时皆是贪婪量词) 
代码  描述 
*     匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等价于{0,}。 
+     匹配前面的子表达式一次或多次。例如,‘zo+‘ 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。 
?     匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。 
{n}   n 是一个非负整数。匹配确定的 n 次。例如,‘o{2}‘ 不能匹配 "Bob" 中的 ‘o‘,但是能匹配 "food" 中的两个 o。 
{n,}  n 是一个非负整数。至少匹配n 次。例如,‘o{2,}‘ 不能匹配 "Bob" 中的 ‘o‘,但能匹配 "foooood" 中的所有 o。‘o{1,}‘ 等价于 ‘o+‘。‘o{0,}‘ 则等价于 ‘o*‘。 
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。刘, "o{1,3}" 将匹配 "fooooood" 中的前三个 o。‘o{0,1}‘ 等价于 ‘o?‘。请注意在逗号和两个数之间不能有空格。 
贪婪量词与惰性量词 
•用贪婪量词进行匹配时,它首先会将整会字符串当成一个匹配,如果匹配的话就退出,如果不匹配,就截去最后一个字符进行匹配,如果不匹配,继续将最后一个字符截去进行匹配,直到有匹配为止。直到现在我们遇到的量词都是贪婪量词 
•用惰性量词进行匹配时,它首先将第一个字符当成一个匹配,如果成功则退出,如果失败,则测试前两个字符,依些增加,直到遇到合适的匹配为止 
惰性量词仅仅在贪婪量词后面加个"?"而已,如"a+"是贪婪匹配的,"a+?"则是惰性的 
多行模式 
分组与非捕获性分组 
候选(也就是所说的“或”) 
当包含分组的正则表达式进行过test,match,search这些方法之后,每个分组都被放在一个特殊的地方以备将来使用,这些存储是分组中的特殊值,我们称之为反向引用 
使用反向引用可以要求字符串中某几个位置上的字符必须相同.另外,在replace这类方法中可用特殊字符序列来表示反向引用 
其它——〉正向前瞻,用来捕获出现在特定字符之前的字符,只有当字符后面跟着某个特定字符才去捕获它。与正向前瞻对应的有负向前瞻,它用匹配只有当字符后面不跟着某个特定字符时才去匹配它。在执行前瞻和负向前瞻之类的运算时,正则表达式引擎会留意字符串后面的部分,然而却不移动index 
构建一个验证电子邮箱地址有效性的正则表达式。电子邮箱地址有效性要求(我们姑且这样定义):用户名只能包含字母数字以及下划线,最少一位,最多25位,用户名后面紧跟@,后面是域名,域名名称要求只能包含字母数字和减号(-),并且不能以减号开头或结尾,然后后面是域名后缀(可以有多个),域名后缀必须是点号连上2-4位英文字母 
转载自:http://www.cnblogs.com/aaronjs/archive/2012/06/30/2570970.html
标签:
原文地址:http://www.cnblogs.com/geilishu/p/5000089.html