javascript进阶知识4-正则表达式

如题所述

第1个回答  2024-09-04

关于正则表达式,我收藏的一篇帖子讲得很好、很全,但是我没有学得很好,哈哈。

这里附上链接:https://blog.csdn.net/h610443955/article/details/81079439

(本文有部分直接借鉴的那篇文章的例子和文字)

1.正则表达式的创建

字面量:

letreg=/\d/g

对象形式:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g

以上两种创建的表达式的等价的。用对象形式创建时,接收两个参数,第一个是字符串,第二个是修饰符。同时对象形式创建正则时,需要转义时,需要使用两个\。建议:多用字面量形式,少用对象形式。

2.原子表[]与选择符|与元字符(1)|选择符

与逻辑运算中的“或”差不多。

letstr='23a34';console.log(str.match(/a|33/))//['a']表示查找a或者33console.log(str.match(/ab|33/))//null表示查找ab或者33

(2)原子表

[]就是纵向模糊匹配,纵向模糊指的是,一个正则匹配的字符串,具体到某一位字符时,它可以不是某个确定的字符,可以有多种可能。

其实现的方式是使用字符组。譬如[abc],表示该字符是可以字符“a”、“b”、“c”中的任何一个。

比如/a[123]b/可以匹配如下三种字符串:"a1b"、"a2b"、"a3b"。测试如下:

varregex=/a[123]b/g;varstring="a0ba1ba2ba3ba4b";console.log(string.match(regex));//=>["a1b","a2b","a3b"]

以上例子可以看出/[abc]/===/a|b|c/,他们都是惰性的,即匹配到第一个后就停止匹配了。

排除字符组

纵向模糊匹配,还有一种情形就是,某位字符可以是任何东西,但就不能是"a"、"b"、"c"。

此时就是排除字符组(反义字符组)的概念。例如[^abc],表示是一个除"a"、"b"、"c"之外的任意一个字符。字符组的第一位放^(脱字符),表示求反的概念。

当然,也有相应的范围表示法。

(3)元字符

是具有特殊含义的字符。

元字符描述\d[0-9]查找数字。\D[^0-9]查找非数字字符。\w[a-zA-Z0-9_]查找字母数字下划线。\W[^a-zA-Z0-9_]查找非字母数字下划线。\s[\t\v\n\r\f]表示空白符,包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。\S[^\t\v\n\r\f]非空白符。.通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。

使用[\s\S]和[\d\D]、[\w\W]可以匹配所有字符.

3.量词横向模糊匹配

横向模糊指的是,一个正则可匹配的字符串的长度不是固定的,可以是多种情况的。

其实现的方式是使用量词。譬如{m,n},表示连续出现最少m次,最多n次。

比如/ab{2,5}c/表示匹配这样一个字符串:第一个字符是“a”,接下来是2到5个字符“b”,最后是字符“c”。测试如下:

varregex=/ab{2,5}c/g;varstring="abcabbcabbbcabbbbcabbbbbcabbbbbbc";console.log(string.match(regex));//=>["abbc","abbbc","abbbbc","abbbbbc"]

量词描述{m}等价于{m,m},表示出现m次。{m,}表示至少出现m次。{m,n}表示至少出现m次,最多出现n次。?等价于{0,1},表示出现或者不出现。+等价于{1,},表示出现至少一次。*等价于{0,},表示出现任意次,有可能不出现。3.贪婪匹配和惰性匹配varregex=/\d{2,5}/g;varstring="123123412345123456";console.log(string.match(regex));//["123","1234","12345","12345"]

其中正则/\d{2,5}/,表示数字连续出现2到5次。会匹配2位、3位、4位、5位连续数字。

但是其是贪婪的,它会尽可能多的匹配。你能给我6个,我就要5个。你能给我3个,我就要3个。反正只要在能力范围内,越多越好。

我们知道有时贪婪不是一件好事。而惰性匹配,就是尽可能少的匹配:

lethd='hdddd';console.log(hd.match(/hd+/));//['hdddd']console.log(hd.match(/hd+?/));//['hd']console.log(hd.match(/hd*?/));//['h']console.log(hd.match(/hd{1,3}?/));//['hd']console.log(hd.match(/hd??/));//['h']

其中/hd{1,3}?/表示,虽然1到3次都行,当1个就够的时候,就不在往下尝试了。

通过在量词后面加个问号就能实现惰性匹配,因此所有惰性匹配情形如下:

{m,n}?匹配m个{m,}?匹配m个??匹配0个+?匹配1个*?匹配0个

4.修饰符

g是全局查找

i是不区分大小写

m多行匹配多行匹配,只影响^和$,二者变成行的概念,即行开头和行结尾。

lethd='houdunren'console.log(hd.match(/u/));//['u',index:2,input:'houdunren',groups:undefined]console.log(hd.match(/u/g));//['u,'u']lethd='HelloWorld!'console.log(hd.match(/h/));//nullconsole.log(hd.match(/h/i));//['H',index:0,input:'HelloWorld!',groups:undefined]letstr="abcggab\nabcoab";console.log(str.match(/^abc/g));//['abc']console.log(str.match(/^abc/gm));//结果为:["abc","abc"]console.log(str.match(/ab$/g));//['ab']console.log(str.match(/ab$/gm));//结果为:["ab","ab"]

match返回的一个数组,但是加没加修饰符g返回值是有区别的,没有加g,返回的数组第一个元素是整体匹配结果,然后是各个分组(括号里)匹配的内容,然后是匹配下标,最后是输入的文本。加g后,返回的数组是全是匹配结果。

5.正则表达式位置匹配

正则表达式是匹配模式,要么匹配字符,要么匹配位置。

5-1.什么是位置呢?

位置是相邻字符之间的位置。比如,下图中箭头所指的地方:

5-2.如何匹配位置呢?

在ES5中,共有6个锚字符:

^?$?\b?\B?(?=p)?(?!p)

ES6新增了两个

(?<=)?(?<!)

(1)^和$

^(脱字符)匹配开头,在多行匹配中匹配行开头。

$(美元符号)匹配结尾,在多行匹配中匹配行结尾。

letstr='sdasdf324'console.log(str.match(/^[a-z]+/));//匹配以字母开头的//['sdasdf',index:0,input:'sdasdf324',groups:undefined]console.log(str.match(/\d+$/));//匹配以数字结尾的//['324',index:6,input:'sdasdf324',groups:undefined]

(2)\b与\B

\b是单词边界,具体就是\w和\W之间的位置,也包括\w和^之间的位置,也包括\w和$之间的位置。

\B就是\b的反面的意思,非单词边界。例如在字符串中所有位置中,扣掉\b,剩下的都是\B的。

(3)(?=p)和(?!p)、(?<=)和(?<!)断言

断言相当于if语句(?=)一般是写在后面,表示判断后面是否符合,符合就匹配(表示后面是什么);(?<=)一般写在前面,表示前面是否符合,符合就匹配(表示前面是什么)(?!)一般写在后面,表示判断后面是否符合,不符合就匹配(表示后面不是什么);(?<!)一般写在前面,表示前面是否符合,不符合就匹配(表示前面不是什么)

letusers=`老板电话:12345678910员工电话:98765432101`letreg=/(?<=\d{7})\d{4}/giusers=users.replace(reg,v=>{return'*'.repeat(4)})console.log(users);//老板电话:1234567****员工电话:9876543****

/(?<=\d{7})\d{4}/gi的意思是存在七位数字后面的四位数字

6.原子组分组()

6.1分组

我们知道/a+/匹配连续出现的“a”,而要匹配连续出现的“ab”时,需要使用/(ab)+/。

其中括号是提供分组功能,使量词+作用于“ab”这个整体,测试如下:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g0

6.2分支结构

而在多选分支结构(p1|p2)中,此处括号的作用也是不言而喻的,提供了子表达式的所有可能。

比如,要匹配如下的字符串:

IloveJavaScriptIloveRegularExpression

可以使用正则:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g1

如果去掉正则中的括号,即/^IloveJavaScript|RegularExpression$/,匹配字符串是"IloveJavaScript"和"RegularExpression",当然这不是我们想要的。

6.3.引用分组和反向引用和非捕获分组

这个大家就去看我分享的文档吧,那个写的挺详细的。哈哈

7.exec()和test()方法

前面的match()、search()、replace()都是字符串的方法,但是exec()和test()是正则的方法。

exec比match更强大当正则没有g时,使用match返回的信息比较多。但是有g后,就没有关键的信息index了。

而exec方法就能解决这个问题,它能接着上一次匹配后继续匹配:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g2

其中正则实例lastIndex属性,表示下一次匹配开始的位置。

比如第一次匹配了“2017”,开始下标是0,共4个字符,因此这次匹配结束的位置是3,下一次开始匹配的位置是4。

从上述代码看出,在使用exec时,经常需要配合使用while循环:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g3

修饰符g,对exex和test的影响

而正则实例的两个方法exec、test,当正则是全局匹配时,每一次匹配完成后,都会修改lastIndex。下面让我们以test为例,看看你是否会迷糊:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g4

注意上面代码中的第三次调用test,因为这一次尝试匹配,开始从下标lastIndex即3位置处开始查找,自然就找不到了。

如果没有g,自然都是从字符串第0个字符处开始尝试匹配:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g5

test整体匹配时需要使用^和$

这个相对容易理解,因为test是看目标字符串中是否有子串匹配正则,即有部分匹配即可。

如果,要整体匹配,正则前后需要添加开头和结尾:

letreg=newRegExp('\\d','g');console.log(reg)///\d/g6

8.批量使用正则

对于复杂的字符串,我们可以批量使用正则进行匹配。

letreg=newRegExp('\\d','g');console.log(reg)///\d/g7原文:https://juejin.cn/post/7098337533209575460

logo设计

创造品牌价值

¥500元起

APP开发

量身定制,源码交付

¥2000元起

商标注册

一个好品牌从商标开始

¥1480元起

公司注册

注册公司全程代办

¥0元起

    官方电话官方服务
      官方网站八戒财税知识产权八戒服务商企业需求数字市场
相似回答
大家正在搜