re正则表达式

qidu 2020-04-18

二:多个字符匹配规则:返回以列表的形式,同时定义多个规则可使用”|“

1. “abc"匹配abc这个字符串

  re1 = r"abc"

  re.findall(re1, "字符串")

2. {m}:表示匹配一个字符m次,"\d{7}"

3. {m,}:表示匹配一个字符至少m次,"\d{7,}"

4. {m,n},表示一个字符出现m到n次。默认开启贪婪模式。可使用”?"关闭

5.* 表示前一个字符出现0次以上,包括0次。

6. +表示1次以上,包括一次

三:边界。

1.^:匹配字符串开头。^python

2. $:匹配字符串结尾

3.\b, 单词边界(字母,数字,下划线)

4. \B, 匹配非单词边界。

四:匹配分组:(),在匹配的数据中提取数据

1. re = r"aa(\d{3})bb"

res = re.findall(re,"gg123aa123bbhshfaa567bb")

re函数。

findall:查找所有符合规则的字符串。返回列表的形式

search: 查找第一个符合规则的字符串,返回的是匹配对象(span(),字符串所在的位置。)使用group()将找到的数据提取出来,不会往后面继续找。如找不到,返回None

group():,若不传参数,则全部匹配,若传参数,则获取该参数分组里面的内容 (1).(2).....

match(): 从字符串的开头位置进行匹配,找到符合规则的,返回出来的匹配对象

如果开头的位置不符合规范,则不会往后面去找,直接返回None.

替换,sub(par1,par2,par3,(par4)),par1, 需要替换的字符串,par2:替换新字符串,par3:原始字符串, par4:非必填参数(默认替换所有符合规则的字符串),指定最多替换的次数。

相关推荐