编程故事 2019-06-28
正则表达式是用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找和替换操作。目前为止,我们前面所用过的精确(文本)匹配也是一种正则表达式。
preg_
为前缀命名的函数;ereg_
为前缀命名的函数函数名 描述 ----------------------|-------------------------- preg_match() | 进行正则表达式匹配 preg_match_all() | 进行全局正则表达式匹配 preg_replace() | 执行正则表达式的搜索和替换 preg_split() | 用正则表达式分割字符串 preg_grep() | 返回与模式匹配的数组单元 preg_replace_callback | 用回调函数执行正则表达式的搜索和替换
1.定界符 (必须)
通常使用特殊字符组成,常用“/”。
2.原子(必须)
是正则表达式的最基本组成单元,而且在每个模式中最少要包含一个原子。原子是由所有那些未显示指定为元字符的打印和非打印字符组成,具体分为5类。
\' \* \+ \? \.
等。3.元字符
4.模式修正符
示例:
# 匹配一个字符a $pattern = '/a/'; # 匹配字符a,如果有返回1,没有返回0,只能匹配一次。 echo preg_match($pattern, '012344556'); # preg_match也可用于判断 if(preg_match($pattern, "1232423423", $matches)) { echo "匹配到了<hr/>"; # 并把匹配出来的字符以数组的形式赋值给$matches; # 打印结果:`array(1) {[0] => string(1) "a"}`; var_dump($matches); }else { echo "没有匹配"; }
元字符匹配:
# 如果只想匹配 `.`,特殊含义的字符要转义。 $pattern = "/\./" # 匹配非打印字符 $pattern = "/\n/" # 匹配0-9数字 $pattern = "/\d/"; # 匹配除了0-9的数组 $pattern = "/\D/"; # 匹配数字+大小写字母+下划线 $pattern = "/\w/"; # 匹配除了数字、大小写字母、下划线 $pattern = "/\W/"; # 匹配空白符(换行、缩进、空格) $pattern = "/\s/"; # 匹配除了空白符的字符 $pattern = "/\S/"; # `*` 代表匹配前面的原子出现0、1、或多次 $pattern = "so*u"; # `+` 代表匹配前面的原子出现1次、或多次 $pattern = "so+u"; # `?` 匹配前面的一个原子出现0次或者1次 $pattern = "hao?sou"; # 匹配除了换行符的任意字符 $pattern = "/./"; # `|`代表或者 $pattern = "/a|b|c/"; # 匹配前面的一个原子恰巧出现n次; $pattern = "/hao{2}sou/"; # 匹配出现>=2次 $pattern = "/hao{2, }sou/"; # 匹配出现2-5次 $pattern = "/hao{2, 5}sou/"; # `^` 必须以该原子开头 $pattern = "/^aaa/"; # `$` 必须以该原子结尾 $pattern = "/aaa$/"; # 严格模式 # 必须严格只能匹配aaa。 $pattern = "/^aaa$/"; # a | b | c $pattern = "/[abc]/"; # 除了a,b,c $pattern = "/[^abc]/"; # `()`可以看做一个整体,还可以做反向引用 # 比如要匹配协议头为http、https、ftp $pattern = "/(http|https|ftp):\/\//"; # 匹配除了空白符的任意字符 $pattern = "/.*/"; # `.*`贪婪模式 $str = "<b>abc</b><b>abc</b>"; $pattern = "/<b>.*</b>/"; # `.*?`取消贪婪模式 $pattern = "/<b>.*?</b>/"; 或: $pattern = "/<b>.*</b>/U";
模式修正符:
`i`代表ignore,忽略大小写 `m`匹配多行 `.`修正.的换行符 `x`忽略正则表达式里面的空白符 `D`取消$对\n的忽略