clojure-基本语法-正则表达式

一、创建正则表达式

re-pattern函数：

函数(re-pattern)接受一个字符串参数，返回一个正则表达式样式(java.util.regex.Pattern类的实例）。这个样式能用于正则表达式匹配

user=> (re-pattern "\\d+")
#"\d+"

也可以使用读取宏来直接用文本的方式输入正则表达式：在字符串前使用#符号。和用re-pattern函数生成的一样，例如，下面的表示方式和前面的例子是相同的：

user=> #"\\d+"
#"\d+"

re-matcher函数：

re-matcher函数接受两个参数：一个正则表达式样式和一个字符串。返回一个有状态的"matcher"对象，提供给其它正则函数而不是直接提供样式。Matchers是java.util.regex.Matcher.类的实例。

user=> (re-matcher #"\d+" "abc12345def")
#<Matcher java.util.regex.Matcher[pattern=\d+ region=0,11 lastmatch=]>
user=> (def matcher-num (re-matcher #"\d+" "abc12345def"))
#'user/matcher-num
user=> (re-find matcher-num)
"12345"

这里的def函数用于定义变量，后面会描述

二、使用正则表达式：

re-find函数：

re-find接受一个样式与一个字符串或者一个matcher。每次调用，返回matcher中下一个符合正则匹配的结果。

user=> (re-find #"\d+" "abc123")
"123"

re-matches函数：

re-matches接受两个参数：一个正则表达式样式和一个字符串。返回任何和正则表达式样式匹配的字符串，如果没有匹配则返回nil。例如下面的代码：

user=> (re-matches #"hello" "hello,world")
nil
user=> (re-matches #"hello.*" "hello,world")
"hello,world"
user=> (re-matches #"hello,(.*)" "hello,world")
["hello,world" "world"]

re-seq函数：

re-seq接受一个样式与一个字符串。它返回一个使用永久匹配（matcher）的lazysequence(懒序列)（这个sequence在一个连续的样式匹配的字符串中）

user=> (re-seq #"\d" "clojure 1.1.0")
("1" "1" "0")
user=> (re-seq #"\w+" "mary had a little lamb")
("mary" "had" "a" "little" "lamb")

re-groups函数：

接受一个matcher，返回从接近的发现与匹配的集合。如果没有嵌套集合，则返回一个完全匹配的字符串。如果有嵌套集合，则返回vector集合，第一个元素是完全匹配的（非嵌套）

user=> (def phone-number "672-345-456-3212")
#'user/phone-number
user=> (def matcher (re-matcher #"((\d+)-(\d+))" phone-number))
#'user/matcher
user=> (re-find matcher)
["672-345" "672-345" "672" "345"]
user=> (re-groups matcher)
["672-345" "672-345" "672" "345"]

clojure-基本语法-正则表达式

相关推荐