clojure-基本语法-正则表达式

xiahanss 2013-03-12

一、创建正则表达式

re-pattern函数:

函数(re-pattern)接受一个字符串参数,返回一个正则表达式样式(java.util.regex.Pattern类的实例)。这个样式能用于正则表达式匹配

user=> (re-pattern "\\d+")
#"\d+"

也可以使用读取宏来直接用文本的方式输入正则表达式:在字符串前使用#符号。和用re-pattern函数生成的一样,例如,下面的表示方式和前面的例子是相同的:

user=> #"\\d+"
#"\d+"

re-matcher函数:

re-matcher函数接受两个参数:一个正则表达式样式和一个字符串。返回一个有状态的"matcher"对象,提供给其它正则函数而不是直接提供样式。Matchers是java.util.regex.Matcher.类的实例。

user=> (re-matcher #"\d+" "abc12345def")
#<Matcher java.util.regex.Matcher[pattern=\d+ region=0,11 lastmatch=]>
user=> (def matcher-num (re-matcher #"\d+" "abc12345def"))
#'user/matcher-num
user=> (re-find matcher-num)
"12345"

这里的def函数用于定义变量,后面会描述

二、使用正则表达式:

re-find函数:

re-find接受一个样式与一个字符串或者一个matcher。每次调用,返回matcher中下一个符合正则匹配的结果。

user=> (re-find #"\d+" "abc123")
"123"

re-matches函数:

re-matches接受两个参数:一个正则表达式样式和一个字符串。返回任何和正则表达式样式匹配的字符串,如果没有匹配则返回nil。例如下面的代码:

user=> (re-matches #"hello" "hello,world")
nil
user=> (re-matches #"hello.*" "hello,world")
"hello,world"
user=> (re-matches #"hello,(.*)" "hello,world")
["hello,world" "world"]

re-seq函数:

re-seq接受一个样式与一个字符串。它返回一个使用永久匹配(matcher)的lazysequence(懒序列)(这个sequence在一个连续的样式匹配的字符串中)

user=> (re-seq #"\d" "clojure 1.1.0")
("1" "1" "0")
user=> (re-seq #"\w+" "mary had a little lamb")
("mary" "had" "a" "little" "lamb")

re-groups函数:

接受一个matcher,返回从接近的发现与匹配的集合。如果没有嵌套集合,则返回一个完全匹配的字符串。如果有嵌套集合,则返回vector集合,第一个元素是完全匹配的(非嵌套)

user=> (def phone-number "672-345-456-3212")
#'user/phone-number
user=> (def matcher (re-matcher #"((\d+)-(\d+))" phone-number))
#'user/matcher
user=> (re-find matcher)
["672-345" "672-345" "672" "345"]
user=> (re-groups matcher)
["672-345" "672-345" "672" "345"]

相关推荐