xiahanss 2013-03-12
一、创建正则表达式
re-pattern函数:
函数(re-pattern)接受一个字符串参数,返回一个正则表达式样式(java.util.regex.Pattern类的实例)。这个样式能用于正则表达式匹配
user=> (re-pattern "\\d+") #"\d+"
也可以使用读取宏来直接用文本的方式输入正则表达式:在字符串前使用#符号。和用re-pattern函数生成的一样,例如,下面的表示方式和前面的例子是相同的:
user=> #"\\d+" #"\d+"
re-matcher函数:
re-matcher函数接受两个参数:一个正则表达式样式和一个字符串。返回一个有状态的"matcher"对象,提供给其它正则函数而不是直接提供样式。Matchers是java.util.regex.Matcher.类的实例。
user=> (re-matcher #"\d+" "abc12345def") #<Matcher java.util.regex.Matcher[pattern=\d+ region=0,11 lastmatch=]> user=> (def matcher-num (re-matcher #"\d+" "abc12345def")) #'user/matcher-num user=> (re-find matcher-num) "12345"
这里的def函数用于定义变量,后面会描述
二、使用正则表达式:
re-find函数:
re-find接受一个样式与一个字符串或者一个matcher。每次调用,返回matcher中下一个符合正则匹配的结果。
user=> (re-find #"\d+" "abc123") "123"
re-matches函数:
re-matches接受两个参数:一个正则表达式样式和一个字符串。返回任何和正则表达式样式匹配的字符串,如果没有匹配则返回nil。例如下面的代码:
user=> (re-matches #"hello" "hello,world") nil user=> (re-matches #"hello.*" "hello,world") "hello,world" user=> (re-matches #"hello,(.*)" "hello,world") ["hello,world" "world"]
re-seq函数:
re-seq接受一个样式与一个字符串。它返回一个使用永久匹配(matcher)的lazysequence(懒序列)(这个sequence在一个连续的样式匹配的字符串中)
user=> (re-seq #"\d" "clojure 1.1.0") ("1" "1" "0") user=> (re-seq #"\w+" "mary had a little lamb") ("mary" "had" "a" "little" "lamb")
re-groups函数:
接受一个matcher,返回从接近的发现与匹配的集合。如果没有嵌套集合,则返回一个完全匹配的字符串。如果有嵌套集合,则返回vector集合,第一个元素是完全匹配的(非嵌套)
user=> (def phone-number "672-345-456-3212") #'user/phone-number user=> (def matcher (re-matcher #"((\d+)-(\d+))" phone-number)) #'user/matcher user=> (re-find matcher) ["672-345" "672-345" "672" "345"] user=> (re-groups matcher) ["672-345" "672-345" "672" "345"]