为什么我如此迷恋Lisp语言?

goodluckforlove 2011-10-14

本文是从 Why I love Lisp 这篇文章翻译而来。

这篇文章是我在Simplificator——我工作的地方——的一次座谈内容的摘录,座谈的题目叫做“为什么我喜欢Smalltalk语言和Lisp语言”。在此之前,我曾发布过一篇叫做“ 为什么我喜欢Smalltalk?”的文章。

为什么我如此迷恋Lisp语言?

大漠黄沙 by Guilherme Jófili

Lisp是一种很老的语言。非常的老。Lisp有很多变种,但如今已没有一种语言叫Lisp的了。事实上,有多少Lisp程序员,就有多少种Lisp。这是因为,只有当你独自一人深入荒漠,用树枝在黄沙上为自己喜欢的Lisp方言写解释器时,你才成为一名真正的Lisp程序员。

目前主要有两种Lisp语言分支:Common Lisp 和 Scheme,每一种都有无数种的语言实现。各种Common Lisp实现都大同小异,而各种Scheme实现表现各异,有些看起来非常的不同,但它们的基本规则都相同。这两种语言都非常有趣,但我却没有在实际工作中用过其中的任何一种。这两种语言中分别在不同的方面让我苦恼,在所有的Lisp方言中,我最喜欢的是Clojure语言。我不想在这个问题上做更多的讨论,这是个人喜好,说起来很麻烦。

Clojure,就像其它种的Lisp语言一样,有一个REPL(Read Eval Print Loop)环境,你可以在里面写代码,而且能马上得到运行结果。例如:

5  



;=> 5  



 


"Hello world"  



;=> "Hello world" 

通常,你会看到一个提示符,就像user>,但在本文中,我使用的是更实用的显示风格。这篇文章中的任何REPL代码你都可以直接拷贝到Try Clojure运行。

我们可以像这样调用一个函数:

(println "Hello World")  


; Hello World  



;=> nil 

程序打印出“Hello World”,并返回nil。我知道,这里的括弧看起来好像放错了地方,但这是有原因的,你会发现,他跟Java风格的代码没有多少不同:

println("Hello World") 

这种Clojure在执行任何操作时都要用到括弧:

(+ 1 2)  



;=> 3 

在Clojure中,我们同样能使用向量(vector):

[1 2 3 4]  



;=> [1 2 3 4] 

还有符号(symbol):

'symbol  



;=> symbol 

这里要用引号('),因为Symbol跟变量一样,如果不用引号前缀,Clojure会把它变成它的值。list数据类型也一样:

'(li st)  



;=> (li st) 

以及嵌套的list:

'(l (i s) t)  



;=> (l (i s) t) 

定义变量和使用变量的方法像这样:

(def hello-world "Hello world")  



;=> #'user/hello-world  



 


hello-world  



;=> "Hello world" 

我的讲解会很快,很多细节问题都会忽略掉,有些我讲的东西可能完全是错误的。请原谅,我尽力做到最好。

在Clojure中,创建函数的方法是这样:

(fn [n] (* n 2))  



;=> #<user$eval1$fn__2 user$eval1$fn__2@175bc6c8> 

这显示的又长又难看的东西是被编译后的函数被打印出的样子。不要担心,你不会经常看到它们。这是个函数,使用fn操作符创建,有一个参数n。这个参数和2相乘,并当作结果返回。Clojure和其它所有的Lisp语言一样,函数的最后一个表达式产生的值会被当作返回值返回。

如果你查看一个函数如何被调用:

(println "Hello World") 

你会发现它的形式是,括弧,函数,参数,反括弧。或者用另一种方式描述,这是一个列表序列,序列的第一位是操作符,其余的都是参数。

让我们来调用这个函数:

((fn [n] (* n 2)) 10)  



;=> 20 

我在这里所做的是定义了一个匿名函数,并立即应用它。让我们来给这个函数起个名字:

(def twice (fn [n] (* n 2)))  



;=> #'user/twice 

现在我们通过这个名字来使用它:

(twice 32)  



;=> 64 

正像你看到的,函数就像其它数据一样被存放到了变量里。因为有些操作会反复使用,我们可以使用简化写法:

(defn twice [n] (* 2 n))  



;=> #'user/twice  



 


(twice 32)  



;=> 64 

我们使用if来给这个函数设定一个最大值:

(defn twice [n] (if (> n 50) 100 (* n 2)))) 

if操作符有三个参数:断言,当断言是true时将要执行的语句,当断言是 false 时将要执行的语句。也许写成这样更容易理解:

(defn twice [n]  



  (if (> n 50)  



      100  


      (* n 2))) 

非常基础的东西。让我们来看一下更有趣的东西。

假设说你想把Lisp语句反着写。把操作符放到最后,像这样:

(4 5 +) 

我们且把这种语言叫做Psil(反着写的Lisp...我很聪明吧)。很显然,如果你试图执行这条语句,它会报错:

(4 5 +)  



;=> java.lang.ClassCastException: java.lang.Integer cannot be cast to clojure.lang.IFn (NO_SOURCE_FILE:0) 

Clojure会告诉你4不是一个函数(函数是必须是clojure.lang.IFn接口的实现)。

我们可以写一个简单的函数把Psil转变成Lisp:

(defn psil [exp]  


(reverse exp)) 

当我执行它时出现了问题:

(psil (4 5 +))  



;=> java.lang.ClassCastException: java.lang.Integer cannot be cast to clojure.lang.IFn (NO_SOURCE_FILE:0) 

很明显,我弄错了一个地方,因为在psil被调用之前,Clojure会先去执行它的参数,也就是(4 5 +),于是报错了。我们可以显式的把这个参数转化成list,像这样:

(psil '(4 5 +))  



;=> (+ 5 4) 

这回它就没有被执行,但却反转了。要想运行它并不困难:

(eval (psil '(4 5 +)))  



;=> 9 

你开始发现Lisp的强大之处了。事实上,Lisp代码就是一堆层层嵌套的列表序列,你可以很容易从这些序列数据中产生可以运行的程序。

如果你还没明白,你可以在你常用的语言中试一下。在数组里放入2个数和一个加号,通过数组来执行这个运算。你最终得到的很可能是一个被连接的字符串,或是其它怪异的结果。

这种编程方式在Lisp是如此的非常的常见,于是Lisp就提供了叫做宏(macro)的可重用的东西来抽象出这种功能。宏是一种函数,它接受未执行的参数,而返回的结果是可执行的Lisp代码。

让我们把psil传化成宏:

(defmacro psil [exp]  


(reverse exp)) 

唯一不同之处是我们现在使用defmacro来替换defn。这是一个非常大的改动:

(psil (4 5 +))  



;=> 9 

请注意,虽然参数并不是一个有效的Clojure参数,但程序并没有报错。这是因为参数并没有被执行,只有当psil处理它时才被执行。psil把它的参数按数据看待。如果你听说过有人说Lisp里代码就是数据,这就是我们现在在讨论的东西了。数据可以被编辑,产生出其它的程序。这种特征使你可以在Lisp语言上创建出任何你需要的新型语法语言。

在Clojure里有一种操作符叫做macroexpand,它可以使一个宏跳过可执行部分,这样你就能看到是什么样的代码将会被执行:

(macroexpand '(psil (4 5 +)))  



;=> (+ 5 4) 

你可以把宏看作一个在编译期运行的函数。事实上,在Lisp里,编译期和运行期是杂混在一起的,你的程序可以在这两种状态下来回切换。我们可以让psil宏变的罗嗦些,让我们看看代码是如何运行的,但首先,我要先告诉你do这个东西。

do是一个很简单的操作符,它接受一批语句,依次运行它们,但这些语句是被整体当作一个表达式,例如:

(do (println "Hello") (println "world"))  


; Hello  


; world  



;=> nil 

通过使用do,我们可以使宏返回多个表达式,我们能看到更多的东西:

(defmacro psil [exp]  


  (println "compile time")  


  `(do (println "run time")  


       ~(reverse exp))) 

新宏会打印出“compile time”,并且返回一个do代码块,这个代码块打印出“run time”,并且反着运行一个表达式。这个反引号`的作用很像引号',但它的独特之处是你可以使用~符号在其内部解除引号。如果你听不明白,不要担心,让我们来运行它一下:

(psil (4 5 +))  


; compile time  


; run time  



;=> 9 

如预期的结果,编译期发生在运行期之前。如果我们使用macroexpand,或得到更清晰的信息:

(macroexpand '(psil (4 5 +)))  


; compile time  



;=> (do (clojure.core/println "run time") (+ 5 4)) 

可以看出,编译阶段已经发生,得到的是一个将要打印出“run time”的语句,然后会执行(+ 5 4)。println也被扩展成了它的完整形式,clojure.core/println,不过你可以忽略这个。然后代码在运行期被执行。

这个宏的输出本质上是:

(do (println "run time")  


    (+ 5 4)) 

而在宏里,它需要被写成这样:

`(do (println "run time")  


     ~(reverse exp)) 

反引号实际上是产生了一种模板形式的代码,而波浪号让其中的某些部分被执行((reverse exp)),而其余部分被保留。

对于宏,其实还有更令人惊奇的东西,但现在,它已经很能变戏法了。

这种技术的力量还没有被完全展现出来。按着" 为什么我喜欢Smalltalk?"的思路,我们假设Clojure里没有if语法,只有cond语法。也许在这里,这并不是一个太好的例子,但这个例子很简单。

cond 功能跟其它语言里的switch 或 case 很相似:

(cond (= x 0) "It's zero"  


      (= x 1) "It's one"  


      :else "It's something else") 

使用 cond,我们可以直接创建出my-if函数:

(defn my-if [predicate if-true if-false]  


  (cond predicate if-true  


        :else if-false)) 

初看起来似乎好使:

(my-if (= 0 0) "equals" "not-equals")  



;=> "equals"  



(my-if (= 0 1) "equals" "not-equals")  



;=> "not-equals" 

但有一个问题。你能发现它吗?my-if执行了它所有的参数,所以,如果我们像这样做,它就不能产生预期的结果了:

(my-if (= 0 0) (println "equals") (println "not-equals"))  


; equals  


; not-equals  



;=> nil 

把my-if转变成宏:

(defmacro my-if [predicate if-true if-false]  


  `(cond ~predicate ~if-true  


         :else ~if-false)) 

问题解决了:

(my-if (= 0 0) (println "equals") (println "not-equals"))  


; equals  



;=> nil 

这只是对宏的强大功能的窥豹一斑。一个非常有趣的案例是,当面向对象编程被发明出来后(Lisp的出现先于这概念),Lisp程序员想使用这种技术。

相关推荐