WingC 2009-07-08
Scala简介
“Scala是一门现代的多范式编程语言,志在以简练、优雅及类型安全的方式来表达常用编程模式。它平滑地集成了面向对象和函数语言的特性。”
Scala意在伸缩性,语言的伸缩性受许多因素影响,范围从语法细节到控件的抽象构造。如果我们一定要说出Scala中有助伸缩性的一个方面,我们会把面向对象和函数式编程的组合拣出来(呵呵,不厚道了一把,这的确是两个方面,但是纠缠在了一起)。
51CTO编辑推荐:Scala编程语言专题
Scala在把面向对象和函数式编程熔合成一套语言的设计方面比其他众所周知的语言都走得更远。比方说,其他语言或许把对象和方法作为两个不同的概念,但在Scala里,函数值就是对象。函数类型是能够被子类继承的类。这看上去似乎不外乎学术上的美感,但它从深层次上影响了可伸展性。实际上之前看到的行动类这个概念如果没有这种函数和对象的联合将无法实现。本节将浏览Scala融合面向对象和函数概念的方法。
Scala是面向对象的
面向对象编程已经无与伦比地成功了。它开始于(20世纪)60年代中期的Simula和70年代的Smalltalk,现在支持它的语言比不支持的更多。某些领域已经被对象完全接管了。然而并没有面向对象意味着什么的明确定义,很明显对象的某些东西是程序员说了算的。
原则上,面向对象编程的动机非常简单:除了最琐碎的程序之外的绝大多数都需要某些结构。做的这点最直接的办法就是把数据和操作放进某种形式上的容器。面向对象编程里最伟大的思想是让这些容器完全地通用化,这样它们就能像保存数据那样保存操作,并且它们是自己的值,可以存储到其他容器里,或作为参数传递给操作。这样的容器就被叫做对象。Alan Kay,Smalltalk的发明者,评论说,用这样的方法最简单的对象可以与完整的计算机有同样的架构原则:用形式化的接口绑定数据和操作。 于是对象在语言伸缩性方面起了很大作用:构造小程序和大程序都可以应用同样的技术。
尽管很长一段时间面向对象编程已经成为主流,然而鲜有语言能跟从Smalltalk推动这种构造原则去转化为逻辑结论。举例来说,许多语言容忍值不是对象,如Java里面的原始值。或者它们允许静态字段和方法不隶属于任何对象。这些对纯理想化面向对象编程的背叛最初看起来完全无害,但它们有一个讨厌的趋势,把事情复杂化并限制了可伸缩性。
相反,Scala是纯粹格式的面向对象语言:每个值都是对象,每个操作都是方法调用。例如,如果你用Scala描述1 + 2,你实际上调用了定义在Int类里面一个名为 + 的方法。你可以用一个像操作符一样的名字定义方法,这样你的API的使用者就能按照操作符的标记使用了。这就是前例里面显示的Scala的行动类API定义者如何让你能够使用类似requester!sum这样的表达式:“!”是行动类的方法。
如果说到对象组合,Scala比多数别的语言更胜一筹。Scala的特质:trait就是其中一例。所谓特质就像Java的接口,但它们同样可以有方法实现乃至字段。对象是由混入组成: mixin composition构造的,这种方式使用类的定义并加入一定数量的特质定义构成。用这种方式,不同方面的类可以被包装入不同的特质。这看上去有点儿像多重继承,但在细节上是有差异的。与类不同,特质可以可以把一些新的功能加入到还未定义的超类中。这使得特质比类更具有“可加性”。尤其特别的是,它避免了多重继承里面,当同样的类被通过若干不同渠道继承时发生的,经典的“菱形继承”问题。
Scala是函数式的
除了作为一种纯面向对象的语言,Scala还是一种“全须全尾儿”的函数式语言。函数式语言的思想早于(电子)计算机。其基础建立在Alonzo Church于1930年代发展的λ算子(lambda calculus)上。第一个函数式编程语言是50年代后期的Lisp。其他流行的函数式语言有Scheme,SML,Erlang,Haskell,OCaml和F#。很长一段时间,函数式语言处于边缘地带,在学府里流行,但没有广泛应用于业界。然而,最近几年对函数式语言和技术的热情持续高涨。
函数式编程有两种理念做指导,第一种理念是函数是第一类值。在函数式语言中,函数也是值,与,比如说,整数或字串,在同一个地位。你可以把函数当作参数传递给其他函数,当作结果从函数中返回或保存在变量里。你也可以在函数里定义其他函数,就好像在函数里定义整数一样。还可以定义匿名函数,就好像你或许会写像42这样的整数文本那样方便地用函数文本抛洒在代码中。
把函数作为第一类值为操作符上的抽象和创建新控制结构提供了便利的方法。这种函数的泛化提供了很强的表现力,常能产生非常易读和清晰的程序。而且常在伸展性上扮演重要的角色。例如,之前在行动类例子里演示的receive构造就是一个把函数当作参数调用的方法。receive构造里面的代码是个未被执行的传入receive方法的函数。
相反,在多数传统语言中,函数不是值。确实有函数值的语言则又常常把它们贬为二类地位。举例来说,C和C++的函数指针就不能拥有与非函数指针在语言中同等的地位:函数指针仅能指向全局函数,它们不允许你定义指向环境中什么值的第一类嵌套函数,也不能定义匿名函数文本。
函数式编程的第二个主要理念是程序的操作符应该把输入值映射到输出值而不是就地修改数据。要看到其中的差别,可以考虑一下Ruby和Java对字串的实现。在Ruby里,字串是一个字符数组。字串中的字符可以被独立的改变。举例来说你可以在同一个字串对象里把分号改成句号。而另一方面,在Java和Scala里,字串是一种数学意义上的字符序列。使用表达式如s.replace(';', '.')在字串里替换字符会产生一个新的,不同于原字串s的对象。用另一种表达方式来说就是在Java里字串是不可变的(immutable)而在Ruby里是可变的。因此单看字串来说,Java是函数式语言,而Ruby不是。不可变数据结构是函数式语言的一块基石。Scala库在Java API之上定义了更多的不可变数据类型。例如,Scala有不可变的列表,元组,映射表和集。
另一种说明函数式编程第二种理念的方式是方法不应有任何副作用:side effect。它们唯一的与所在环境交流的方式应该是获得参数和返回结果。举例来说,Java的String类的replace方法符合这个描述。它带一个字串和两个字符并产生一个所有一个字符都被另一个替代掉的新字串。调用replace不会有其他的结果。类似于replace这样的方法被称为指称透明:referentially transparent,就是说方法调用对任何给定的输入可以用它的结果替代而不会影响程序的语义。
函数式语言鼓励不可变数据结构和指称透明的方法。有些函数式语言甚至需要它们。Scala给你选择。如果你需要,你也可以写成命令:imperative形式,用可变数据和有副作用的方法调用编程。但是Scala通常可以在你需要的时候轻松避免它们,因为有好的函数式编程方式做替代。