程序员的AIR 2015-06-04
也许一直在一线的程序员们对这个标题呲之以鼻,特别是全栈工程师们。这篇文章主要是抛砖引玉,预测一下以后的技术方向。另外,文中可能也有表述不对的地方,欢迎指正。如果只想看未来的部分,可从中间开始看。
计算机产生以后,这个行业的发展日新月异,不停地产生新的技术来解决新的问题。这里不把计算机语言的更新换代看作技术的变化。计算机语言应该算做是规范,除了解决新问题外,有些语言的产生和流行也是有历史原因的。
从计算机刚刚产生时,解决的是计算问题。其将很多人花费好几个月的计算在几天之内完成。这一代的工程师们更多的在解决硬件问题。程序员(或者叫做软件工程师)是将问题翻译成计算机语言(其实程序员做的一直是这个),也就是卡片纸。程序员在当时的计算机系统中,应该不算一个核心角色。因为大部分问题和挑战在硬件系统、算法上。
随着计算机成本的降低,世界大战后战争需求减少,开始大力发展经济。硬件解决方案的成本问题开始凸显,于是开始产生了通用计算机。通用计算机逐渐统一了硬件标准,把更多的灵活性放到了软件上。基本模式就是:巨无霸的硬件厂商们负责提供计算资源,程序员们负责解决问题。这时候,程序员的春天来了。在此同时,软件开发的理论也在不停地发展。随着各种语言的层出不穷,基本上大家认可了指令、数据,程序基本流程、库函数等各种计算机的概念。
再往后,随着计算机的应用的范围越来越大,挑战也越来越多了。由于系统复杂性的增加,很多系统已经不是几位,甚至是数十位程序员就能完成的了。(当今的操作系统、搜索引擎都是数千甚至数万人几十年辛苦工作的结晶)。新的挑战也来了——软件工程,如何更高效、可预期地开发、维护复杂系统。这里的挑战包括:如何将传统的项目管理经验放到软件项目管理中来;如何让程序员们采用各种标准化的编程风格;如何构建合适的团队结构等。这时候,程序员的重要性就凸显出来了,产业链中的地位也变高了。纵观历史,数万人以前集中在一起都是进行体力劳动或者战争。人类从来没有这么大规模的将智力集中在一起解决问题。
同时,解决的问题规模和类型也进一步增加。其中,人机交互是一个热门且有挑战的方向。输入上,除了从打字机来的键盘外,又发明了鼠标,显示,扬声器等各种人机交互的设备。程序员们除了要实现底层的驱动代码,在人机交互层面也要实现方便易用的交互体验。这时候除了算法和设计等挑战,还有人体工学、文化上的挑战。比如,中国人花了很多年,也没制造出广泛应用的中文键盘和流行的输入方式,最后还是英文键盘+拼音成了最主流的输入方式。这是汉字本身的特点造成的,而广大程序员花了大量的人力物力才认识到了这些文化上的规律。另外,网络也是另一个热门。程序员们在底层将计算机连接在了一起,并依靠强大的网络能力实现了人们的远程沟通。
到了近几年,又出现了大数据、物联网等热门的方向。程序员们从底层实现大数据的批处理、传输、存储,解决了性能、可靠性等各种问题。由于大数据的精确性和完备性通常达不到100%,所以大数据也让很多程序员开始去解决不确定的问题。
别人家的程序员们一直在解决不同领域、类型的问题。程序员的角色开始了分化(同时也有很多角色从程序员中分化出来了),从开发、测试,到架构设计、体验优化、前端开发、后端开发、驱动开发、数据库开发、IT等等数不胜数。纵观不太长的程序员职业历史,这些角色也在不停的产生和消失中。这代表着一代一代的程序员要么不停的学习,要么从这个行业中离开(也没什么不好的,好多富翁都是程序员变的)。从历史来看,程序员们解决的问题,使用的组件和思维模式都在不停地变化。但也有一些不变的东西,比如程序基本流程、设计模式、软件工程。所以很多程序员在不停的学习新东西,从而能够解决新问题。
那么,现在正在、未来会发生什么变化呢?这里只想讨论一个:人机交互的革命,包括人机交互方式,和人机交互层次两方面的革命。(说人话!)好吧,就是Kinect, HoloLens、Cortana带来的新情况。这类新产品集中在一起,会对现有的人机交互产生颠覆性的革命。一句话概括:未来人们应该花更少的时间来学习如何使用科技,程序员们要花更多时间让科技来适应人,而不是人去适应科技。比如,单轮摩托车不需要学习怎么在一个轮子上保持平衡,四轴飞行器不需要学习怎么转弯、稳定,这都是很好的例子。
一:人机交互方式。人是生活在三维空间里的,程序员们也在不停地在各种输入输出方式模拟三维空间。首先,显示屏是一个二维的输出,由此鼠标和各种触摸方式也设计成了二维的。这里的二维性除了它们是平面输入输出外,它还真的只是个物理的平面……显示器放在哪里就在哪里,触摸要在显示器上完成,鼠标也需要在一个平面上完成移动。键盘呢?可以说其维度都没到一维。
什么是未来的输入设备呢?它包括全息输入输出设备和解放双手的输入方式。
对程序员的挑战就来了:
二:人机交互层次。当前的人机交互方式上,虽然很多产品号称体验非常好,仍然需要人去适应设备。不仅是输入输出的方式,还是思维的方式,当前的人机交互的体验都有很大的提高空间。
例如,想出去旅游时,要先研究到底去哪里,要么上网,要么听人说,或者去旅行社直接预定。去旅行社当然最省事,但听不到第一手的体验,成本也会比较高。如果要自己研究,选地方,确定日期,买机票、酒店,找攻略,过程中要用到很多次搜索引擎,各种预订网站,发邮件等。从开始想到基本确定至少需要好几天,中间也得好几个小时使用各种工具。而富豪们呢?也许只花5分钟就完成了整个过程:告诉助手:想出去玩。助手可能就问问想去什么样的地方(也许不是某个特定的地方)?玩几天?大概什么时候去?然后基本确定后再汇报一下安排就可以了。这两个过程之间的核心区别就在于交互的层次。普通人是依靠计算机进行任务层次的交互,而富豪是意图层次的交互。这就是交互层次的不同对效率的影响。
Cortana这样的语音助手除了解放了双手,它也是一个非常自然的输入方式。这让程序员和科学家们开始更多的研究人们语言后面的意图,从而提高计算机和人的交互层次。
Project Oxford和Azure Machine Learning这样的开放的人工智能组件真正把多年实验室里的玩具带给了全世界。这就像当年Siri的发布一样,虽然它不是最好的,但没有它,就不会有google now和Cortana的迅速推出。好吧,又来一次:虽然Project Oxford只是个雏形,但是Project Oxford的推出给业界定义了人工智能组件更高层的接口标准,降低了人工智能的学习、应用门槛。特别是其中的语言模型。除了人工智能组件的开放,可以预见由各大公司基于大数据的各种数据模型也会很快共享。基于它们,人工智能的应用很快就会遍地开花,所有程序员都能创造出更智能的应用,从而每个人都可以有自己的个人助手。如果不能脑补个人助手的价值,请观看电影《她》(《Her》),看看人工智能是怎样帮忙处理电话和邮件的。
另一方面,在这一轮人工智能的热潮下,硬件公司们也开始制造采用人工智能算法的处理器,这也代表着新一代的编程语言和理念的开始流行了。