DreamRunning 2019-11-19
Node是由Ryan Dahl创造出来的,Ryan Dahl是一名资深的C/C++程序员,在创造出Node之前,他的主要工作都是围绕高性能web服务器来展开的,他找到了设计高性能web服务器的几个要点:事件驱动、非阻塞I/O,基于对已有的几种语言的对比和考量,Ryan Dahl选择了JavaScript作为Node的实现语言。
1.异步I/O
在Node中,绝大多数的操作都以异步的方式进行调用,从文件读取到网络请求,均是如此,异步I/O意味着每个调用之间无须等待之前的I/O调用结束,在编程模型上可以提升效率,如果存在两个文件读取任务,最终的耗时只取决于最慢的那个文件读取耗时,对于同步I/O而言,他的耗时是两个任务之和。
2.事件与回调
在Node中事件得到了广泛的应用,如创建一个服务器,我们会为器其绑定request对象,对于请求对象绑定data和end事件,同时在前端我们通常也是为Ajax请求绑定success事件、error事件等。同样,在Node中回调也是无处不在的,事件的处理基本都是依赖回调来实现的,在JavaScript中,可以将函数作为对象传递给方法作为实参进行调用。
3.单线程
Node保持了JavaScript在浏览器中单线程的特点,而且在Node中,JavaScript与其余线程是无法共享任何状态的。JavaScript采用单线程的原因和他最早的用途有关,最早在Web浏览器中,JavaScript主要做的是响应用户DOM操作以及做表单校验,这些功能使用单线程来处理完全够了,而且对于DOM操作来说,使用多线程的话还将造成线程安全问题,同时多线程还将给浏览器带来更大的内存消耗并降低CPU的使用率。
单就单线程本身来说,存在如下几个弱点:
1、无法利用多核CPU
2、错误会引起整个应用退出,应用的健壮性需要考虑
3、大量计算占用CPU将使阻塞程序的运行
严格来说,Node并非真正的单线程架构,Node自身还有一定的I/O线程存在,这些I/O线程由底层libuv处理,这就意味着Node在访问系统I/O时还是多线程的,对于文件读取、SQL查询、网路请求这些具体操作,Node还是使用多线程来进行处理从而保证Node的处理效率。
为了应对单线程存在的CPU利用率问题,Node采用了多进程的架构,也就是著名的Master-Worker模式,又称主从模式,如下图所示,这种典型的用于并行处理业务的分布式架构具有较好的伸缩性和稳定性。Node通过fork()复制的进程都是一个个独立的进程,这个进程中有着独立的V8实例,每个独立进程需要至少30毫秒的启动时间和至少10MB的内存,虽然fork()进程是有一定开销的,但是可以提高多核CPU的利用率,这在CPU普遍多核化的今天还是有很大的作用的,同时我们也应该认识到Node通过事件驱动的方式在单线程上已经可以解决大并发的问题,启动多进程只是为充分利用CPU资源。
Node的Master-Worker多进程模式中主进程和工作进程通过消息传递的形式而不是共享或直接操作资源的方式进行通信,通过fork()创建工作进程之后会在主进程和工作进程之间创建IPC通道,关于多进程相关内容,Node官方提供了cluster模块对进程进行管理,相关内容可参考cluster。
关于应用的健壮性问题,我们同样可以采用上述的Master-Worker模式,主进程只负责管理工作进程,具体的业务处理交由工作进程来完成,在工作进程中监听uncaughtException事件可以捕获未知的异常,然后告知主进程,主进程根据策略重新创建工作进程,或者直接退出主进程,这种情况代码中一定要给出足够的日志信息,通过日志监控任务及时产生报警。
4.跨平台
Node刚发布的时候,只能在Linux平台上运行,后来Node在架构层面进行了改动,在Node和操作系统之间引入了一层libuv,从而实现跨平台。
1.I/O密集型
Node异步I/O的特点使得他可以轻松面对I/O密集型的业务场景,处理效率将比同步I/O高,虽然同步I/O可以采用多线程或者多进程的方式进行,但是相比Node自带异步I/O的特性来说,将增加对内存和CPU的开销。
2.高并发场景
针对高并发请求场景,Node的异步I/O以及事件回调特点可以高效的处理并发请求,举个简单的例子:
有家快餐店,有一个收银员,有4个厨师,中午高峰期的时候回一下来很多人就餐,对于同步的场景,收银员收完钱后将订单给厨师,厨师开始做,做完之后把快餐交给顾客,然后再接受下一个顾客的订单,对于异步的场景,收银员收完钱后将订单给厨师同时给顾客一个号码牌,厨师开始做,这时候顾客可以去隔壁买个饮料,等到厨师做完叫好去取餐就行。对于同步的场景如果需要增加顾客的处理速度,需要多加几个收银员(多线程),这意味着需要更多的人力成本,虽然对于系统的处理能力(厨师)来说是一样的。
总体来说Node的异步I/O能在开销固定的情况下极大的提高并发处理速度,适合高并发,I/O密集型的使用场景,同时由于单线程的特点,Node程序不如多线程程序健壮性高,也不能利用多线程来使用多核CPU,不过对于Node来说,使用多进程的成本相对较小,上述问题都可以通过合理使用多进程来处理,最终程序的高效稳定运行还是取决于软件架构和编码质量。为了便于学习,接下来还会写关于Node中Buffer、内存控制、程序测试等相关内容。