浅谈 Node.js 单线程模型

2017 年 7 月 14 日 前端大全

(点击上方公众号,可快速关注)


作者:一像素

www.cnblogs.com/onepixel/p/7143769.html

如有好文章投稿,请点击 → 这里了解详情


Node.js采用 事件驱动 和 异步I/O 的方式,实现了一个单线程、高并发的运行时环境,而单线程就意味着同一时间只能做一件事,那么Node.js如何利用单线程来实现高并发和异步I/O?本文将围绕这个问题来探讨Node.js的单线程模型:


1、高并发


一般来说,高并发的解决方案就是多线程模型,服务器为每个客户端请求分配一个线程,使用同步I/O,系统通过线程切换来弥补同步I/O调用的时间开销,比如Apache就是这种策略,由于I/O一般都是耗时操作,因此这种策略很难实现高性能,但非常简单,可以实现复杂的交互逻辑。


而事实上,大多数网站的服务器端都不会做太多的计算,它们只是接收请求,交给其它服务(比如从数据库读取数据),然后等着结果返回再发给客户端。因此,Node.js针对这一事实采用了单线程模型来处理,它不会为每个接入请求分配一个线程,而是用一个主线程处理所有的请求,然后对I/O操作进行异步处理,避开了创建、销毁线程以及在线程间切换所需的开销和复杂性。


2、事件循环


Node.js 在主线程中维护了一个事件队列,当接收到请求后,就将请求作为一个事件放入该队列中,然后继续接收其他请求。当主线程空闲时(没有请求接入时),就开始循环事件队列,检查队列中是否有要处理的事件,这时要分两种情况:如果是非I/O任务,就亲自处理,并通过回调函数返回到上层调用;如果是I/O任务,就从线程池中拿出一个线程来执行这个事件,并指定回调函数,然后继续循环队列中的其他事件。当线程中的I/O任务完成后,就执行指定的回调函数,并把这个完成的事件放到事件队列的尾部,等待事件循环,当主线程再次循环到该事件时,就直接处理并返回给上层调用。 这个过程就叫事件循环(Event Loop),如下图所示:



这个图是整个Node.js的运行原理,从左到右,从上到下,Node.js被分成了四层,分别是应用层、V8引擎层、Node API层 和 LIBUV层,


  • 应用层: 即Javascript交互层,常见的就是Node.js的模块,比如 http,fs

  • V8引擎层: 即利用V8引擎来解析Javascript语法,进而和下层API交互

  • NodeAPI层: 为上层模块提供系统调用,一般是由C语言来实现,和操作系统进行交互

  • LIBUV层: 即Event Loop,是Node.js实现异步的核心,由LIBUV库来实现,而LIBUV中的线程池是由操作系统内核接受管理的。


在Node中,无论是Linux平台还是Windows平台,内部都是通过线程池来完成IO操作的,而LIBUV就是针对不同平台的差异性实现了统一调用。因此,Node.js的单线程仅仅是指Javascript运行在单线程中,而并非Node.js是单线程。


3、事件驱动


Node.js实现异步的核心是事件驱动。也就是说,它把每一个任务都当成事件来处理,然后通过Event Loop 模拟了异步的效果,为了更具体、更清晰的理解和接受这个事实,我们用代码来描述这个实现过程:


【1】事件队列


首先,我们需要定义一个事件队列,既然是队列,那就是一个先进先出(FIFO)的数据结构,我们用JS的数组来描述,如下:


/**

* 定义事件队列

* 入队:unshfit()

* 出队:pop()

* 空队列:length == 0

*/

eventQueue:[],


为了方便理解,我们规定:数组的第一个元素是队列的尾部,数组的最后一个元素是队列的头部, unshfit 就是在尾部插入一个元素,pop就是从头部弹出一个元素,这样就实现了一个简单的队列。


【2】接收请求


定义一个总的入口来接收用户请求,如下所示:


/**

* 接收用户请求

* 每一个请求都会进入到该函数

* 传递参数request和response

*/

processHttpRequest:function(request,response){

    

    //定义一个事件对象

    var event = createEvent({

        params:request.params, //传递请求参数

        result:null, //存放请求结果

        callback:function(){} //指定回调函数

    });

    //在队列的尾部添加该事件  

    eventQueue.unshift(event);

},


这个函数很简单,就是把用户的请求包装成事件,放到队列里,然后继续接收其他请求。


【3】事件循环 ( Event Loop )


当主线程处于空闲时就开始循环事件队列,所以,我们再定义一个事件循环的函数:


/**

* 事件循环主体,主线程择机执行

* 循环遍历事件队列

* 处理事件

* 执行回调,返回给上层

*/

eventLoop:function(){

    //如果队列不为空,就继续循环

    while(this.eventQueue.length > 0){

        

        //从队列的头部拿出一个事件

        var event = this.eventQueue.pop();

        

        //如果是IO任务

        if(isIOTask(event)){

            //从线程池里拿出一个线程

            var thread = getThreadFromThreadPool();

            //交给线程处理

            thread.handleIOTask(event)

        }else {

            //非IO任务处理后,直接返回结果

            var result = handleEvent(event);

            //最终通过回调函数返回给V8,再由V8返回给应用程序

            event.callback.call(null,result);

        }

    }

},


主线程不停的检测事件队列,对于IO任务就交给线程池来处理,非IO任务就自己处理并返回。


【4】线程池


线程池接到任务以后,直接处理IO操作,比如读取数据库:


/**

* 处理IO任务

* 完成后将事件添加到队列尾部

* 释放线程

*/

handleIOTask:function(event){

    //当前线程

    var curThread = this;

    //操作数据库

    var optDatabase = function(params,callback){

        var result = readDataFromDb(params);

        callback.call(null,result)

    };

    

    //执行IO任务

    optDatabase(event.params,function(result){

        //返回结果存入事件对象中

        event.result = result;

        //IO完成后,将不再是耗时任务

        event.isIOTask = false;

        

        //将该事件重新添加到队列的尾部

        this.eventQueue.unshift(event);

        

        //释放当前线程

        releaseThread(curThread)

    })

}


当IO任务完成以后就执行回调,把请求结果存入事件中,并将该事件重新放入队列中,等待循环,最后释放线程。当主线程再次循环到该事件时,就直接处理了。


总结以上过程我们发现,Node.js 的主线程就是一个单线程,它接收请求后并没有直接做处理,而是放到了事件队列中,然后去接收其他请求了,空闲时再通过Event Loop来处理这些事件,从而实现了异步效果,当然对于IO类任务还要依赖于系统层面的线程池来处理。因此,我们可以简单理解为:Node.js本身是一个多线程平台,而它对JS层面的任务处理是单线程。


4、Node.js软肋


至此,我们对Node.js应该有了一个简单而又清晰的认识,但Node.js 并不是什么都能做。


上面提到,如果是I/O任务,Nodejs就把任务交给线程池来异步处理,高效简单,因此Node.js适合处理I/O密集型任务,但不是所有的任务都是I/O密集型任务,当碰到CPU密集型任务时,就是只用CPU计算的操作,比如要对数据加解密(node.bcrypt.js),数据压缩和解压(node-tar),这时Node.js就会亲自处理,一个一个的计算,前面的任务没有执行完,后面的任务只能干等着,如下图所示:



在事件队列中,如果前面的CPU计算任务没有完成,那么后面的任务就会被阻塞,出现响应缓慢的情况,如果操作系统本身就是单核,那也就算了,但现在大部分服务器都是多CPU或多核的,而Node.js只有一个EventLoop,也只占用一个CPU/内核,当Node.js被CPU密集型任务占用,导致其他任务被阻塞时,却还有CPU/内核处理闲置状态,造成资源浪费。因此Node.js并不适合CPU密集型任务。


5、Node.js适用场景


RESTful API,这是适合 Node 的理想情况,因为您可以构建它来处理数万条连接。它仍然不需要大量逻辑;它本质上只是从某个数据库中查找一些值并将它们组成一个响应。由于响应是少量文本,入站请求也是少量的文本,因此流量不高,一台机器甚至也可以处理最繁忙的公司的 API 需求。


实时程序,比如聊天服务,聊天应用程序是最能体现 Node.js 优点的例子:轻量级、高流量并且能良好的应对跨平台设备上运行密集型数据(虽然计算能力低)。同时,聊天也是一个非常值得学习的用例,因为它很简单,并且涵盖了目前为止一个典型的 Node.js 会用到的大部分解决方案。



觉得本文对你有帮助?请分享给更多人

关注「前端大全」,提升前端技能

登录查看更多
0

相关内容

Node.js 是一个在浏览器外部创建互联网应用程序的框架,它基于 Google 开发的 V8 JavaScript 引擎,轻量,高效,事件驱动,非阻塞I/O,特别适合运行于跨分布式设备的实时数据处理程序。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
Python导论,476页pdf,现代Python计算
专知会员服务
259+阅读 · 2020年5月17日
专知会员服务
31+阅读 · 2020年4月24日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
专访阿里亚顿:Serverless与BFF与前端
前端之巅
45+阅读 · 2019年5月8日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
Kong 1.1 带来声明式配置与无数据库部署模式
开源中国
8+阅读 · 2019年3月28日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
9+阅读 · 2018年3月23日
VIP会员
相关VIP内容
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
Python导论,476页pdf,现代Python计算
专知会员服务
259+阅读 · 2020年5月17日
专知会员服务
31+阅读 · 2020年4月24日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
相关资讯
专访阿里亚顿:Serverless与BFF与前端
前端之巅
45+阅读 · 2019年5月8日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
Kong 1.1 带来声明式配置与无数据库部署模式
开源中国
8+阅读 · 2019年3月28日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
Top
微信扫码咨询专知VIP会员