浅谈Nodejs中的多线程操作

虽说nodejs是单线程的，但是它还是容许多线程操作，下面本篇文章给大家从 node 线程说起，谈谈nodejs中的多线程操作，介绍一下worker_threads模板。
本文测试使用环境：
系统：macos mojave 10.14.2
cpu：4 核 2.3 ghz
node: 10.15.1
【推荐学习：《nodejs 教程》】
从 node 线程说起一般人理解 node 是单线程的，所以 node 启动后线程数应该为 1，我们做实验看一下。【推荐学习：《nodejs 教程》】
setinterval(() => { console.log(new date().gettime())}, 3000)
可以看到 node 进程占用了 7 个线程。为什么会有 7 个线程呢？
我们都知道，node 中最核心的是 v8 引擎，在 node 启动后，会创建 v8 的实例，这个实例是多线程的。
主线程：编译、执行代码。编译/优化线程：在主线程执行的时候，可以优化代码。分析器线程：记录分析代码运行时间，为 crankshaft 优化代码执行提供依据。垃圾回收的几个线程。所以大家常说的 node 是单线程的指的是 javascript 的执行是单线程的，但 javascript 的宿主环境，无论是 node 还是浏览器都是多线程的。
node 有两个编译器：
full-codegen：简单快速地将 js 编译成简单但是很慢的机械码。
crankshaft：比较复杂的实时优化编译器，编译高性能的可执行代码。
某些异步 io 会占用额外的线程还是上面那个例子，我们在定时器执行的同时，去读一个文件：
const fs = require('fs')setinterval(() => { console.log(new date().gettime())}, 3000)fs.readfile('./index.html', () => {})
线程数量变成了 11 个，这是因为在 node 中有一些 io 操作（dns，fs）和一些 cpu 密集计算（zlib，crypto）会启用 node 的线程池，而线程池默认大小为 4，因为线程数变成了 11。
我们可以手动更改线程池默认大小：
process.env.uv_threadpool_size = 64
一行代码轻松把线程变成 71。
cluster 是多线程吗？node 的单线程也带来了一些问题，比如对 cpu 利用不足，某个未捕获的异常可能会导致整个程序的退出等等。因为 node 中提供了 cluster 模块，cluster 实现了对 child_process 的封装，通过 fork 方法创建子进程的方式实现了多进程模型。比如我们最常用到的 pm2 就是其中最优秀的代表。
我们看一个 cluster 的 demo：
const cluster = require('cluster');const http = require('http');const numcpus = require('os').cpus().length;if (cluster.ismaster) { console.log(`主进程 ${process.pid} 正在运行`); for (let i = 0; i < numcpus; i++) { cluster.fork(); } cluster.on('exit', (worker, code, signal) => { console.log(`工作进程 ${worker.process.pid} 已退出`); });} else { // 工作进程可以共享任何 tcp 连接。 // 在本例子中，共享的是 http 服务器。 http.createserver((req, res) => { res.writehead(200); res.end('hello world'); }).listen(8000); console.log(`工作进程 ${process.pid} 已启动`);}
这个时候看下活动监视器：
一共有 9 个进程，其中一个主进程，cpu 个数 x cpu 核数 = 2 x 4 = 8 个子进程。
所以无论 child_process 还是 cluster，都不是多线程模型，而是多进程模型。虽然开发者意识到了单线程模型的问题，但是没有从根本上解决问题，而且提供了一个多进程的方式来模拟多线程。从前面的实验可以看出，虽然 node （v8）本身是具有多线程的能力的，但是开发者并不能很好的利用这个能力，更多的是由 node 底层提供的一些方式来使用多线程。node 官方说：
you can use the built-in node worker pool by developing a c++ addon. on older versions of node, build your c++ addon using nan, and on newer versions use n-api. node-webworker-threads offers a javascript-only way to access node’s worker pool.
但是对于 javascript 开发者，一直没有一个标准的、好用的方式来使用 node 的多线程能力。
真 - node 多线程直到 node 10.5.0 的发布，官方才给出了一个实验性质的模块 worker_threads 给 node 提供真正的多线程能力。
先看下简单的 demo：
const { ismainthread, parentport, workerdata, threadid, messagechannel, messageport, worker} = require('worker_threads');function mainthread() { for (let i = 0; i < 5; i++) { const worker = new worker(__filename, { workerdata: i }); worker.on('exit', code => { console.log(`main: worker stopped with exit code ${code}`); }); worker.on('message', msg => { console.log(`main: receive ${msg}`); worker.postmessage(msg + 1); }); }}function workerthread() { console.log(`worker: workerdate ${workerdata}`); parentport.on('message', msg => { console.log(`worker: receive ${msg}`); }), parentport.postmessage(workerdata);}if (ismainthread) { mainthread();} else { workerthread();}
上述代码在主线程中开启五个子线程，并且主线程向子线程发送简单的消息。
由于 worker_thread 目前仍然处于实验阶段，所以启动时需要增加 --experimental-worker flag，运行后观察活动监视器：
不多不少，正好多了五个子线程。
worker_thread 模块worker_thread 核心代码
worker_thread 模块中有 4 个对象和 2 个类。
ismainthread: 是否是主线程，源码中是通过 threadid === 0 进行判断的。messageport: 用于线程之间的通信，继承自 eventemitter。messagechannel: 用于创建异步、双向通信的通道实例。threadid: 线程 id。worker: 用于在主线程中创建子线程。第一个参数为 filename，表示子线程执行的入口。parentport: 在 worker 线程里是表示父进程的 messageport 类型的对象，在主线程里为 nullworkerdata: 用于在主进程中向子进程传递数据（data 副本）来看一个进程通信的例子：
const assert = require('assert');const { worker, messagechannel, messageport, ismainthread, parentport} = require('worker_threads');if (ismainthread) { const worker = new worker(__filename); const subchannel = new messagechannel(); worker.postmessage({ hereisyourport: subchannel.port1 }, [subchannel.port1]); subchannel.port2.on('message', (value) => { console.log('received:', value); });} else { parentport.once('message', (value) => { assert(value.hereisyourport instanceof messageport); value.hereisyourport.postmessage('the worker is sending this'); value.hereisyourport.close(); });}
更多详细用法可以查看官方文档。
多进程 vs 多线程根据大学课本上的说法：“进程是资源分配的最小单位，线程是cpu调度的最小单位”，这句话应付考试就够了，但是在实际工作中，我们还是要根据需求合理选择。
下面对比一下多线程与多进程：
属性多进程多线程比较
数据数据共享复杂，需要用ipc；数据是分开的，同步简单因为共享进程数据，数据共享简单，同步复杂各有千秋
cpu、内存占用内存多，切换复杂，cpu利用率低占用内存少，切换简单，cpu利用率高多线程更好
销毁、切换创建销毁、切换复杂，速度慢创建销毁、切换简单，速度很快多线程更好
coding 编码简单、调试方便编码、调试复杂多进程更好
可靠性进程独立运行，不会相互影响线程同呼吸共命运多进程更好
分布式可用于多机多核分布式，易于扩展只能用于多核分布式多进程更好
上述比较仅表示一般情况，并不绝对。
work_thread 让 node 有了真正的多线程能力，算是不小的进步。
更多编程相关知识，请访问：编程视频！！
以上就是浅谈nodejs中的多线程操作的详细内容。

浅谈Nodejs中的多线程操作

VIP推荐