# 前端er来学习一下webWorker吧
我们都知道,JavaScript 是单线程的,在同一时刻只能处理一个任务,我们会通过 setTimeout()、setInterval()、ajax 和事件处理程序等技术模拟“并行”。但都不是真正意义上的并行:
Web Worker 是 HTML5 标准的一部分,这一规范定义了一套 API,它允许一段 JavaScript 程序运行在主线程之外的另外一个线程中。
这在很大程度上利用了现在不断升级的电脑计算能力:能够在同一时间平行处理两个任务。
# 场景
当我们有些任务需要花费大量的时间,进行复杂的运算,就会导致页面卡死:用户点击页面需要很长的时间才能响应,因为前面的任务还未完成,后面的任务只能排队等待。对用户来说,这样的体验无疑是糟糕的,web worker 就是为了解决这种花费大量时间的复杂运算而诞生的!
# WebWorker 的作用:创建 worker 线程
WebWorker 允许在主线程之外再创建一个 worker 线程,在主线程执行任务的同时,worker 线程也可以在后台执行它自己的任务,互不干扰。
这样就让 JS 变成多线程的环境了,我们可以把高延迟、花费大量时间的运算,分给 worker 线程,最后再把结果返回给主线程就可以了,因为时间花费多的任务被 web worker 承担了,主线程就会很流畅了!
# 主线程
# 我们先来看一下栗子:
codepen,这里我写了一个 class,里面有详细注释,可以参考一下。
# 创建 worker 对象:
主线程调用new Worker()
构造函数,新建一个 worker 线程,构造函数的参数是一个 url,生成这个 url 的方法有两种:
脚本文件:
const worker = new Worker('https://~.js');
1因为 worker 的两个限制:
分配给 Worker 线程运行的脚本文件,必须与主线程的脚本文件同源。
worker 不能读取本地的文件(不能打开本机的文件系统
file://
),它所加载的脚本必须来自网络。
可以看到限制还是比较多的,如果要使用这种形式的话,在项目中推荐把文件放在静态文件夹中,打包的时候直接拷贝进去,这样我们就可以拿到固定的链接了,
字符串形式:
const data = ` // worker线程 do something `; // 转成二进制对象 const blob = new Blob([data]); // 生成url const url = window.URL.createObjectURL(blob); // 加载url const worker = new Worker(url);
1
2
3
4
5
6
7
8
9栗子中就是使用这种形式的,方便我们演示。
在项目中:我们可以把worker线程的逻辑写在js文件里面,然后字符串化,然后再export、import,配合webpack进行模块化管理,这样就很容易使用了。
# 主线程的其他 API:
# 1. 主线程与 worker 线程通信:
worker.postMessage({
hello: ['hello', 'world']
});
2
3
它们相互之间的通信可以传递对象和数组,这样我们就可以根据相互之间传递的信息来进行一些操作,比如可以设置一个type
属性,当值为hello
时执行什么函数,当值为world
的时候执行什么函数。
值得注意的是:它们之间通信是通过拷贝的形式来传递数据的,进行传递的对象需要经过序列化,接下来在另一端还需要反序列化。这就意味着:
- 我们不能传递不能被序列化的数据,比如函数,会抛出错误的。
- 在一端改变数据,另外一端不会受影响,因为数据不存在引用,是拷贝过来的。
# 2. 监听 worker 线程返回的信息
worker.onmessage = function (e) {
console.log('父进程接收的数据:', e.data);
// doSomething();
}
2
3
4
# 3. 主线程关闭 worker 线程
Worker 线程一旦新建成功,就会始终运行,这样有利于随时响应主线程的通信。
这也是 Worker 比较耗费计算机的计算资源(CPU
)的原因,一旦使用完毕,就应该关闭 worker 线程。
worker.terminate(); // 主线程关闭worker线程
# 4. 监听错误
// worker线程报错
worker.onerror = e => {
// e.filename - 发生错误的脚本文件名;e.lineno - 出现错误的行号;以及 e.message - 可读性良好的错误消息
console.log('onerror', e);
};
2
3
4
5
也可以像我给出的栗子一样,把两个报错放在一起写,有报错把信息传出来就好了。
# Worker 线程
# self 代表 worker 进程自身
worker 线程的执行上下文是一个叫做WorkerGlobalScope
的东西跟主线程的上下文(window)不一样。
我们可以使用self
/WorkerGlobalScope
来访问全局对象。
# 监听主线程传过来的信息:
self.onmessage = e => {
console.log('主线程传来的信息:', e.data);
// do something
};
2
3
4
# 发送信息给主线程
self.postMessage({
hello: [ '这条信息', '来自worker线程' ]
});
2
3
# worker 线程关闭自身
self.close()
# worker 线程加载脚本:
Worker 线程能够访问一个全局函数 imprtScripts()来引入脚本,该函数接受 0 个或者多个 URI 作为参数。
importScripts('http~.js','http~2.js');
脚本中的全局变量都能被 worker 线程使用。
脚本的下载顺序是不固定的,但执行时会按照传入 importScripts() 中的文件名顺序进行,这个过程是同步的。
# Worker 线程限制
因为 worker 创造了另外一个线程,不在主线程上,相应的会有一些限制,我们无法使用下列对象:
- window 对象
- document 对象
- DOM 对象
- parent 对象
我们可以使用下列对象/功能:
浏览器:navigator 对象
URL:location 对象,只读
发送请求:XMLHttpRequest 对象
定时器:setTimeout/setInterval,在 worker 线程轮询也是很棒!
应用缓存:Application Cache
# 多个 worker 线程
在主线程内可以创建多个 worker 线程
栗子最下方有。
worker 线程内还可以新建 worker 线程,使用同源的脚本文件创建。
在 worker 线程内再新建 worker 线程就不能使用
window.URL.createObjectURL(blob)
,需要使用同源的脚本文件来创建新的 worker 线程,因为我们无法访问到window
对象。这里不方便演示,跟在主线程创建 worker 线程是一个套路,只是改成了脚本文件形式创建 worker 线程。
# 线程间转移二进制数据
因为主线程与 worker 线程之间的通信是拷贝关系,当我们要传递一个巨大的二进制文件给 worker 线程处理时(worker 线程就是用来干这个的),这时候使用拷贝的方式来传递数据,无疑会造成性能问题。
幸运的是,Web Worker 提供了一中转移数据的方式,允许主线程把二进制数据直接转移给子线程。这种方式比原先拷贝的方式,有巨大的性能提升。
一旦数据转移到其他线程,原先线程就无法再使用这些二进制数据了,这是为了防止出现多个线程同时修改数据的麻烦局面
下方栗子出自浅谈 HTML5 Web Worker
// 创建二进制数据
var uInt8Array = new Uint8Array(1024*1024*32); // 32MB
for (var i = 0; i < uInt8Array .length; ++i) {
uInt8Array[i] = i;
}
console.log(uInt8Array.length); // 传递前长度:33554432
// 字符串形式创建worker线程
var myTask = `
onmessage = function (e) {
var data = e.data;
console.log('worker:', data);
};
`;
var blob = new Blob([myTask]);
var myWorker = new Worker(window.URL.createObjectURL(blob));
// 使用这个格式(a,[a]) 来转移二进制数据
myWorker.postMessage(uInt8Array.buffer, [uInt8Array.buffer]); // 发送数据、转移数据
console.log(uInt8Array.length); // 传递后长度:0,原先线程内没有这个数据了
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
二进制数据有:File、Blob、ArrayBuffer 等类型,也允许在 worker 线程之间发送,这对于影像处理、声音处理、3D 运算等就非常方便了,不会产生性能负担
# 应用场景:
数学运算
图像、影音等文件处理
大量数据检索
比如用户输入时,我们在后台检索答案,或者帮助用户联想,纠错等操作.
耗时任务都丢到 webworker 解放我们的主线程。
# 兼容:
没有找到具体的制定日期,有篇博客是在 10 年的 7 月份写的,也就是说 web worker 至少出现了八年了,以下兼容摘自MDN:
Chrome:4, Firefox:3.5, IE:10.0, Opera:10.6, Safari:4
现在兼容还是做的比较好的,如果实在不放心的话:
if (window.Worker) {
...
}else{
...
}
2
3
4
5
# 结语:
Web Worker的出现,给浏览器带来了后台计算的能力,把耗时的任务分配给worker线程来做,在很大程度上缓解了主线程UI渲染阻塞的问题,提升页面性能。
使用起来也不复杂,以后有复杂的问题,记得要丢给我们浏览器的后台(web worker)来处理
看完之后,一定要研究一下文中的栗子,自己鼓捣鼓捣,实践出真知!
PS: 推荐一下我上个月写的手摸手教你使用WebSocket,感兴趣的可以看一下。
以上2018.11.25
参考资料: