浏览器的工作原理
浏览器的进程模型
1.事件循环
浏览器的进程模型--多进程多线程的应用程序
- 进程:程序运行需要有他自己的专属空间,这块空间就称之为进程!!!
进程之间相互独立,通信需要双方同意
- 线程:一个进程至少有一个线程,是操作系统能够进行运算调度的最小单位。是进程中实际运作单位。主线程:进程开启后会自动创建一个线程来运行代码
浏览器主要有三个进程:浏览器进程,网络进程,渲染进程,
单线程是异步产生的原因,事件循环是异步的实现方式
默认情况下,浏览器会为每个标签也开启一个新的渲染进程,渲染线程开启后会自动开启一个渲染主线程,主要负责执行 html,css,js 代码,以保证不同的标签页之间不受影响。
渲染主线程无论如何都不能发生阻塞
工作步骤
- 渲染主线程最开始会进入一个死循环!!!
- 每一次循环会检查 message queue 是否有任务存在!!!有则执行,无则休眠!!!
2.异步 async
【异步】无法立即执行的函数
- 计时器:setTimeout、setInterval
- 网络通信:XHR、Fetch
- 事件:addEventListener
【原理】计时器开始时,把事件加入计时线程直接结束,当其线程结束时,会将事先传递的回调函数包装成任务,重新放入 message queue 的队尾中。等待渲染主线程调度执行。
面试题 如何理解 JS 的异步?
参考答案: JS 是⼀⻔单线程的语⾔,这是因为它运⾏在浏览器的渲染主线程中,⽽渲染 主线程只有⼀个。 ⽽渲染主线程承担着诸多的⼯作,渲染⻚⾯、执⾏ JS 都在其中运⾏。 如果使⽤同步的⽅式,就极有可能导致主线程产⽣阻塞,从⽽导致消息队列 中的很多其他任务⽆法得到执⾏。这样⼀来,⼀⽅⾯会导致繁忙的主线程⽩ ⽩的消耗时间,另⼀⽅⾯导致⻚⾯⽆法及时更新,给⽤户造成卡死现象。
所以浏览器采⽤异步的⽅式来避免。具体做法是当某些任务发⽣时,⽐如计 时器、⽹络、事件监听,主线程将任务交给其他线程去处理,⾃身⽴即结束 任务的执⾏,转⽽执⾏后续代码。当其他线程完成时,将事先传递的回调函 数包装成任务,加⼊到消息队列的末尾排队,等待主线程调度执⾏。 在这种异步模式下,浏览器永不阻塞,从⽽最⼤限度的保证了单线程的流畅 运⾏。
面试题 任务有优先级吗?(Message queue)
随着浏览器的复杂度急剧提升,W3C 不再使⽤宏队列的说法
任务没有优先级,但消息队列有优先级(w3c 标准)
- 每一个任务都有一个任务类型 ,同一个任务类型必须在同一个队列,不同类型的任务可以分属不同任务的队列,每一次事件循环事件中,浏览器可以根据实际情况从不同的队列中取出任务执行。
- 浏览器必须准备好一个微队列(microtask queue),微队列中的任务优于其他任务执行。
- 主要队列有延时队列(中)、交互队列(高)、微队列(最高):Promise
Promise.reslove().then(function () {});
面试题 阐述⼀下 JS 的事件循环 ?
参考答案: 事件循环⼜叫做消息循环,是浏览器渲染主线程的⼯作⽅式。 在 Chrome 的源码中,它开启⼀个不会结束的 for 循环,每次循环从消息 队列中取出第⼀个任务执⾏,⽽其他线程只需要在合适的时候将任务加⼊到 队列末尾即可。 过去把消息队列简单分为宏队列和微队列,这种说法⽬前已⽆法满⾜复杂的 浏览器环境,取⽽代之的是⼀种更加灵活多变的处理⽅式。 根据 W3C 官⽅的解释,每个任务有不同的类型,同类型的任务必须在同⼀ 个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级, 在⼀次事件循环中,由浏览器⾃⾏决定取哪⼀个队列的任务。但浏览器必须 有⼀个微队列,微队列的任务⼀定具有最⾼的优先级,必须优先调度执⾏。
面试题 JS 中的计时器能做到精确计时吗?为什么?
参考答案: 不⾏,因为:
- 计算机硬件没有原⼦钟,⽆法做到精确计时
- 操作系统的计时函数本身就有少量偏差,由于 JS 的计时器最终调⽤的是操作系统的函数,也就携带了这些偏差
- 按照 W3C 的标准,浏览器实现计时器时,如果嵌套层级超过 5 层,则会带有 4 毫秒的最少时间,这样在计时时间少于 4 毫秒时⼜带来了偏差
- 受事件循环的影响,计时器的回调函数只能在主线程空闲时运⾏,因此⼜带来了偏差
浏览器的渲染原理

面试题 浏览器是如何渲染页面的?
当浏览器的网络线程收到 HTML 文档后,会产生一个渲染任务,并将其传递给渲染主线程的消息队列。
- 在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程。
整个渲染流程分为多个阶段,分别是: HTML 解析、样式计算、布局、分层、绘制、分块、光栅化、画
- 每个阶段都有明确的输入输出,上一个阶段的输出会成为下一个阶段的输入。
- 这样,整个渲染流程就形成了一套组织严密的生产流水线。
渲染的第一步是解析 HTML。
- 解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和 外部的 JS 文件。
- 如果主线程解析到 link 位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的 HTML。这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。
- 如果主线程解析到 script 位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。这就是 JS 会阻塞 HTML 解析的根本原因。
- 第一步完成后,会得到 DOM 树和 CSSOM 树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。
渲染的下一步是样式计算。
- 主线程会遍历得到的 DOM 树,依次为树中的每个节点计算出它最终的样式,称之为 Computed Style。
- 在这一过程中,很多预设值会变成绝对值,比如 red 会变成 rgb(255,0,0);相对单位会变成绝对单位,比如 em 会变成 px
- 这一步完成后,会得到一棵带有样式的 DOM 树。
接下来是布局,布局完成后会得到布局树。
- 布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。
- 大部分时候,DOM 树和布局树并非一一对应。
- 比如 display:none 的节点没有几何信息,因此不会生成到布局树;又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应。
下一步是分层
- 主线程会使用一套复杂的策略对整个布局树中进行分层。
- 分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率。
- 滚动条、堆叠上下文、transform、opacity 等样式都会或多或少的影响分层结果,也可以通过 will-change 属性更大程度的影响分层结果。
再下一步是绘制
- 主线程会为每个层单独产生绘制指令集,用于描述这一层的内容该如何画出来。
再下一步是分块
- 完成绘制后,主线程将每个图层的绘制信息提交给合成线程,剩余工作将由合成线程完成。
- 合成线程首先对每个图层进行分块,将其划分为更多的小区域。
- 它会从线程池中拿取多个线程来完成分块工作
分块完成后,进入光栅化阶段。
- 合成线程会将块信息交给 GPU 进程,以极高的速度完成光栅化。
- GPU 进程会开启多个线程来完成光栅化,并且优先处理靠近视口区域的块。
- 光栅化的结果,就是一块一块的位图
最后一个阶段就是画了
- 合成线程拿到每个层、每个块的位图后,生成一个个「指引(quad)」信息。
- 指引会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形。
- 变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因。
- 合成线程会把 quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像。
渲染(render):把 html 字符串变为屏幕上的像素信息
function render(html) {
//第一行像素
//第二行像素
return pixels;
}
面试题 输入地址按按下 Enter 会发生什么?
例如当我们在 web 浏览器的地址栏中输入:www.baidu.com,具体发生了:
- 对www.baidu.com这个网址进行DNS域名解析,得到对应的IP地址
- 根据这个 IP,找到对应的服务器,发起 TCP 的三次握手
- 建立 TCP 连接后, 发起 HTTP 请求
- 服务器响应 HTTP 请求,浏览器得到 html 代码
- 浏览器解析 html 代码,并请求 html 代码中的资源(如 js、css、图片等)(先得到 html 代码,才能去找这些资源)
- 服务器响应对应的资源
- 响应数据完毕, 四次挥手,关闭 TCP 连接
- 浏览器对页面进行渲染呈现给用户
渲染时间点
当浏览器的网络线程收到 html 文档后,会产生一个渲染任务,并且将其传递给寻人主线程的 Message queue 中,在事件循环的机制下,渲染主线程会取出消息队列的渲染任务,开始渲染流程。
渲染流水线
html 字符串-->解析 html-->样式计算-->布局-->分层-->绘制【渲染主线程到此结束】-->分块【合成线程开始工作】-->光栅化【GPU 线程】-->画【GPU 加速渲染】-->像素信息
合成线程也是在渲染进程中
1.解析 html(Parse HTML)

解析 html 生成 Dom(Document Object Moudel)树和 CSSom(CSS Object Moudel)树
为了提高解析效率,浏览器会启动预解析器率先下载和解析 CSS
当渲染主线程遇到 JS 时必须暂停一切行为,等待下载执行完成后才能继续,预解析线程可以分担一点下载 js 的任务
2.样式计算 Computed Style(最终样式):CSS 必须全部有样式
css 属性的计算过程
- 层叠
- 继承
视觉格式化模型
- 盒模型
- 包含块
3.布局 Layout(尺寸,位置):找到每一个元素的几何信息
包含块:一个元素的活动区域
Dom 树和 Layout 树不是一一对应的。
文本内容必须包含行盒中,行盒和块盒不能相邻,有匿名行盒和匿名块盒
4.分层 Layer
堆叠上下文有关的属性会影响分层
影响最大的属性是 CSS 样式:will-change:transform
5.绘制 Paint
为每一层生成如何绘制的指令集
指令集:一条一条指令形成的集合
6.分块 Tiling
为每一层分为多个小的区域

7.光栅化 Raster
光栅化是将每个块变成位图,优先处理靠近视口的块
此过程会用到 GPU 加速,在 GPU 进程中运行!!!

8.画 Draw
合成线程计算出每个位图在屏幕上的位置,交给 GPU 最终呈现
合成线程通过【draw quad】交给 GPU 进程,GPU 进程进行系统调用,提交给 GPU 硬件画出来

面试题 什么是回流?
reflow 的本质就是重新计算 layout 树。
当进行了会影响布局树的操作后,需要重新计算布局树,会引发 layout。
为了避免连续的多次操作导致布局树反复计算,浏览器会合并这些操作,当 JS 代码全部完成后再进行统一计算。所以,改动属性造成的 reflow 是异步完成的。
也同样因为如此,当 JS 获取布局属性时,就可能造成无法获取到最新的布局信息。
浏览器在反复权衡下,最终决定获取属性立即 reflow。
面试题 什么是重绘?
repaint 的本质就是重新根据分层信息计算了绘制指令。
当改动了可见样式后,就需要重新计算,会引发 repaint。
由于元素的布局信息也属于可见样式,所以 reflow 一定会引起 repaint。
【面试题】为什么 transform 的效率高?
因为 transform 既不会影响布局也不会影响绘制指令,它影响的只是渲染流程的最后一个「draw」阶段
由于 draw 阶段在合成线程中,所以 transform 的变化几乎不会影响渲染主线程。反之,渲染主线程无论如何忙碌,也不会影响 transform 的变化。