浏览器渲染原理
什么是渲染
渲染,英文为 render
。在前端人员经常使用的 Vue 或者 React 等诸如此类的框架,渲染的目的就是得到框架想要的 Virtual DOM
。而在浏览器这一部分,渲染的含义就是把字符串转换为像素信息,显示在屏幕上。我们可以将 render 理解为这样一个样貌:
function render(html) {
// ...
return pixels;
}
渲染流程
有这样一道面试题:浏览器输入 URL 到页面展示,发生了什么?
这个问题,其实分为了两个部分。第一个部分是:从输入 URL 到请求返回的过程。第二个部分是:从请求返回到页面展示的过程。
简单来讲,这里面包含了 网络 与 浏览器 渲染两部分知识。
Parse HTML
这一步的最终目标就是为了得到 DOM 树和 CSSOM 树。
在解析 HTML 的过程中,如果遇到了 CSS 和 JS 外部文件,将会如下操作:
Recalculate Style
对于这一部分,我在另一篇文章里已经有过说明,于是此处不再赘述。
Layout
此时,我们需要注意 DOM 树 和 Layout 树不一定是一一对应的:
display: none
的节点没有几何信息,因此不会生成到布局树中。伪元素
虽然不存在于 DOM 树中,但它们拥有几何信息,因此会生成到布局树中。匿名行盒
和匿名块盒
不会出现在 DOM 树中,但它们拥有几何信息,因此会生成到布局树中。
警告
- 元素的内容必须在行盒中。
- 行盒和块盒不可以相邻。
布局过程还会涉及到 包含块 的概念。
包含块
元素的尺寸和位置,会受它的包含块所影响。对于一些属性,例如 width / height / padding / margin,绝对定位元素的偏移值(比如 position 被设置为 absolute 或 fixed),当我们对其赋予百分比值时,这些值的计算值,就是通过元素的包含块计算得来。
根元素(HTML 元素)所在的包含块,被称之为初始包含块(initial containing block)。对于浏览器而言,初始包含块的的大小等于视口 viewport 的大小,基点在画布的原点(视口左上角)。它是作为元素绝对定位和固定定位的参照物。
Q:非根元素包含块的判定?
如果元素的 positiion 是 relative 或 static ,那么包含块由离它最近的块容器(block container)的内容区域(content area)的边缘建立。
如果 position 属性是 fixed,那么包含块由视口建立。
如果元素使用了 absolute 定位,则包含块由它的最近的 position 的值不是 static (也就是值为fixed、absolute、relative 或 sticky)的祖先元素的内边距区的边缘组成。
如果 position 属性是 absolute 或 fixed,包含块也可能是由满足以下条件的最近父级元素的内边距区的边缘组成的:
- transform 或 perspective 的值不是 none
- will-change 的值是 transform 或 perspective
- filter 的值不是 none 或 will-change 的值是 filter(只在 Firefox 下生效).
- contain 的值是 paint (例如: contain: paint;)
Layer
paint
为每一层生成如何绘制的指令。
Tiling
将一层划分为多个块状区域。
分块的工作是交给多个线程同时进行的。
Raster
Draw
Q:合成线程为什么会把 quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件而不是直接提交给硬件?
A:合成线程和渲染主线程在渲染进程里,出于安全性考虑,隔离硬件不会对计算机硬件造成影响。所以合成线程必须经过系统调用才能把 quad 提交给硬件。
面试题
浏览器是如何渲染页面的?
当浏览器的网络线程接收到 HTML 文档后,会产生一个渲染任务,并将其传递给渲染主线程的消息队列。在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程。
整个渲染流程分为多个阶段,分别是
HTML 解析
、样式计算
、布局
、分层
、绘制
、分块
、光栅化
、绘制像素信息
。每个阶段都有明确的输入输出,上一阶段的输出会成为下一个阶段的输入,如此形成了一套完整的渲染流水线。渲染的第一步是解析 HTML。
解析过程中遇到 CSS 解析 CSS,遇到 JS 解析 JS。为了提高解析效率,浏览器在开始解析前会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和外部的 JS 文件。
这也就是为什么如果主线程解析到 link 位置,外部的 CSS 文件还没有下载解析好的时候,主线程不会等待,反而继续解析后续 HTML 的原因 —— 就是因为下载和解析 CSS 的工作实在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。
如果主线程解析到 script 位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后才能继续解析 HTML。这是因为 JS 代码执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。这就是 JS 会阻塞 HTML 解析的根本原因。
第一步完成后会得到 DOM 树和 CSSOM 树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。
渲染的第二步是计算样式。
主线程会遍历得到的 DOM 树,依次为树中的每个节点计算出它最终的样式,称之为
Computed Style
。在这一过程中很多预设值会变成绝对值,比如 red 变为 rgb ( 255, 0, 0 );相对单位会变成绝对单位,比如 em 变为 px。
这一步完成后会得到一棵带有样式的 DOM 树。
接第三步是布局,布局完成后得到
布局树
。布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。
大部分时候 DOM 树和布局树并非一一对应。
比如 display:none 的节点没有集合信息,因此不会生成到布局树;又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。还有匿名行盒,匿名块盒等等都会导致 DOM 树和布局树无法一一对应。
第四步是分层。
主线程会使用一套复杂的策略对整个布局树中进行分层。
分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而
提升效率
。滚动条、堆叠上下文、transform、opacity 等样式都会或多或少的影响分层结果,也可以通过 will-change 属性更大程度的影响分层结果。
第五步是绘制。
主线程会为每个层单独产生绘制指令集,用于描述这一层的内容该如何画出来。
渲染主线程的工作到此为止,剩余步骤交给其他线程完成。
接下来进入浏览器渲染的第六步 —— 完成绘制后,主线程将每个图层的绘制信息提交给
合成线程
,剩余工作由合成线程完成。合成线程首先对每个图层进行分块,将其划分为更多的小区域。它会从线程池中拿取
多个线程
来完成分块工作。渲染的第七步,分块完成后进入光栅化阶段。
合成线程会将信息交给
GPU 进程
,以极高的速度完成光栅化。GPU 进程会开启
多个线程
来完成光栅化,并且优先处理靠近视口区域的块。光栅化的结果就是一块一块的
位图
。最后一个阶段就是画了。
合成进程拿到每个层、每个块的位图后,生成一个个指引 ( quad ) 信息。
quad
会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形。变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因。
合成线程会把 quad 提交给
GPU 进程
,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像。
什么是 Reflow?
- reflow 的本质就是重新计算 layout 树。
- 当进行了会影响布局树的操作后,需要重新计算布局树,会引发 layout。
- 为了避免连续的多次操作导致布局树反复计算,浏览器会合并这些操作,当 JS 代码全部完成后再统一计算。所以改动属性造成的 reflow 是异步完成的。
- 也因为如此,当 JS 获取布局属性,就可能造成无法获取到最新的布局信息。
- 浏览器反复权衡下,最终决定获取属性并立即 reflow。
什么是 repaint?
- repaint 的本质是重新根据分层信息计算绘制指令。
- 当改动了可见样式后,就需要重新计算,会引发 repaint。
- 由于元素的布局信息也属于可见样式,所以 reflow 一定会引起 repaint。
为什么transform的效率很高?
因为 transform 既不会影响布局也不会影响指令,它影响的只是渲染流程的最后一个 draw 阶段。由于 draw 阶段在合成线程中,所以 transform 的变化几乎不会影响渲染主线程。反之,渲染主线程无论如何忙碌,也不会影响 transform 的变化。