渲染机制(四):硬件加速
创始人
2025-05-29 12:46:33
0

文章目录

  • 一、概述
  • 二、硬件绘制与软件绘制模型
  • 三、软件绘制刷新的逻辑
  • 四、总结
  • 五、参考

一、概述

从 Android 3.0(API 级别 11)开始,Android 2D 渲染管道支持硬件加速,也就是说,在 View 的画布上执行的所有绘制操作都会使用 GPU。启用硬件加速需要更多资源,因此应用会占用更多内存。

硬件加速的主要原理:通过将CPU不擅长的图形计算转换成GPU专用指令,让更擅长图形计算的GPU来完成渲染,从而提升了整体的渲染速度。

关联文章:

  • 渲染机制(一):Android渲染机制的演进
  • 渲染机制(二):Choreographer 源码解析
  • 渲染机制(三):Vsync信号
  • 渲染机制(四):硬件加速

页面渲染背景知识:

  • 页面渲染时,被绘制的元素最终要转换成矩阵像素点(即多维数组形式,类似安卓中的Bitmap),才能被显示器显示。
  • 页面由各种基本元素组成,例如圆形、圆角矩形、线段、文字、矢量图(常用贝塞尔曲线组成)、Bitmap等。
  • 元素绘制时尤其是动画绘制过程中,经常涉及插值、缩放、旋转、透明度变化、动画过渡、毛玻璃模糊,甚至包括3D变换、物理运动(例如游戏中常见的抛物线运动)、多媒体文件解码(主要在桌面机中有应用,移动设备一般不用GPU做解码)等运算。
  • 绘制过程经常需要进行逻辑较简单、但数据量庞大的浮点运算。

二、硬件绘制与软件绘制模型

在这里插入图片描述

  • 从上图结构可以看出,CPU的控制器较为复杂,而ALU数量较少。因此CPU适合进行复杂的逻辑运算,但不擅长数学尤其是浮点运算。
  • 和CPU不同的是,GPU就是为实现大量数学运算设计的。从结构图中可以看到,GPU的控制器比较简单,但包含了大量ALU。GPU中的ALU使用了并行设计,且具有较多浮点运算单元。
  • 硬件加速的主要原理,就是通过底层软件代码,将CPU不擅长的图形计算转换成GPU专用指令,由GPU完成。

扩展:独显与集显 (GPU是显卡的重要组成部分)。
独显:计算机中的GPU 有独立显存,显存可以保存GPU指令等信息。
集显:没有独立显存则使用共享内存的形式,从内存中划分一块区域作为显存,显存可以保存GPU指令等信息。

三、软件绘制刷新的逻辑

  • 默认情况下,View的clipChildren属性为true,即每个View绘制区域不能超出其父View的范围。如果设置一个页面根布局的clipChildren属性为false,则子View可以超出父View的绘制区域。

  • 当一个View触发invalidate,且没有播放动画、没有触发layout的情况下:

    • 对于全不透明的View,其自身会设置标志位PFLAG_DIRTY,其父View会设置标志位PFLAG_DIRTY_OPAQUE。在draw(canvas)方法中,只有这个View自身重绘。

    • 对于可能有透明区域的View,其自身和父View都会设置标志位PFLAG_DIRTY。

      • clipChildren为true时,脏区会被转换成ViewRoot中的Rect,刷新时层层向下判断,当View与脏区有重叠则重绘。如果一个View超出父View范围且与脏区重叠,但其父View不与脏区重叠,这个子View不会重绘。
      • clipChildren为false时,ViewGroup.invalidateChildInParent()中会把脏区扩大到自身整个区域,于是与这个区域重叠的所有View都会重绘。

四、总结

  • CPU更擅长复杂逻辑控制,而GPU得益于大量ALU和并行结构设计,更擅长数学运算。

  • 页面由各种基础元素(DisplayList)构成,渲染时需要进行大量浮点运算。

  • 硬件加速条件下,CPU用于控制复杂绘制逻辑、构建或更新DisplayList;GPU用于完成图形计算、渲染DisplayList。

  • 硬件加速条件下,刷新界面尤其是播放动画时,CPU只重建或更新必要的DisplayList,进一步提高渲染效率。

  • 实现同样效果,应尽量使用更简单的DisplayList,从而达到更好的性能(Shape代替Bitmap等)。

五、参考

  • Android硬件加速原理与实现简介
  • Android硬件加速从基础到原理
  • 硬件加速

相关内容

热门资讯

技术布道 | 推动XR技术在产... 近年来,越来越多的企业正在利用扩展现实(XR)为用户提供沉...
5.docker入门到精通—安... **面试题:**1-2 亿条数据需要缓存,请问如何设计这个存储案例&#x...
渗透学习-CTF篇-web-C... 文章目录前言web入门部分反序列化web254web255web256web257web258 前...
Golang在ACM模式下的刷... 受之前用C和C++刷题的影响,所有输入我都喜欢用scanf处理,恰恰golang也有scanf函数,...
【计量经济学】【高教版】第二次... 第二次作业: 教材:伍德里奇。计量经济学导论:现代观点(第五版)。 第三章习题:必做 1,2,5,6...
开源时序数据库学习 计划学习使用QuestDB解决大数据日志存储场景。以下是常见引擎比较 比较项目 InfluxD...
OpenGL学习日志之深度测试 为什么需要深度缓冲区? 当绘制一个四边形的时候,由于我们绘制的时候是一个...
JVM笔记(五)垃圾收集算法 垃圾收集算法当前商业虚拟机的垃圾收集器,大多数都遵循了“分代收集”(Ge...
Windows安装部署ngin... Windows安装部署nginx 1、官网下载安装包: 官网地址:ngi...
解决win10任何程序打开链接... 文章目录一、问题与修改原因1、着手修改吧2、弯路上探索3、发现祸根二、后话 文章原出处:...
JS中的数组 系列文章目录 前端系列文章——传送门 JavaScript系列文章——传送门 文章目录系列文章目录...
委外采购订单交期修改导致组件B... 我们公司对供应商的送货交期比较严,一般都要设置分批交货,因此需要经常批量维护计划行的交期,标准功能M...
一口一口吃掉yolov8(1) 1.目标 上一篇讲了怎么训练yolov8, 训练yolov8 但是如果只满足于此&#x...
使用大规模数据注释和深度学习对... 使用大规模数据注释和深度学习对具有人类水平性能的组织图像进行全细胞分割摘要绪论Mesmer2.1Me...
RPA学习-数组处理 RPA学习-数组处理 向数组中添加元素输出数组中某个元素获取指定类型数据查找数组元素下标修改数组元素...
解读 Servlet 源码:G... 解读 Servlet 源码:GenericServlet,Servlet...
GPT-4、百度文心一言摆擂,... 科技云报道原创。 一觉醒来,万众期待的GPT-4来了。OpenAI老板Sam Altm...
系统分析师每日练习错题知识点 计算机网络: RIP协议存在的一个问题就是当网络出现故障的时候,要经过比...
基于YOLOv5的舰船检测与识... 摘要:基于YOLOv5的舰船检测与识别系统用于识别包括渔船、游轮等多种海上船只类型&#...
[simulink] --- ... 1 matlab project的概念 什么是Project(Matlab/Simul...