【UnityShader入门精要学习笔记】(1)了解渲染流水线

在这里插入图片描述
本系列为作者学习UnityShader入门精要而作的笔记,内容将包括:

  • 书本中句子照抄 + 个人批注
  • 项目源码
  • 一堆新手会犯的错误
  • 潜在的太监断更,有始无终

总之适用于同样开始学习Shader的同学们进行有取舍的参考。


文章目录

  • 渲染流水线
    • 什么是流水线
    • 什么是渲染流水线
      • 应用阶段
      • 几何阶段
      • 光栅化阶段
  • CPU和GPU的通信
    • 把数据加载到显存
    • 设置渲染状态
    • 调用Draw Call


渲染流水线

什么是流水线

什么是流水线?书中举了一个生产洋娃娃的例子。一个洋娃娃的生成过程可以被分为4个步骤:

1. 制作躯干
2. 缝上眼睛和嘴巴
3. 添加头发
4. 最终包装

洋娃娃的制作经过了四道工序,如果每道工序耗时一小时。而一个工人想要生产一个洋娃娃则需要四个小时。资本家们想到了一个好方法,让每个专人负责一道工序,这样四个人四道工序,所有步骤就可以同时并行。假设工序1完成了洋娃娃A的躯干制作任务,那么他不需要等待洋娃娃A被最终包装就能直接进行下一个洋娃娃B的躯干制作任务了。

熟悉编程的小伙伴可能更了解它的另一个名字,就是PipeLine。例如很多程序都会封装一条Pipeline来自动化调用整条流水线。
在这里插入图片描述

那么显然,一个洋娃娃生产所耗费的最大时间将由其中最耗时的工序来决定。在了解了流水线的概念之后,我们来看看什么是渲染流水线?

什么是渲染流水线

实际上,计算机的图像渲染也是流水线工作,它的任务是由一个3D场景出发,渲染成屏幕显示的2D图像。这个工作常常是由GPU和CPU共同完成的。

根据书中的介绍,我们将整个渲染流水线分为三个阶段,分别为:

  • 应用阶段(Application Stage)
  • 几何阶段(Geometry Stage)
  • 光栅化阶段(Rasterizer Stage)

在这里插入图片描述

其中每个阶段内部也包含了一些子流水线阶段。

应用阶段

这个阶段是由我们的应用主导的,并通常由CPU负责实现。我们开发者具有这个阶段的绝对控制权。

在这个阶段,我们需要做的工作有:

  • 首先准备好场景数据,包括摄像机,视锥体,场景中的模型和光源等等。
  • 然后为了提高渲染性能,我们需要进行粗粒度剔除(Culling) 的工作,剔除不需要渲染的物体。
  • 最后,我们还需要设置好每个模型的渲染状态,包括但不限于其材质(漫反射颜色,高光反射颜色贴图)、纹理、使用的Shader等。(恰好部分内容在之前写的光照渲染笔记中粗略学习了)

这一阶段最终的输出是渲染所需的几何信息,即渲染图元(Rendering Primitives) ,通俗来讲,渲染图元可以是点,线,三角面(3d图形学中的面都是三角面构成的),这些渲染图元最终会被传入到下一个阶段——几何阶段

几何阶段

几何阶段通常在GPU上进行,用于和每个渲染图元打交道,决定绘制什么图元,怎样绘制它们,在哪里绘制。

几何阶段会进行逐顶点,逐多边形的操作,当然内部可以分为更小的流水线阶段。几何阶段的一个重要任务就是把顶点坐标变换到屏幕空间中,再交给光栅器进行处理。通过对输入的渲染图元进行多步处理后,这一阶段将会输出屏幕空间的二维顶点坐标信息、每个顶点对应的深度值、着色器Shader等相关信息、并传递给下一个阶段。

光栅化阶段

这一阶段将会使用上个阶段传递的数据来产生屏幕上的像素,并渲染出最终的图像,这一阶段也是再GPU上运行的。光栅化的任务最终决定每个渲染图元中的哪些像素应该被绘制再屏幕上,它需要对上一个阶段得到的逐顶点数据(例如纹理坐标UV,顶点颜色等)进行插值,然后进行逐像素的处理。同样的,光栅化阶段也可以分成更小的流水线阶段。

犹记得n月前初学Unity刚看到这些知识,看的云里雾里。现在再看,能够理解其中的流程,真是收获良多。

原作者注:
要把上面的3个流水线阶段和我们将要讲到的 GPU 流水线阶段区分开来;这里的流水线均是概念流水线,是我们为了给一个渲染流程进行基本的功能划分而提出来的(也就是渲染图像的三个主要阶段)。下面要介绍的 GPU 流水线, 则是硬件真正用于实现上述概念的流水线(也就是GPU的工作流程)。


CPU和GPU的通信

渲染流水线的起点是CPU,也就是之前提到的应用阶段。该阶段可大致分为下列3个阶段:

  1. 把数据加载到显存
  2. 设置渲染状态
  3. 调用Draw Call

把数据加载到显存

所有需要渲染的数据都是存储在硬盘(HDD)中的(例如模型的网格体,贴图纹理等数据),然后数据从硬盘被加载到系统缓存中(RAM),最终从系统缓存又被加载到显卡上的存储空间(Video RAM)。因为显卡对于RAM没有直接访问权限,而被加载到显卡的显存VRAM中则可以直接访问,并且显卡对于显存的访问速度显然更快。(为什么固态硬盘可以提高游戏渲染速度也是因为加快了数据从硬盘缓存到RAM的速度)

在这里插入图片描述
当然,真实加载到显存的数据要复杂得多,例如顶点位置信息,法线方向,顶点颜色,纹理坐标等等。

当数据被加载到显存后,显卡就可以访问了。那么RAM中的数据也可以被移除,不过某些数据依然需要CPU的访问(例如网格数据,我们需要CPU通过网格数据计算碰撞检测),那么这些数据是不会被移除的,因为数据从硬盘加载到RAM是十分耗时的。

此外,开发者还需要通过CPU设计渲染状态,来指导GPU的渲染工作。

设置渲染状态

渲染状态定义了场景中的网格是怎样被渲染的。例如使用哪些个顶点着色器(Vertex Shader)/片元着色器(Fragment Shader)、光源属性、材质等。这些都是我们可以在程序阶段进行自定义的:

在这里插入图片描述
(上图显示了使用同一种材质在不同渲染状态设置下最终渲染出的三个网格)

在准备好了上述工作后,CPU需要一个命令来通知GPU可以进行渲染了,这个渲染指令就是Draw Call

调用Draw Call

在Unity中渲染优化经常需要优化DrawCall ,那么Draw Call 到底是什么?实际上它就是一个调用命令,直译一下下,Draw(绘画)Call(指令)。就是CPU对GPU发起的调用指令。这个命令会指向一个需要被渲染的图元(primitives ,这个单词倒是挺常用,也可以指代操作系统中的原语)列表,而不包含任何材质信息——因为所有材质、纹理、着色器等数据信息都在上一步设置渲染状态时被打包好了,实际上DrawCall是图像编程的一个调用接口,是CPU与GPU间的一种通信,类似于CPU打电话通知GPU:“我这里用到什么,该怎么用都全部准备好了,目标是那个图元,剩下的你知道该怎么做。”
在这里插入图片描述

(上图展示了Unity中渲管线的渲染流程,蓝色部分代表了CPU处理,被我们称为预渲染,绿色的部分则是GPU的处理,其中我们发现在Unity中还提供了一个后处理阶段,可以进行二次处理)

通过对原理的学习,我们发现即使是不同的教程,其内部知识也是融会贯通的,更方便我们多方考证。

那么调用了DrawCall之后,GPU就会根据CPU设定的渲染状态和所有输入的顶点数据来进行计算,最终输出成屏幕上显示的那些漂亮的像素,这个计算过程就是GPU流水线!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/314278.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不吹不黑,辩证看待开发者是否需要入坑鸿蒙

前言 自打华为2019年发布鸿蒙操作系统以来,网上各种声音百家争鸣。尤其是2023年发布会公布的鸿蒙4.0宣称不再支持Android,更激烈的讨论随之而来。 本文没有宏大的叙事,只有基于现实的考量。 通过本文,你将了解到: Har…

【力扣题解】P106-从中序与后序遍历序列构造二叉树-Java题解

👨‍💻博客主页:花无缺 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 花无缺 原创 收录于专栏 【力扣题解】 文章目录 【力扣题解】P106-从中序与后序遍历序列构造二叉树-Java题解🌏题目描述💡题…

「网络编程」其他重要的协议或技术_ DNS协议 | ICMP协议 | NAT技术

「前言」文章内容是DNS协议、ICMP协议、NAT技术的讲解。 「归属专栏」网络编程 「主页链接」个人主页 「笔者」枫叶先生(fy) 目录 一、DNS协议1.1 背景1.2 域名简介1.3 域名解析的过程 二、ICMP协议2.1 ICMP简介2.2 ping命令2.3 traceroute命令 三、NAT技术3.1 NAT技术背景3.2 …

一起学Elasticsearch系列-写入原理

本文已收录至Github,推荐阅读 👉 Java随想录 微信公众号:Java随想录 文章目录 写入过程写操作写流程写一致性策略 写入原理RefreshMergeFlushTranslog图解写入流程 ES作为一款开源的分布式搜索和分析引擎,以其卓越的性能和灵活的扩…

跳跃表原理及实现

一、跳表数据结构 跳表是有序表的一种,其底层是通过链表实现的。链表的特点是插入删除效率高,但是查找节点效率很低,最坏的时间复杂度是O(N),那么跳表就是解决这一痛点而生的。 为了提高查询效率,我们可以给链表加上索…

Java EE Servlet之Cookie 和 Session

文章目录 1. Cookie 和 Session1.1 Cookie1.2 理解会话机制 (Session)1.2.1 核心方法 2. 用户登录2.1 准备工作2.2 登录页面2.3 写一个 Servlet 处理上述登录请求2.4 实现登录后的主页 3. 总结 1. Cookie 和 Session 1.1 Cookie cookie 是 http 请求 header 中的一个属性 浏…

JVM工作原理与实战(三):字节码文件的组成

专栏导航 JVM工作原理与实战 RabbitMQ入门指南 从零开始了解大数据 目录 专栏导航 前言 一、基础信息 1.Magic魔数 2.主副版本号 3.其他信息 二、常量池 1.案例解析 三、方法 1.方法介绍 2.案例解析 四、字段 五、属性 总结 前言 JVM作为Java程序的运行环境&…

什么是JavaScript

文章目录 一、❄️什么是JavaScript?二、❄️JavaScript的特点三、❄️JavaScript的组成🧫1、核心(ECMAScript)🧿2、文档对象模型(DOM)🥏3、浏览器对象模型(BOM&#xff…

linux 中 ext2文件系统实现

ext2文件系统结构 图片的svg下载链接(图中关于buffer的部分,上下两部分是重复的,是从不同维度下看的buffer结构) linux内核本身不提供ext2文件系统的格式化功能,可以参考busybox中对mkfs.ext2的实现(mkfs.…

msvcp140_1.dll丢失怎样修复,缺失msvcp140_1.dll是什么原因

在日常使用电脑的过程中,我们经常会遇到一些错误提示,其中之一就是“msvcp140_1.dll丢失”。那么,msvcp140_1.dll究竟是什么文件?为什么会出现丢失的情况?又该如何解决这个问题呢?本文将详细介绍msvcp140_1…

浅谈技术架构的演进过程

前言 最近在学习Redis、Doctor相关技术知识,它们与分布式系统有着很大的关系。 而对于分布式系统,它本身就是随着业务的不断推进,技术架构不断演进而得到发展和实现的。而所谓的分布式系统,实际上就是想办法引入更多的硬件资源&am…

D47|动态规划-子序列part2

392.判断子序列: 初始思路: 左为判断公共子序列,右为判断子序列,感觉代码完全可以套用,如果公共子序列的长度是较短的字符串的长度的话即输出true,如果不是即输出false。 class Solution {public boolean…