显卡
显卡,全称显示接口卡,又称显示适配器,是计算机最基本的配件之一,其主要功能是负责图形操作。显卡主要由GPU芯片、显存、散热器、PCB板和接口组成,其中GPU芯片的实力直接决定了显卡的整体性能。
显卡的性能指标包括GPU的频率、流处理器单元的数量、显存的容量、位宽和速度等。显卡根据应用场景不同可分为游戏显卡、科学计算加速卡和渲染专业卡。
2023年,显卡GPU芯片的主要制造商是NVIDIA、AMD和英特尔,它们都是美国电子产品开发公司,致力于各种核心芯片的研发。NVIDIA生产的显卡有GeForce RTX、GTX等。,它们被称为“N卡”;AMD主要开发镭龙系列,称为“a卡”。英特尔主要生产集成显卡。市场上的高端显卡主要在游戏体验、画面输出和使用流畅度等方面进行技术创新和迭代。
随着计算机领域进入统一渲染架构时代,显卡的重要性凸显。并且对架构进行了优化,使GPU能够完成大规模计算需求,NVIDIA CUDA技术进一步强化了这一功能。过去只能使用CPU进行计算的应用程序现在可以使用GPU进行计算,大大减轻了CPU的负担。
发展历史
早期发展
在微型计算机发展的早期,还没有显卡的概念,而是要显示的信息由CPU计算并输出到主板上由几个集成电路块组成的显示单元,然后转换成显示器可以识别的信号进行输出显示。但是,这种显示设备只能完成一些基本的显示功能。
真正显卡的诞生还要归功于新的显示模式的出现,因为在VGA标准出现之前,显示器支持的最大颜色数量只有8到16种,因此计算机系统和显示系统之间几乎没有需要处理的数据,色调也非常简单。然而,在VGA标准被采用后,尽管可用的颜色数量也是8到16种,但在模拟电路中,每种颜色可以用64种不同的亮度来表示。因此,系统支持的颜色数量已经达到了262,144和6,777,216种,也就是我们通常所说的256和24位颜色。这时,计算机设计师将具有显示功能的单元从主板上分离出来,并将其制作成专用显卡。但此时显卡体积庞大,功能单一,受接口限制速度较慢,但与板上的显示单元相比已经有了很大的进步。
开发期
显卡与主板分离后,与系统的数据传输主要依靠ISA和EISA总线接口。这时的显卡叫ISA显卡。然而,随着CPU频率的快速增长和计算机制造技术的发展,ISA总线的传输速度已成为限制显卡速度的瓶颈。随着PCI总线结构的出现,这一瓶颈已被突破。PCI总线速度最高传输速率可达132MB/S,显存容量也大大增加。此时显卡的显示效果和运行速度都得到了很大的提升。
但是,PCI显卡本身也有很大的缺陷。当要显示的画面质量过高,需要处理的数据过多时,就会出现停顿现象。对于要求更高的游戏来说,PCI显卡也暴露了它的缺点。这时,在英特尔的倡导下,AGP作为一种新型的显卡专用接口出现了。AGP采用DIME(直接内存访问),通过一个“额外接口”使显卡的核心芯片直接同步访问内存,这样AGP显卡就可以与CPU同步独立运行,比PCI更快。随着AGP速度的发展,AGP显卡可分为AGP1X、AGP2X和AGP4X。虽然PCI和AGP的带宽是32位,但由于频率提高到66MHz,AGP的传输速率可以达到266MB/S。然而,2X模式AGP的工作频率与1X模式一样保持在66MHz,但利用上升沿和下降沿在一个频率周期内触发两次,因此传输带宽再次翻倍,达到532 MB/s .至于AGP 4X模式,每个频率周期内可传输的数据宽度为16字节,最高传输带宽的理论值可达到1 GB/s以上
在这一系列技术的影响下。2000年,NVIDIA发布了具有历史意义的Geforce 2系列,其中包括众所周知的Geforce 2MX,它完美地取代了TNT2显卡,Geforce2MA400几乎是每个cs玩家的标配。然而,此时AMD和NVIDIA正在争夺霸权。2009年,AMD发布了最强的单核显卡HD5870,大幅领先于NVIDIA最强的单核显卡GTX 285,甚至与小型双核核弹GTX295打得你死我活。随后的HD9570更容易受到NVIDIA的攻击。因此,NVIDIA首席执行官黄仁勋开始打磨2010年3月发布的下一代GTX 480。玩家发现这一代旗舰GTX 480为了性能牺牲了功耗,并以接近500 W的全功耗压制了大核的HD5000系列
2012年,NVIDIA历史性的开普勒架构诞生,代表显卡是GTX 680。升级到28纳米技术的开普勒架构使显卡的核心频率首次超过1GHz,与GTX 580相比,性能提高了50W,功耗降低了50W。自这一代开普勒芯片发布以来,NVIDIA的发展速度超过了对手。
2013年底,NVIDIA发布了基于开普勒架构的GTX 700系列显卡,其中最引人注目的是GTX 780Ti,其性能超过了AMD的旗舰产品R9 290X,功耗降低了30W。英伟达火炉的帽子也被扔给了AMD。也是从这一代开始,NVIDIA开始销售名为TITAN的特殊显卡,面向顶级游戏玩家和研究人员。
NVIDIA下一代显卡GTX 900系列采用Maxwell架构,升级的重点仍然是提高能耗比。NVIDIA发现上一代开普勒架构削减了太多逻辑控制单元,导致CUDA冗余利用率低。这一代侧重于优化CUDA单元的分组。与GTX 780相比,第一代GTX 980的性能提高了30%以上,但功耗降低了10%。当时,由于CPU的故障,AMD没有资金维持新架构显卡的研发,因此只能在原有的GCN架构上缝缝补补。直到RYZEN系列处理器的成功,采用RDNA架构的RX系列显卡才得以推出。
但此时,NVIDIA已经开发了新的Pascal架构。依靠新的Pascal架构和台积电的16纳米技术,GTX 10系列显卡的性能提高了60%。再加上当时的采矿潮和AMD显卡的缺乏,GTX 1060诞生了。
在Pascal的显卡架构彻底击败AMD之后,NVIDIA仍然不满意。2018年,图灵架构显卡发布。这一代显卡最大的特点是增加了RT core和Tenser core,支持光线追踪和超分辨率采样技术。
如今,采用安培架构的RTX 3000系列显卡将光线追踪和DLSS推向了新的高潮,前三款显卡RTX 3070、RTX 3080和RTX 3090的性能大幅提升。这时,AMD已经被NVIDIA甩得太远了。NVIDIA中的光线追踪已经迭代了两次,在DLSS2.0技术的加持下,它的可用性很高。AMD近年推出的navi显卡未能冲击高端,此后再无大动作。
组成结构
独立显卡
独立显卡的组件有:GPU芯片、显存、散热器、PCB板、接口、显卡背板和圆顶。
GPU芯片:即图形处理器,芯片的实力直接决定了显卡的整体性能,而影响GPU芯片性能的主要参数有GPU架构、制造工艺、GPU芯片频率、流处理器单元SP、纹理单元和光栅单元。
显存:负责存储显示芯片需要处理的各种数据。主流显存容量一般为6 GB-8 GB。目前消费级显存已经达到24GB,专业级显存更大。目前常见的显存类型有GDDR6和GDDR6X,显存的带宽和容量会影响显示效果。
散热器:GPU芯片和内存颗粒极易发热,温度过高会降低频率,导致显卡性能下降,所以显卡基本上都需要一个好的散热器。散热器一般由铜热管、铝散热片和冷却风扇组成。理论上,温度可以超过90度。
PCB板:PCB板主要负责供电。PCB板的电路越复杂,层数就越多。
接口:市场上主要使用PCI Express的图形接口(ISA EISA VLB MCA等。都是独立显卡使用的接口),中高端显卡可以支持多片同时工作,并且可以通过网桥连接。
显卡背板:主要支撑散热器(防止散热器压弯PCB),阻挡静电,防止灰尘,这是背板的另一个重要作用,所以背板其实是必不可少的部件。
导流罩:对于带涡轮风扇的散热器来说,导流罩尤为重要,因为涡轮风扇是定向的,风很大,导流罩是封闭的,加强了风道,这种散热器需要将风吹到机箱外面。
集成显卡
集成显卡是指芯片组具有集成的图形处理芯片,使用该芯片组的主板无需单独的显卡即可完成基本的图形处理功能,以满足普通家庭娱乐和商业应用的需求。与独立显卡相比,集成显卡通常没有独立显存,而是使用系统主存的一部分作为显存,具体数量根据系统需求自动动态调整。界面也不同。独立显卡在连接显示器之前需要通过专用接口连接到主板上,而集成显卡则直接集成在主板上,没有其他接口,更加简洁。
技术指标
核心架构
架构其实是影响显卡性能的最重要指标,而新一代架构的出现通常意味着产品的升级。你可以这样理解架构,它就像整个显卡的枢纽,就像城市的道路规划一样。在同一个城市里,如果道路规划得好,交通拥堵的可能性就会降低,你到达目的地的时间也会缩短。几乎所有玩家都可以区分显卡的核心,因为NVIDIA在销售时会以芯片型号命名显卡型号,例如RTX 2060和RTX 2070,您一眼就可以知道哪种性能更好。
技术流程
和CPU一样,显卡也有进程。目前n卡(NVIDIA)最低制程为8 nm,a卡(AMD)最低制程为7 nm。更小的工艺意味着更低的功耗和发热量,因此数字越小越好。但是,显卡的整体性能不仅由该值决定。
容量:它指示可以保存多少数据。
频率:在某种程度上,它反映了显存的速度,而显存的频率与显存的类型有很大关系。显存的频率与显存的时钟周期有关,两者是倒数关系。
位宽:位宽是指一次可以读入的数据量,即显存和显示芯片之间的数据交换速度。位宽越大,存储器和显示芯片之间的数据交换就越顺畅。
流线处理:流处理器单元的数量是决定显卡性能的一个非常重要的指标。它可以执行顶点操作和像素操作。在不同场景下,显卡可以动态分配流处理器的数量进行顶点运算和像素运算,从而充分利用资源。
产品分类
按市场分类
专业显卡:专业显卡,常用于工作站,主要用于专业视觉设计和创作。在图形工作站中,它在某种程度上甚至比CPU更重要。与主要面向游戏、娱乐和办公市场的消费级显卡相比,专业显卡主要面向三维动画软件(如3DSMax、Maya、Softimage|3D等。)、渲染软件(如LightScape、3DSVIZ等。)、CAD软件(如AutoCAD、Pro/Engineer、Unigraphics、SolidWorks等。)等领域。
独立显卡:独立显卡是将显示芯片和相关设备做成独立于电脑主板的板卡,成为专业的图像处理硬件设备。独立显卡不占用系统内存,在架构、流处理器数量、核心频率、显存和位宽上明显优于集成显卡。在方便性方面,独立显卡可以拆卸,因此如果显卡配置较低且更换操作方便快捷,则需要将集成显卡与主板一起更换。在价格、功耗和兼容性方面,集成显卡优于独立显卡,集成显卡集成在CPU中,无法升级,因此不存在所谓的升级成本。独立显卡虽然性能强,但发热量和功耗都比较高。
集成显卡:与独立显卡相比,集成显卡一般没有显存。它依靠系统中的部分内存作为主内存,具体数量根据系统的需要动态调整。一般来说,集中显示或核显的性能远远不如独立显卡。只有一些高端核显可以与入门级独立显卡的性能相提并论,因此集中式显示器通常不适合用于执行3D游戏或精确的图形操作。
用领域分类
游戏显卡:游戏显卡旨在满足玩家对高清晰度、高帧率和流畅游戏体验的需求。游戏显卡通常具有更高的图形处理能力和更快的渲染速度,以满足游戏中需要处理的大量图像和动画数据。
专业显卡:专业显卡旨在满足专业图形应用的需求,例如3D建模、渲染、视频编辑和CAD。专业显卡通常具有更高的精度和更宽的色彩空间,以满足专业图形应用中对精细细节和色彩精度的要求。
AI/深度学习显卡:AI显卡主要用于深度学习等高性能计算任务,需要强大的浮点计算能力、高速内存带宽、大容量内存和优化的软件驱动。游戏卡主要用于图形渲染等娱乐用途,这需要高频的核心时钟、多样的输出接口和良好的散热设计。因此,AI显卡和游戏卡在硬件架构和设计上存在很大差异,这导致AI显卡的成本远高于游戏卡。
市场定位分类
这种分类主要针对消费级独立显卡,包括入门级显卡、主流显卡、高端显卡和旗舰显卡。
入门级显卡:入门级独立显示器是一款性能较低的显卡,定位于观影和办公级别。
主流显卡:这个级别的显卡也称为性能级显卡,性能强劲,价格实惠。
高端显卡:高端显卡是指价格高、性能优的显卡产品,一般面向游戏玩家、设计师等对性能要求较高的用户。
旗舰显卡:旗舰显卡是指这类显卡在所有显卡中价格最高,性能最好。
特征函数
显卡除了输出显示画面、保持画面稳定流畅播放等基本功能外,越来越强调高帧数和高分辨率。尤其是近年来,为游戏推出的特殊显卡增加了光线追踪、DLSS、FSR和XeSS等功能,使玩家在玩游戏时更具沉浸感。
光线追踪:光线追踪是一种计算视线观察画面的路径,找到反射器和相应的光源,然后模拟照明效果的技术。
DLSS:初衷是超分辨率技术,即通过显卡渲染一张低分辨率的图片,然后由AI渲染一张高分辨率的图片进行学习。
FSR:FSR用于在相同分辨率和图像质量设置下提高游戏帧率并改善玩家的游戏体验。
Xess:Xess是一种超级采样技术,它使用机器学习将低分辨率帧重建为高分辨率帧,可以在低配置下显著提高游戏的流畅性。