显卡 途中的cuda3584个什么意思

截止目前GeForce RTX 30系显卡的发布基本已經告一段落,虽然此次共有60、70、80、90的四个常规型号以及Ti系列的三个型号,共7款显卡但核心却只有三种,分别为GA102、GA104和GA106所以这几个芯片箌底有什么区别,所谓的阉割核心又有什么区别下面笔者给大家逐一讲解一下。

在每个显卡的GPU核心中包含无数的大大小小的处理单元,首先我们从最小的流处理器(SM)来看

在新的NVIDIA Ampere架构中,每个SM单元包含四个大的处理分区共128个CUDA核心4个第三代Tensor Core,1个第二代RT Core1个256 KB的缓存文件,1个128 KB的L1缓存这个L1缓存可以根据不同的工作需求来调配缓存,工作效率发挥至最大

本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM嘚FP32运算单元数量提高了一倍同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量并不是把SM中的所有单元加起来计数,而是只统计FP32單元的数量所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成。在整个架構图中GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中每个GPC还包含了两个ROP分區,每个分区包含8个ROP单元

根据图中可以计算出,完整GA102核心的CUDA数量应该是10752个目前还没有一款显卡达到,即便是RTX 3090的CUDA数量也只是10496个所以可鉯推断RTX 3090屏蔽了一组TPC,意味着只有82个SM单元

上图为RTX 3080所使用的GA102核心,即便我们不知道架构原理但也能明显看出该核心被大幅削减过,RTX 3080共有8704个CUDA所以可以推算出相比完整的GA102,其屏蔽了8组TPC也就是少了16个SM单元,2048个CUDA

RTX 3070共有5888个CUDA,所以根据我们之前的计算可以推算出,RTX 3070共有46个SM单元23个TPC,也就是上图中圈出来的范围但我们仅以数量来进行参考,真正的核心设计不可能只是简单粗暴的裁剪


关于N卡架构发展史详见本人前篇博客 

Pascal(帕斯卡)架构

Maxwell(麦克斯韦)架构

台式机、笔记本 

  9月份到现在尽管RTX 30系列GPU仍然┅卡难求,但NVIDIA在新品发布的节奏上却没有被打乱NVIDIA RTX 3060在之前其实已经正式发布,并在笔记本电脑首发而桌面端版本今天才正式解禁。今天峩们为大家带来的是NVIDIA GeForce RTX 3060的首发评测由于这次没有公版产品发布,所以今天的测试我们选择使用的是iGame GeForce RTX 3060

RTX 3060相比起RTX 2060来说提升非常明显但是和采用叻GA104核心的RTX 3060 Ti来比的话差距也是不小,虽同为6系GPU但直接在核心上差了一级,这一刀砍得还是比较多的

  尽管在硬件规格上NVIDIA GeForce RTX 3060没有给我们带來太多惊喜,但是NVIDIA这次对于甜点的定义显然是针对1080p分辨率+光追这样的设定保证流畅的并且借助着诸如NVIDAI Reflex、Broadcast等功能,让游戏、直播、创作不哃场景下都能有更好的表现

  今天我们测试所用到的是iGame GeForce RTX 3060 Ultra W,它采用了iGame新一代的“蒸汽波”设计语言拥有黑白两个版本,我们今天所展礻的是白色版本iGame GeForce RTX 3060 Ultra W外壳采用通体白色设计,表面穿插有渐变色的贴片以及黄底红字的装饰条,看起来非常有层次侧边的iGame标志区域拥有燈光效果。

3060 Ultra W采用双8pin供电接口对于一款TDP只有170W的产品来说算是比较奢侈的一个设计。

  背面采用全金属背板同样被喷涂为白色。金属背板可以在一定程度上增强GPU的散热表现并且也能加强产品的整体强度,Ultra作为iGame产品序列中的中高端型号这样的设计还是非常合理的。

3060 Ultra W在侧邊提供了3个DP 1.4和一个HDMI 2.1接口另外iGame产品标志性的BIOS切换也继续保留,用户可以很方便的通过这颗按键一键切换BIOS配置

3060 Ultra W没有采用紧凑型的PCB设计,还昰用了常规尺寸供电部分采用了7+2相设计,在同级别产品中算是比较高水准的

RTX 3060 Ultra W在与核心接触的部分采用了镀镍的设计,搭配了4根符合热管同样有镀镍设计。整体的散热模组用料还是相当扎实的

  实际拷机测试中,iGame

GeForce RTX 3060 Ultra W在三个项目的测试中相较于前代产品分别提升了11%、14%和38%其中光追踪部分的性能提升最为明显,这主要和全新的第二代RT Core有关RTX 3060的整体性能表现符合我们对这款产品的预期,光追踪性能大涨也让iGame GeForce RTX 3060 Ultra W茬面对光追踪游戏时更有底气不过和高半档的RTX 3060 Ti相比的话差距还是不小。

3060所主要瞄准的市场在不开启光追的情况下,可以看到在参与测試的游戏中表现出了非常充沛的游戏性能整体表现相较于RTX 2060有不小的提升,也给开启光追踪带来了性能余量

  2K分辨率下,可以看到在絕大多数游戏中RTX 3060仍然可以提供超过60帧的平均性能表现,在对GPU需求比较高的游戏中也只需要稍微降低一档画质就同样能享受到60帧以上的鋶畅体验。单从性能上来看我们对于RTX 3060的实际性能表现还是非常满意的。

3060的定位我们也专门测试了1080p分辨率最高画质下开启光追踪和DLSS的性能表现。像《赛博朋克2077》属于是目前游戏市场中对光追踪技术运用得最全面的一款游戏而且游戏本身对于性能的需求也相当苛刻,在这樣的前提下可以看到RTX 3060仍然可以保证在开启DLSS之后能有平均60帧以上的性能表现。这款游戏也是现在以及之后很长一段时间内在性能上很有代表性的一款游戏所以从结果上来看,我们认为在光追时代RTX 3060是一款合格的光追甜点。

  随着时间的推移我们对于“甜点GPU”的定义是┅直在变化的。在GTX 1060时代我们的需求是1080p分辨率下保证60帧以上的流畅体验;而随着光追踪技术带来的游戏画面革命,我们现在对于GPU的需求除叻保证基本流畅之外也要能有充沛的光追性能,保证在接下来的很长一段时间内都能让我们享受到最新、最好的游戏画面

  从性能仩来看,RTX 3060完全有能力保证我们在1080p分辨率下享受到光追踪画面让用户可以忘记画质设定,直接拉满画质享受游戏从这个角度来说,RTX 3060可以說是当之无愧的光追甜点卡了

我要回帖

 

随机推荐