FluidMark(流体模拟检测硬件性能测试)好不好

{{data.item.arttitle}}
作者 {{data.item.artauthorname}} {{data.item.artcreatetime}}
请使用浏览器的分享功能分享到微信等1012 条评论分享收藏感谢收起<div id="click_content_aid_
<div id="favrite_content_aid_
Radeon Vega Frontier显卡专业测试:距离胜利只差一点应用优化
Radeon Vega Frontier显卡专业测试:距离胜利只差一点应用优化
18:01&&|&&作者:
&&|&&关键字:,,,
这次我们让AMD Radeon Vega Frontier显卡做回本行工作——只做专业测试,6款专业测试软件共47个专业测试子项,并且携带上好朋友Radeon Pro Duo(Polaris 10 x2)以及假想敌NVIDIA Quadro P5000,三款专业卡将同场较量。
本文约5307字,需9分钟阅读
AMD RX Vega性能解禁在即,相信大家一定很兴奋,“吹”了将近一年的Vega显卡终于要用真面目示人了。之前我们曾经用AMD Radeon Vega Frontier Edition开发者卡来打过游戏——《》,发现其性能大约是在其竞争对手NVIDIA GTX 1080、GTX 1070之间,但部分游戏成绩甚至不如GTX 1070。经过向AMD驱动部门沟通得知,尽管Radeon Vega Frontier Edition驱动中拥有一个Gaming Mode,但是这个切换的仅仅是驱动UI界面,而非驱动本身,驱动还是偏向于专业开发者的方面,直接用于游戏是不合理的。因此我们决定让AMD Radeon Vega Frontier显卡做回本行工作——只做专业测试,6款专业测试软件共47个专业测试子项,并且携带上好朋友Radeon Pro Duo(Polaris 10 x2)以及假想敌NVIDIA Quadro P5000,三款专业卡将同场较量。AMD Radeon Vega Frontier Edition:Vega显卡作为AMD今年重头大写之一,当然是万众期待。Radeon Vega
Frontier作为首批与我们见面的Vega架构显卡,它身上的秘密已经被探索得非常透彻了。Radeon Vega Frontier
Edition首先可以确认是满血版的Vega核心,也就是64组NCU单元,每组64个共同构成4096个流处理器,256个纹理单元,64个光栅单元,4MB的L2缓存。8GB的HBM
2显存,位宽为2048bit,而显存带宽高达484GB/s。其余更多新特性可以参考上一期的《超能课堂(99):揭秘AMD Radeon Vega架构新玩意》,绝大部分疑惑都可以在里面找到答案。这里我们主要谈一下Vega架构中关于NCU单元(Next-Generation Compute
Engine)的事情,一般来说3D游戏渲染对于FP32单精度要求是比较高的,不过在专业深度计算上对FP16半精度更为青睐,毕竟性能好、功耗低,也因此AMD在Vega最新的微架构(估计会延续过去叫GCN
X.X,暂未公布)中引入了紧缩的半精度计算支持,可以灵活地使用NCU单元的ALU算术逻辑单元支持FP16、FP32计算。因此基于Vega架构的Radeon
Instinct MI25计算卡其FP32单精度浮点性能12.5TFLOPS,而半精度FP16性能直接翻倍到25TFLOPS。稍微遗憾的是,目前除了实际应用中使用到FP16单元,可复现、标准FP16性能测试基本是没有的,即使有也是模拟出来FP16性能,并不准确,如果大家有什么好的测试意见,欢迎向小超哥微信9501417提出。测试驱动为:Radeon(TM) Vega Frontier Edition Driver 17.6AMD Radeon Pro Duo:最近Vega显卡锋芒毕露,大家注意力都被吸引过去了,甚至不知道有一张双Polaris 10核心的专业卡存在吧。虽然它命名为Radeon Pro
Duo,但此Radeon Pro Duo非彼Radeon Pro Duo,不是我们之前熟知的基于双Fiji核心的Radeon Pro Duo。新的Polaris架构Radeon Pro
Duo拥有36*2组CU单元,共2304*2个流处理器,核心频率1243MHz,单精度浮点运算能力为11.45TFLOPS(旧版Radeon Pro
Duo为16.4TFLOPS),显存位宽256bit*2,显存频率1750MHz,显存带宽448GB/s(旧版Radeon Pro
Duo为512GB/s,因为用的HBM显存)。从性能上来看,当然是旧版的Radeon Pro
Duo更胜一筹,但是付出了以功耗、散热为代价,350W的以及水冷散热都是玩家的痛。使用Polaris架构的新Radeon Pro
Duo显然更加符合实际需求,尽管性能能够缩水了1/3。不过在NVIDIA、AMD均宣布不再重点支持多卡SLI、Crossfire以后,两家公司将会以发展更高性能单为主要目标。毕竟多卡互联之后性能提升大家有目共睹,1+1=1.4已经是非常好的结果,剩下全都要靠驱动重点优化才有“神油”效果,在这方面付出太多显然太不划算了。尽管双芯卡性能要比一般的2Ways
Crossfire性能要好,但是并不适合游戏,对于专业级用户来说还是有一定价值,毕竟部分渲染、计算就是需要暴力堆砌流处理器驱动,越多越好。这种任务的流程简单,就像跑着固定的流水线上,不像游戏场景那么复杂多变,只要处理单元越多,性能当然越好。测试驱动为:Radeon Pro Software Enterprise Driver 17.Q3NVIDIA Quadro P5000:Quadro P5000显卡有一个大家都熟悉的身份,那就是Pascla显卡的先锋GTX
1080,他们直接的硬件规格都是一模一样的——GP104-400核心。GP104-40核心拥有20组SM单元,每组SM单元有128个核心,一共2560个,首次搭配了与美光联合开发的8GB
GDDR5X显存,主要是显存频率更高了,飙到10Gbps,间接地弥补了GDDR5显存带宽比不过HBM显存弊端。而作为专业卡的Quadro P5000显然对显存大小更为敏感,NVIDIA为其增加了一倍的GDDR5X显存,双面布局共16GB。如果你要问,Quadro P5000用的GP104-400与Quadro
P6000的GP100核心有什么区别?这个区别可就大了,GP104本来就是针对游戏市场,还记得Maxwell架构显卡超高能耗比怎么来的吗?就是砍FP64双精度单元,从GP100核心FP32:FP64的1:2超高比例,砍到GP104-400的1:32,这个刀法可是非常厉害的。而AMD Radeon Pro Duo的FP32:FP64比例为1:16,而AMD Radeon Vega Frontier
Edition目前还不好说,AMD官方还没有公布详细的架构示意图。不过Vega架构总算是引入了FP16半精度单元,如果有需要也可以重新“组装”成FP32单精度单元,而NVIDIA引入FP16单元已经有相当长一段时间,因为NVIDIA涉足人工智能、大数据处理、机器学习已经挺久了,这些应用对于运算精度要求并不好,FP16不仅速度快,而且功耗更低,非常适合。NVIDIA为了应付即将爆发的深度学习领域需求,已经大胆地在下一代Volta架构的Tesla
V100引入了Tensor单元,这种单元与深度学习计算性能高度相关,性能非常可怕,在FP32:FP64:Tensor单元比例为8:4:1下,Tensor性能就高达120TFLOPS,NVIDIA已经未雨绸缪。测试驱动为:QUADRO DESKTOP DRIVER RELEASE 384 U2 (385.12)测试平台:
AIDA64是我们熟知的一个测试软硬件系统信息工具,内置了多个简易拷机、Benchmark测试程序,可以供我们快速查看硬件的真实性能水平。而一般测试GPU、APU性能都会用到AIDA64 GPGPU
Benchmark,这是一个相当基础的测试程序,包含了显存读写复制速度、单/双精度浮点性能/应用、24/32/64位整数运算、AES-256/SHA-1
Hash性能运算成绩。这个环节我们只比较Single-Precision FLOPS(单精度浮点性能)、Double-Precision
FLOPS(双精度浮点性能)、Single-Precision Julia(单精度浮点应用,主要是运行游戏时用到)、Double-Precision
Madel(双精度浮点应用,主要影响Matlab、流体力学绘图这类对于高精度的科学运算上)。小总结:从AIDA64 GPGPU测试成绩来看,AMD Radeon Vega Frontiers Edition似乎大获全胜,无论是单精度、双精度理论性能还是应用场景性能,但是这个并不符合实际情况,虽然P5000浮点性能确实落后于AMD Radeon Vega Frontiers Edition,但是这个幅度太大了,重复测试也是如此。显然是测试具有一定偏向性(或者NVIDIA Quadro P5000没有设置好)。LuxMark考验的是OpenCL运算能力,设置为GPU-Only模式,即可单纯考验显卡GPU的性能。进入软件后单独测试三个场景:Hotel
lobby、Neuman TLM-102 SE、LuxBall HDR。小总结:Luxmark显然能更加重复调动Radeo Pro Duo的性能,成绩远超其余两张卡成绩,NVIDIA Quadro P5000依然大幅度落后。CineBench测试在很多CPU、GPU性能展示或者是超频环节中经常可以看到它的身影,使用针对电影电视行业开发的Cinema
4D特效软件引擎,是一套具有相当大说服力的CPU和程序。测试分别针对处理器和显卡的性能指标,有两种测试方式,既可以测试CPU单线程/多线程邢恩能够,可以用使用显卡运行程序得出OpenGL性能。在OpenGL中,会实时渲染一段高精度跑车的视频。小总结:Cinebench R15作为最常见的测试软件,显卡测试使用的是OpenGL,在这次显卡测试NVIDIA P5000成绩就要好于Vega Frontier,不过这种测试对于AMD Radeon Pro Duo双芯卡就是不太友好,软件会识别成两张显卡,测试的时候只能调动到一个核心运算,所以成绩偏差。ComputeMark由捷克硬件和游戏网站CzechGamer.com的Robert Varga完成开发,核心技术来源于Jan
Vlietinck的Fluid3D Demo,号称是“第一个百分之百的DX11 Compute
Shader(计算着色器)基准测试工具”,能够调动99%的GPU资源,CPU占用率极低,重点考察显卡GPU通用计算性能。小总结:ComputeMark测试针对的是计算着色单元,数量越多自然越占优势。按道理,应该是Radeon Pro Duo占优,可惜ComputeMark仍然仅支持一个核心测试,最终Vega Frontier以1818分第一,Quadro P5000第二
Sisoftware Sandra
2017是目前最强大、最优秀的一款计算机硬件检测与性能测试软件,拥有系统性能测试、硬件检测、软件检测、电脑高强度压力测试、cpu显卡压力测试等30多个功能模块,并支持客户端和服务器两种工作模式,能够全面帮助用户检测计算机硬件和软件,并以直观的图表方式展示你的电脑各种性能。最方便的还是Sisoftware拥有自己的产品数据库,你可以联网下载数据进行直观对比,从而或者你的硬件水平处于什么样的高度,并且及时发现问题。本次测试中,我们挑选了其中7个与显卡性能有密切关系的测试项目,包括:Sisoftware Sandra 2017 SP1-Processing测试——通用计算,单/双/四/精度浮点性能。总结:单精度测试结果是没有问题的,而且成绩都超过官方提供的数据,但是双/四精度上P5000再次出现了问题,双精度成绩只有0.44GPixel/s,远落后于其余两张卡,四精度成绩也是如此。Sisoftware Sandra 2017 SP1-Cryptography测试——加密/解密运算性能,包含AES-256和SHA2-256加密测试中,无论是AES还是SHA2算法,Vega Frontier都以绝对优势领先,很多人都在说Vega显卡挖矿性能如何厉害,这个也其实关系显卡的哈希算法性能,根据小编测试,使用ClayMore V9.8软件挖ETH,性能大概在35-38MH/S左右,远没有传闻中的100MH/s那么高。Sisoftware Sandra 2017 SP1-Financial Analysis测试财务分析,包含一些比较复杂的金融模型,例如布莱克—斯克尔斯-默顿期权定价模型、欧式二次项定价模型、欧式蒙特卡洛期权定价模型财务分析测试中都是一些比较复杂的金融模型算法,AMD显卡都有非常好的表现,NVIDIA性能稍差。Sisoftware Sandra 2017 SP1-Scientific Analysis测试——科学分析,如矩阵乘法运算、快速傅里叶变换、N体数值模拟计算Sisoftware Sandra 2017 SP1-Image Processing测试——图像处理,使用各种卷积滤波、索贝尔算子、中值滤波、量化滤波、随机算子进行图像运算处理在图像渲染测试环节,测试场景很多,都是使用不同算子对大尺寸图像进行计算出新的图像,可以看到不同显卡对于算子、滤波器有着不同性能表现。Sisoftware Sandra 2017 SP1-Video Shader Compute测试——视频渲染性能,单/双/四/精度浮点性能Sisoftware Sandra 2017 SP1-Transcode测试——转码性能,VC1转H.264,H.264压缩转码测试中,NVIDIA P5000一骑绝尘,速度远超越AMD显卡。
SPECviewPerf是一个专业级、符合工业标准的OpenGL图形显示卡效能测试分析软件,使用C语言编写,用于测量运行在OpenGL应用程序接口之下硬件的3D图形性能。而此次测试我们选择的是最新版的SPECviewPerf
12,其包含8个专业图形测试场景,Energy、Medical、Catia、Cero、Maya、SNX以及主要基于OpenGL
4.0架构的Solidworks和首次添加基于DirextX架构的Showcase。CATIA-04测试的项目包括线框图、抗锯齿、着色图、轮廓线加强着色图、阴影遮蔽、景深及环境光遮蔽等,合计有14个测试子场景。测试的模型大小涵盖510万顶点到2100万顶点数量,测试结果越高越好。Creo-01测试包含了多个PTC Creo
2支持的渲染模式,例如线框图、抗锯齿、着色图、轮廓加强着色图、着色倒影图等。测试的模型大小从2000万顶点到4800万顶点。Energy-01重点针对的是地震、石油及天然气勘探领域的实体渲染应用,因此对工作站系统内存和显卡显存的容量需求极高(分别不低于12GB和4GB)。Maya-04测试模型是包含72.75万顶点的电力厂场景,测试内容相当丰富,包括着色、屏幕空间蔽塞着色、屏幕空间蔽塞着色多采样抗锯齿、屏幕空间蔽塞着色多采样抗锯齿+浮点渲染对象、屏幕空间蔽塞着色多采样抗锯齿+浮点渲染对象+权重平均式半透明、线框图。3damax-05基于3ds Max 2015软件,包含了11个建模场景,测试显卡渲染不同材质物体的性能。Medical-01测试比较偏重纹理处理和显存带宽的压力,即考验CPU和显卡的能力。Showcase-01基于Autodesk的Showcase
2013软件,测试用的模型顶点数量800万个,SPECviewPerf首次引入的DirectX渲染测试项目。SNX-02测试基于Siemens NX 8.0软件,同样包含两个测试模型,模拟场景是大型装配设计和组装,测试模型顶点数量为715万到845万顶点。SW-03测试模型规模范围从210万顶点到21000万顶点,测试包括着色图、边缘着色图、环境光吸收等测试项目。这是针对Solidworks用户而特别设计的测试。SPECviewperf更加偏向于专业应用测试方向,所有测试成绩都是基于真实应用场景,并且一定方式给显卡运行情况进行打分,最后汇总出结果。由于测试都是跑在专业软件上,对于长期使用这类型的开发者来说,这种测试结果显然更加符合预期和真实性能。
在这个测试中,我们看到在此前测试并不占优的NVIDIA Quadro P5000成绩就发力了,大部分测试场景都能先拔头筹,领先于Radeon Vega Frontier显卡。
总结:AMD Radeon Vega Fronier基准成绩不错,但实际应用上稍差。从前面数十个测试项目来看,AMD Radeon Vega Fronier实力不凡,在很多基准测试中,成绩都是领先于Radeon Pro Duo和Quadro P5000,从侧面上就反映了AMD对Vega架构持续深入地研究是有成效的。但是在实际测试过程中,Radeon Vega Fronier成绩与Quadro P5000还是有些差距,NVIDIA在应用上的优化还是更好一些,AMD可能就是输在了应用优化上。
本文读者还喜欢
我们已经启用HTML5图表,如果看不到,请换一个浏览器
不是A粉说这是专业卡,跑游戏不公平的,但AMD官方有游戏驱动视而不见……NV专业卡跑游戏测试和游戏卡差不多视而不见……AMD拿这个卡和泰坦比专业测试视而不见,这种东拉西扯视情况利弊来田忌赛马 无赖撒泼本身是A炮搞出来的。
已有1次举报
该去看眼科了。
游客:买专业卡挖矿怕是回不来本。
话说vega性能啥时候解禁?
挖矿的只能当挖矿软件去优化,用现成的软件不能说明什么问题,之前的北极星 fiji 帕斯卡显卡挖矿的软件可是更新了十多个版本才能到现在的速度。
你看到哪儿爆了?
但是在实际测试过程中,Radeon Vega Fronier成绩与Quadro P5000还是有些差距,NVIDIA在应用上的优化还是更好一些,AMD可能就是输在了应用优化上。
买专业卡挖矿怕是回不来本。
话说vega性能啥时候解禁?
(你可匿名或登录后发表评论。没有帐号可,或使用和直接登录)
超能网萌萌哒萌新编辑~ (づ ̄ 3 ̄)づ年龄9岁半,别跟我讲道理,没用!
扫一扫右边的二维码
关注超能网微信账号
建兴T10 PLUS 256GB 特卖~
618购物节导购
高通骁龙845手机都有哪些可选?
哪台手机玩吃鸡手游够煞食?【图片】显卡理论计算能力与核心频率计算公式谁知道_显卡吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:3,300,116贴子:
显卡理论计算能力与核心频率计算公式谁知道收藏
如果7850核心频率一样的频率
那理论计算能力是多少呢
7870在1G是2.56TFLOPsMHZ时候是1.76TFLOPs
那7850 1G时候是多少呢
显卡带宽计算=工作频率×位宽÷8
其中工作频率是指
还是指 显存频率
比如HD4830 的 核心是575
显存是1800
这个卡的带宽怎么算?显存带宽=工作频率×显存位宽/8理论上工作频率大一倍可以抵消显存位宽少一半的缺陷
公式:可参阅具体数据参阅
与其在这问不如去查各家的pdf
flops有鸡毛用?
AMD和NVIDIA通用计算解析
跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信,对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out(流输出)特性,最典型的例子就是PhysX物理加速特效。PhysX最早是Aegia公司推出的硬件级物理加速技术,NVIDIA将其收购之后便通过CUDA环境将PhysX软件化,由显卡中的shader单元承担物理加速特效的运算。
对于Stream技术,AMD宣称可让显卡内数百个平行串流核心,为各种一般用途的应用带来加速的效果,打造各种优异的平台,并可大幅提升每瓦性能,而实现这一点的前提就依赖于AMD独特的流处理器单元设计。
GF100的512个CUDA核心都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法,而后者在过去只是模拟的,事实上仅能计算24-bit整数乘法;同时全面引入的还有积和熔加运算(Fused Multiply-Add/FMA)。此外双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD从R600开始到现在的Cypress核心都是1/5,没有做任何变化。
GPU暴力破解密码:A卡遥遥领先
遗失密码是一件令人相当烦恼的事,尤其因忘记工作文档密码所做造成的金钱损失更是十分“杯具”,如何快捷高效地找回密码是件难事。现行GPU的发展越来越强势,通用运行能力已经远超于CPU,而CPU的运行能力却是有限的,所以能够发挥出GPU强大的通用运算能力定必会大大缩短破解密码的时间。
GPU就是显示卡的“心脏”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能外,还有着大规模的并行计算能力,可以让开发人员领先出引人入用的消费级和专业级的计算应用程序。无论是NVIDIA的CUDA或者是AMD的Stream运算,都是众多软件厂商所追捧的。
我们找来了Elcomsoft出品的Advanced Office Password Recovery,是一款同时支持CPU与GPU的Office密码恢复软件。最多可支持32个CPU或内核和8个GPU同样运行,也可以指定全部或者是部分CPU/GPU核心进行恢复密码的工作。
测试中我们关闭所有CPU核心,完全由GPU独立工作来破解一个由6位数字加密的Word文件。
密码破解对于流处理器数量非常敏感。AMD的GPU由于SIMD架构的庞大流处理器优势遥遥领先于NVIDIA GPU。
高清视频转码:N卡略快于A卡
Cyberlink(讯连科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作为一家专注视频与多媒体的软件开发商,Cyberlink不久前推出了一款专业的快速视频转换软件——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款视频编辑软件,而MediaShow Espresso才是视频转换软件。
现在编码解码软件满天飞,但是MediaShow Espresso却有它的独到之处。它是第一款同时支持CUDA与Stream加速的视频转换软件,除此之外它还对Intel Core i7处理器的超线程及SSE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比传统软件都要快。
测试视频文件为长度为3分42秒码率22M的H.264编码的M2TS文件。测试中我们打开GPU解码与GPU编码选项,将编解码工作交由GPU来完成。
可以看出,GPU视频转码时,CPU和GPU都要参加计算,而且GPU不需要尽全力,所以高端GPU和中端GPU的性能是差不多的。总体来看N卡的CUDA性能要优于A卡的Stream性能。
值得注意的是,本次测试使用的是同时支持CUDA和Stream的MediaShow Espresso进行测试,如果使用仅支持CUDA的MediaCoder软件的话,N卡的视频转码速度还能更快,这方面A卡无论性能还是软件支持度都不如N卡。
显卡,企业询价批量采购更优惠,一对一客户经理服务,一站式采购,就在苏宁企业购!显卡,正品低价,品质保障,一站式本地化采购服务平台,为企业提供多样化采购方案!
DirectCompute理论性能:A卡略占优势
ComputeMark由捷克硬件和游戏网站CzechGamer.com的Robert Varga开发制作,引擎是基于Jan Vlietinck的Fluid3D Demo。软件能够使显卡占用率达到99%,而CPU占用率仅0-1%,避免由CPU性能造成对测试成绩的影响。同时该软件还有功耗测量的功能,测试时间可以随意设定。
ComputeMark需要在纯DX11环境下运行,包括windows7 32/64位操作系统、DX11 API和DX11显卡。
最终结果很和谐,虽然A卡的理论浮点运算能力很高,但在DirectCompute理论测试当中,同级别的A卡并不比N卡高多少。因为DirectCompute现阶段主要还是在游戏当中使用,因此意义不是很大。
Bitcoin挖矿性能测试:A卡绝对优势
如果您还不了解比特币的话,不妨看看前不久我们的评测文章《挂机也能赚钱?教你用显卡挖矿赚美元》。这里就直接引用测试数据:
下面笔者做个简要分析: 1. HD6990拥有两颗GPU,核心频率与单核心的HD6970完全相同,所以挖矿性能正好翻倍。事实上HD6990就是需要开两个挖掘器分配给两颗GPU一起计算。2. AMD上代HD5870流处理器稍多于HD6970,但核心频率稍低,最终两代旗舰单卡的挖矿性能差不多。要知道VLIW4架构的HD6970游戏性能要强于VLIW5架构的HD5870,但挖矿性能似乎只取决于理论浮点运算能力,跟架构和效率毫无关系。3. Barts核心的HD6790拥有256Bit显存位宽,比128Bit的HD6770大一倍。但两者的挖矿性能完全相同,所以显存位宽频率对性能没有任何影响,影响性能的唯一因素就是流处理器数量及频率。4. NV顶级单卡GTX580还不如HD6750,但要比CPU强很多,毕竟它也有数百颗核心。
那为什么A卡和N卡的差距如此之大呢?比特币挖掘器采用的是SHA-256,这是由美国国家安全局发明的一种安全散列函数,一般用于密码加密与解密。这种算法会进行大量32位整数循环右移运算,这个操作在AMD GPU那里可以通过单一硬件指令实现,而在NVIDIA GPU那里需要三次硬件指令来模拟(2移+1加),仅这一条就为AMD带来额外的1.7倍运算效率优势(大约1900指令来执行SHA-256压缩操作,而不是NVIDIA的大约3250指令)。
如此一来,AMD较高的浮点运算能力再加上算法效率优势,AMD GPU在密码破解与比特币挖掘时的性能,大概是NVIDIA GPU的3倍以上!
现在的显卡市场,同质化已经严重到了什么地步呢?不仅仅是板卡厂商之间的显卡性能基本没区别,而且同价位的N卡和A卡在不同游戏中的表现也是难分胜负,让游戏玩家们难以抉择。
于是NVIDIA和AMD的竞争开始逐渐淡化游戏,而强调功能和应用,三屏、3D、PhysX、视频等开始大行其道。不过这些功能都难以量化,随着CUDA和Stream的飞速发展催生了OpenCL和DirectCompute通用计算标准,使得NVIDIA和AMD在另一条道路上展开了新的竞赛——并行计算。
近年来GPU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持CUDA的GPU已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用CUDA探测到更多更广的领域中,包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。近年来超级计算机的突飞猛进很大程度上也是得益于强大的GPU加盟。
对显卡感兴趣的朋友都知道,通用计算之所以如此热门,根本原因在于显卡核心GPU的多流处理器(相当于数百核心)架构:GPU强大的并行浮点运算能力是仅仅拥有个位数核心的中央处理器CPU无法望其项背的。而通用计算技术可以发挥GPU的长处,让其电脑运算速度飙升,一些应用程序的速度可以提高数倍甚至数十倍,让原来因为运算量巨大而不可完成的任务变得可行。
而在家用、办公电脑上,借助GPU加速的软件也越来越多,这些软件有的可以用来转码,有的可以用来增强图像、视频的画质,有的可以将2D电影转换成3D,有的还能智能归类和编辑照片……
一个已经经历数年却被人的传言:同价位的A卡的浮点运算能力比N卡强一倍。AMD对于这个优势从来没有显摆过反而是NVIDIA,成天炫耀,PX4CUDA
现阶段游戏显卡是否需要通用计算能力? 服务器为了增强稳定性会使用ECC内存,而在TESLA计算卡上 也使用了ECC GDDR显存 ,在显卡通用计算时,由于数据吞吐极大,很容易产生PAGEFAULT,这时ECC就很有必要了,从这样看,而游戏卡没有使用ECC,并且极度发掘硬件的潜力,无法保证高度的稳定,在高性能通用计算的路上不会成为主流。所以感觉异构的话ECC肯定势在必行,但是成本摆在那,特别是apu,对于带宽要求很高,以后真的异构的话更稳定的内存也很必要,而现实就是ECC会带来整机预算提高…当然软件校验可行
顶 超屌!想问一下 1:最上边的那个图是从哪找的?2:中间 那篇文章我看到是11年的,现在在a卡和n卡的对比上是否还是这样?
25楼又来挖坟
楼主您好,请问现如今的挖矿计算力是怎么算出来的?根据显卡频率吗?急求!!
登录百度帐号

我要回帖

更多关于 优秀的硬件保护性能 的文章

 

随机推荐