台式机显卡温度（台式机显卡温度80度正常吗）

1引言&规格对比&外观赏析

引言

要说下半年DIY圈内有什么惊天动地的变化，那非RTX4090显卡莫属，它的性能表现着实让人印象深刻，AdaLovelace架构和TSMC4N工艺让这款显卡的能耗比有了新的突破，老黄的独家黑科技DLSS3让一众游戏玩家为之振奋，豪华的堆料使生产力效率提升明显，不过由于高昂的售价和产能一卡难求。

Nvy.jpg” />

再看看下方的RTX4080的核心结构图，和完整版本的AD103核心对比起来就很容易看出差别，RTX4080核心代号为AD103-300，其拥有4个完整规格的GPC（图形处理集群，每个内建6个TPC），与3个非完整的GPC（两个内建5个TPC，一个内建4个TPC），共组成38个TPC，SM单元则剩下76个，显存位宽还是完整的256Bit。

NGWrZaIU7yXc6.jpg” />

包装盒的背面更为简约，印着映众RTX4080冰龙超级版全新升级的技术介绍以及品牌理念。

打开包装后，还是那个熟悉的味道，这代映众RTX4080冰龙超级版延续了之前的设计，以黑灰色为基调，辅以银白色的装饰条，质感出众。

显卡金手指则是常规的PCIe4.0x16接口，值得注意的是，使用前一定要打开主板的ResizableBAR功能，这样才能跑满带宽，完全发挥显卡性能。

接口方面配备了三个DP1.4a和一个HDMI2.1a，最高支持8K多屏输出，这样的接口能力完全能够满足需求。

2显卡拆解：映众 GeForce RTX 4080 16GB 冰龙超级版

显卡拆解：映众 GeForce RTX 4080 16GB 冰龙超级版

看完映众RTX4080冰龙超级版的外在，下面我们看看这款显卡的内在，卸下金属背板上的螺丝即可分离PCB与硕大的散热器。

PCB的背面比较简洁，多是一些控制芯片，核心的背面还有两颗两个POSCAP(导电聚合物钽电容)，有它们坐镇，显卡整体的电气性能会更强。

想要驱动核心和显存，还必须有稳定的供电规模，映众RTX4080冰龙超级版采用14 3相供电，更有全封闭式电感、富士通FP固态电容等高品质元器件在旁辅助，为显卡注入澎湃动力。

显存供电DrMos芯片

核心供电和显存供电均配有PWM供电控制芯片，安排在PCB背面，型号分别是：uP9512R、和uS5650Q。其中uP9512R管理核心供电，可以做精细化的供电管理，而uS5650Q则是主要负责显存供电部分。

再将剩余螺丝卸下就可以看到映众RTX4080冰龙超级版的散热系统了，映众称其为第八代冰龙散热系统，其主要由散热器、散热风扇以及金属背板组成。

大面积的散热鳍片被安排在散热器上，足足有6cm高，提供了0.99m2的散热面积，有效提升气流流动效率，改善显卡内部的温度，确保显卡能够一直稳定运转。

UnrealEngine5EnemiesDEMO性能测试

在实际游戏测试前，我们先测试了开发游戏所需用到的UnrealEngine5引擎，UE5作为全新的游戏开发引擎，对显卡的压力自是不小，在EnemiesDEMO中，映众RTX4080冰龙超级版在开启DLSS3后性能飙升，4K分辨率下可达77AVG/661%FPS/55ms的水平，而关闭DLSS3仅有22AVG/171%FPS/195ms，前后足足相差3倍之多，不得不说老黄的DLSS3真的是黑科技一般的存在。

有玩家可能会觉得帧数提升那么大是不是通过降画质实现的，因此我们也进行了对比，可以从视频中可以看出，即使开启DLSS3后，从肉眼看来，开关前后的画质几乎没有区别，并且因为DLSS是利用AI进行渲染，在部分细节上，DLSS模式下的画质甚至比原生画质还要清晰，所以有了DLSS3后，游戏流畅度提升的同时，画质也不受影响，妥妥的双赢局面。

《生死轮回》游戏实测

《生死轮回》作为首批支持DLSS3的游戏，我们在实测过程中发现，在不开启DLSS的情况下，映众RTX4080冰龙超级版的帧数仅有50FPS，而我们一旦开启DLSS2后游戏的帧数已经能够去到122FPS了，降低部分特效，此时已经可以满足4K@144Hz的游戏需求。

当我们打开最新的DLSS3后，游戏帧数以肉眼可见的速度往上提升，足足提升了有20FPS，此时映众RTX4080冰龙超级版在4K分辨率已经能够跑到143FPS的平均帧，如果配上我们所用的AGONPD32M保时捷联名显示器，这个性能加上144Hz的高刷屏，游戏体验直接起飞。

2K分辨率DLSS性能测试

我们也是实测了多款游戏跟程序，从实测结果来看，映众RTX4080冰龙超级版在2K分辨率下没有丝毫压力，不少RTX3080Ti只能跑100FPS的游戏，在映众RTX4080冰龙超级版上都可以去到200 FPS了，远远甩开了前代显卡，加上DLSS3后更是能够达到恐怖的300FPS。

4K分辨率DLSS性能测试

4K分辨率一样能够被映众RTX4080冰龙超级版征服，开启DLSS3后，游戏性能大幅提升，开关前后差距在有些游戏里就是能玩和不能玩的区别；并且即使是4K分辨率依旧有不少游戏都能跑到144FPS以上，看来4K分辨率对映众RTX4080冰龙超级版没有压力，我们还得上8K试试。

8K分辨率DLSS性能测试

8K分辨率下RTX4080显卡就不太够用了，实测下来，只有少部分游戏或程序能够流畅运行在60FPS左右，笔者认为这是由于显存不足的问题导致，后续还需要游戏厂商进行优化，才能让这款RTX4080在8K分辨率下完美展现出应有的实力。

5创作生产力&双NVENC编码器性能测试

创作性能测试

创作生产力也是不少用户关注的重点，因此我们这次选择PugetBench、PCMark10这两款常见的测试软件，来测试映众RTX4080冰龙超级版在日常办公、视频内容生产等方面的性能表现。

首先是PCMark10的测试，这张显卡在数位内容创作和游戏项目上有不小的提升，整体性能相比前代领先了8%以上，甚至与自家的老大哥RTX4090五五开；而在创作生产力软件测试中也印证了上面的性能提升，单是在达芬奇剪辑软件的Benchmark测试中，性能就领先RTX3080Ti约16%。

另外值得一提的是映众RTX4080冰龙超级版由于配备了16GB大显存，在实测中没有遇到过项目崩溃的情况，正因为有大显存的加持，让这款显卡能够运行更多更复杂的项目，而前代仅有12GB显存因此常常出现爆显存的状况。

再来看看映众RTX4080冰龙超级版在建模、渲染、工业设计等方面的表现，在Blender渲染软件中，9728个CUDA核心依旧强势，分别领先RTX3080Ti和RTX3090Ti有52%和45%，足见这代显卡的实力之强劲。

而在SPECviewperf2020集成的8款工业软件测试中也是如此，性能提升也来到了32%左右，也就是相同的模型渲染，换装映众RTX4080冰龙超级版能够让你缩短近三分之一的渲染时间，效率提升明显。

双NVENC编码器专项测试

老黄的黑科技不单止DLSS3一种，他在RTX40系显卡上还安排了双NVENC编码器，支持时下热门的AV1编码，而AV1作为下一代主流的视频编码技术有着自己独特的优势，其具有更快的编码速度和更高质量的流媒体传输性能，像达芬奇、万兴喵影、剪映等常用的剪辑软件已经支持AV1编码，B站等主流的视频网站也加入了AV1解码，未来AV1将会成为一个新趋势。

既然有双NVENC编码器，那我们就得实测一下这款显卡的编码能力如何。我们使用NVIDIA提供的8K片源与工程文件分别测试AV1格式和H.265格式下的编码时间，实测映众RTX4080冰龙超级版的编码能力已经能够跟老大哥RTX4090平起平坐了，使用AV1编码时速度明显优于H,265格式，即使换成H.265编码，有双编码器的加持下，映众RTX4080冰龙超级版的效率比前代快62%以上。

从上面的对比测试中可以看出AV1编解码在导出速度上明显领先H,265格式，不过它在占用空间上也颇有优势，从下图可以看到无论是4K还是8K分辨率，采用AV1编码后，视频文件大小平均能够降低25%以上。

AV1在编码导出、占用空间上本就有不小的优势，同时它的画质也不输H.265格式，这里我们截取了几个画面进行对比，从肉眼来看，其实画质几乎完全一样，这样也意味着AV1可以用更小的空间占用量实现与H.265同等规格的画质表现，不得不说视频工作者真的可以换显卡了，AV1编解码的加入让映众RTX4080冰龙超级版有了超强的导出性能和战未来的能力。

6功耗&超频&评测总结

功耗与发热

TSMC4N工艺和架构革新双重加持下，RTX40系显卡的性能有了极大的提升，这次映众更是给自家的RTX4080显卡用上了超规格的散热系统，这让笔者对映众RTX4080冰龙超级版的温度和功耗表现充满期待。

在Furmark甜甜圈单烤15分钟测试中，映众RTX4080冰龙超级版的占用率达到了99%，但此时的GPU核心温度仅有65℃，而GDDR6X显存作为发热大户更是低至48℃，足以证明这代显卡在架构设计及散热器上真的下足了功夫。

除了温度表现喜人外，映众RTX4080冰龙超级版在噪音控制方面也表现不错，温度比前代RTX3090Ti低的同时，风扇转速也一直保持在低位，几乎感受不到风扇的噪音，综合来看，这款显卡的散热器表现优秀，应对适当的超频操作也不在话下，并且在能耗比方面也遥遥领先上代产品，这才是高端显卡应有的表现。

超频体验

既然是次旗舰显卡，那除了标准的性能测试外，自然是少不了超频测试，我们利用的是映众自家的INNO3DTuneIT超频软件，在该软件上可以调节核心频率、显存频率，解锁功耗和温度墙等操作。

点击INNO3DTuneIT界面上的“智能扫描”按键，软件开始对显卡进行较长时间的智能扫描，扫描完成后还可以智能超频，使用起来相当方便，即使是超频初学者也能够轻松上手，收获超频带来的性能提升。

不过这次笔者采用手动调整的方式，将GPU核心提升了160MHz，显存也超频1250MHz，最终超频结果，在3DMark中的TimeSpy测试项目，GPU来到了2970MHz，显存也达到了1556.5MHz，得分29692，相比默频状态下有近4%的性能提升，表现还不错。

当然这还不是这款显卡的极限，如果你有更好的散热条件，这款显卡的超频能力还能进一步提升，感兴趣的玩家不妨尝试一下，探探这款显卡的极限。

评测总结

测试下来可以说老黄这次真的有认真在做RTX40系显卡，换装的AdaLovelace架构给这代显卡的光追带来了巨幅提升，双编码器和支持AV1让生产力也能感受科技进度带来的效率提升，还有DLSS3黑科技加持，游戏性能也不可小觑，以前8K想都不敢想，现在已经近在咫尺，总的来说，这代RTX40系显卡处处皆惊喜。

而此次送测的映众GeForceRTX408016GB冰龙超级版就是其中的典范，外观精致，堆料激进，质感出色，散热表现更是优异，并且预留了一定的超频空间给玩家，搭配自家的超频软件，小白也能轻松上手。

这款显卡的性能表现也是可圈可点，畅玩各类游戏大作没有一点问题，甚至不少游戏还能满足4K@144Hz的电竞需求；16GB的超大显存也让它跻身生产力显卡的前列，兼具生产力显卡的性能，性价比也不低。

目前映众GeForceRTX408016GB冰龙超级版已经上市，售价10699元，显然这是一款面向游戏发烧友及生产力创作者的显卡，不过以其强劲的性能和出色的表现，它还是无愧于高端显卡的称号，感兴趣的玩家不妨关注一下。

7技术讲解：Ada Lovelace架构

Ada Lovelace架构讲解

Turing、Ampere上两代架构核心均以人物来命名，前者是计算机科学之父——艾伦·麦席森·图灵；后者则是“电学中的牛顿”——安德烈·玛丽·安培，电流的国际单位安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，这是人称“数字女王”的阿达·洛芙莱斯，编写了历史上首款电脑程序，是被世界公认的第一位计算机程序员，果真是一代比一代还要更牛。PS：她的父亲是《唐璜》的作者，诗人拜伦喔。

从Turing架构开始，NVIDIA首次在显卡中加入了加速光线追踪的RTCore单元，以及面向AI推理的TensorCore单元，这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进，在加入新一代的二代RTCore和三代TensorCore基础上，还有着更先进的SM单元设计，这样显卡工作效率那是翻倍的提升。而来到AdaLovelace架构，同时是以效率提升为大前提，自然是引入了最新的第三代RTCores与第四代TensorCores单元，同时加入众多新颖的黑科技，从执行效率来说AdaLovelace架构是上代Ampere架构的2倍以上，甚至光线追踪能力更是达到了恐怖的4倍性能。

全新的SM流式处理器

AdaLovelace架构中最大的亮点之一：全新的SM流式多处理器，每个SM包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores（张量核心）、4个TextureUnits（纹理单元）、256KBRegisterFile（寄存器堆），以及128KBL1数据缓存/共享内存子系统，于是这一个全新的SM单元有着超过上一代2倍之的性能表现。

过去的Turing架构INT32计算单元与FP32数量是一致的，而两者相加才组成了64个CUDA核心。但是Ampere架构开始，左侧的计算单元实现了FP32 INT32的计算单元并发执行，也就是说CUDA核心数量翻倍到了128个。

再来看看AdaLovelace架构的SM，FP32/INT32的计算单元组合，同样实现了每个SM内含128个CUDA的设计，看似提升不大，但是当你了解到GeForceRTX4080拥有76个SM，9728个CUDA核心，那你也就应该明白达82.6TFLOPS的着色器能力是如何实现的了，比上一代的RTX3090Ti显卡的40TFLOPS，还真是提升了两倍有多。

另外缓存方面AdaLovelace架构也进行了大规格的提升，首先每个SM单元中单独配上了128KB的缓存，这样RTX4080显卡中就实现了97MBL1/共享内存。其次核心的二级缓存进行进行了重新的设计，并且完整AD103核心与RTX4080都是64MB二级缓存，相比RTX3080Ti可以说是质的飞跃。

技术讲解：第三代 RT Cores与第四代 Tensor Cores

以为刚才的CUDA数量与超大L2缓存就已经很猛了，实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。

第三代RTCores

RTCores用于光线追踪加速，第三代RTCores的有效光线追踪计算能力达到191TFLOPS，是上一代产品2.8倍。

在Ampere架构中，第二代RTCores支持边界交叉测试（BoxIntersectiontesting）和三角形交叉测试（TriangleIntersectiontesting），用于加速BVH遍历和执行射线三角交叉测试计算，虽然光线追踪处理能力已经比初代的Turing架构核心更高效，但是随着环境和物体的几何复杂性持续增加，传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线，尤其是光的运动准确性。

所以在第三代RTCores增加了两个重要硬件单元：OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以将alpha测试几何体的光线追踪速度提高2倍。

在传统光栅渲染中，开发人员使用一些Alpha通道的素材来实现更高效的画面渲染，例如Alpha通道的叶子或火焰等复杂形状的物体。但在光线追踪时代，这传统的做法会为光线追踪带为不少无效的计算，例如运动性的光线多次通过一块叶子，光线每击中一次叶子，都会调用一次着色器来确定如何处理相交，这时就会做成严重的执行成本与时间等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光线交集的不透明度状态

三角形。根据Alpha通道的不透明，透明与未知等三个不同的块状态进行处理：透明则直接忽略继续找下一个，不透明块则记录并告之命中，而未知的则交给着色器来确定如何处理，这样GPU很大部分都不需要进行着色器的调试处理，能够实现更为高效的性能。

DisplacedMicro-MeshesEngine

如果说OpacityMicromapEngine加速的是面处理，那么DisplacedMicro-MeshesEngine就是几何曲面细节的**。如上图所示，在AdaLovelace架构中，通过1个基底三角形位移地图，就可以创建出一个高度详细的几何网格，所需要资源占用比二代RTCores更低，效率也更高。

通过NVIDIA给出的创建14:1珊瑚蟹例子来说事，这里我们需要需要1.7万个微网格、160万个微三角形，在AdaLovelace架构中BVH创建速度可加快7.6倍，存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用，其将一个几何物体根据不同细节分成密度不一的微网络处理，红色密度超高，细节处理越为复杂。相应的低密度微网络区域则可以释放更多的资源与存储空间，这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程，减少构建时间和存储成本。

同时AdaLovelace架构SM中新增了着色器执行重排序（ShaderExecutionReordering，SER），这是由于光线追踪不再只有强光或者阴影渲染处理，未来将会更多的是在光线的运动性，这样光线就会变得越来越复杂，想要第三代RTCores与第四代TensorCores有着更高的执行效率，那就得为他们来安排一位管家。而着色器执行重排序（SER）就是为了能够即时重新安排着色器负载来提高执行效率，为光线追踪提供2倍的加速，也能更好地利用GPU资源。不过目前仍未有实例，想实现这个功能，还得游戏与开发工具的支持才行。

第四代TensorCores

TensorCores是专门为执行张量/矩阵运算而设计的专用执行单元，这些运算是深度学习中使用的核心计算功能。第四代TensorCores新增FP8引擎，具有高达1.32petaflops的张量处理性能，超过上一代的5倍。

8技术讲解：DLSS 3

技术讲解：DLSS 3

或者说第四代TensorCores太硬核你不会知道是啥？提升意义在哪？但是TensorCores最经典的应用DLSS你肯定会知道，这一次AdaLovelace架构支持NVIDIA最新的DLSS3技术。

之前我们也聊过DLSS技术，其设计之初是为了弥补光线追踪技术后的性能损失，具体的表现为开启光线追踪技术后游戏帧数大幅度的下降，甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧，从而提升光线追踪的性能。

在DLSS3中包含了三项技术：DLSS帧生成、DLSS超分辨率（也称为DLSS2）和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的基础上，新增了DLSS帧生成技术；而后两技术中，DLSS超分辨率只需要GeForceRTX显卡都能使用上，NVIDIAReflex则是GeForce900系列以后的显卡都用使用上。

想实现DLSS帧生成可不简单，这需要配合上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧生成技术原理是：利用AI技术生成更多帧，以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流**分析连续帧和运动数据，进而创建其他高质量帧，同时不会影响图像质量和响应速度。

从Ampere架构开始，NVIDIA显卡就已经支持了光流**，而AdaLovelace架构的光流**升级到了第二代，其提供了高达300TeraOPS(TOPS)，比安培架构的初代光流**（OpticalFlowAcceleration，OFA）快2倍以上。为了实现DLSS帧生成，OFA扮演了重要的角色，其配合上新的运行矢量分析算法在DLSS3技术框架内实现精确和高性能的帧生成能力。

另外，由于DLSS帧生成是在GPU上作为后处理执行的，那么即使在游戏受到CPU性能限制的时候，我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏，DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。

最后由于DLSS3是建立在DLSS2基础之上的，游戏开发者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能，所以DLSS3已在游戏生态得到广泛应用，目前已有超过35款游戏和应用即将支持该技术。

阅读小亮点：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一环，它可以使GPU和CPU同步，确保最佳响应速度和低系统延迟。

想要实现端对端的最低延迟，你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技术。

当GeForceRTX40系列显卡和NVIDIAReflex搭配上后，直接达到1440p分辨率360FPS的体验，这着实是性能有点强劲了。

在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布，包括采用mini-LED技术的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，刷新率直接来到了360Hz。

但唯一一个问题就在于，部分显示器厂商认为此类产品受众人群较少，会降低此类显示器的产能，甚至产品就已经被内部PASS掉，所以1440p360Hz是很美好，但现实也是相当的骨感。

9技术讲解：双NVIDIA编码器

技术讲解：双NVIDIA编码器（NVENC）

GeForceRTX40系列显卡还有一个全新的升级，那就是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265，还支持开放式视频编码格式AV1。

而由于AV1是一种免版税的视频编码格式，上游软件厂商与下游戏的配套端都在大力推广此编码格式，我们也会看到越来越多的硬件与软件支持AV1格式，包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持，且均可通过编码预设使用双编码器，这样我们等待视频导出的时间缩短将近一半。

不单是视频制作软件，AV1格式也将会是主播、游戏直播UP主们的新宠儿，在保证画面最高质量的情况下，AV1编码器可将效率提高40%，同时显卡的占用也更低。包括OBSStudio一一代软件中也会增加AV1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容，这样我们做游戏录制也会变得更为轻松。

包括我们之后测试时使用的游戏内录视频都是支持AV1格式，同时双编码器NVENC在资源占用和适配上做得越来越好。

台式机显卡温度（台式机显卡温度80度正常吗）

相关推荐