| 显卡型号 | 核心架构 | 制程工艺 | 基础频率 | 加速频率 | 流处理 | 内存类型 | 内存频率 | 内存位宽 | TDP功耗 | ||
| NVIDIA RTX 4090 | Ada Lovelace | 5 nm | 2235 MHz | 2520 MHz | 16384 | GDDR6X | 1313 MHz 21 Gbps |
384 bit | 450W | 详细参数>> | |
| NVIDIA RTX 4070 Ti SUPER | Ada Lovelace | 5 nm | 2340 MHz | 2610 MHz | 8448 | GDDR6X | 1313 MHz 21 Gbps |
256 bit | 285W | 详细参数>> |
核心频率与核心数量方面,RTX 4090 的核心频率为 2235 MHz,Turbo 2520 MHz,而 RTX 4070TiS 的对应值为 2340 MHz、2610 MHz。两者均基于 Ada Lovelace 5 nm 工艺,单核频率相近,但 RTX 4090 拥有 128 SM、16384 CUDA 核心、512 Tensor 核心、128 RT 核心,显存宽度 384 bit、24 GB GDDR6X、带宽 1008 GB/s;RTX 4070TiS 仅具 66 SM、8448 CUDA 核心、264 Tensor 核心、66 RT 核心,显存宽度 256 bit、16 GB GDDR6X、带宽 672 GB/s。显存容量与带宽的差距在 4K 纹理、光线追踪渲染以及深度学习推理等内存密集型工作负载中尤为明显。
在 3DMark 评测里,RTX 4090 的 Time Spy(2560 × 1440)得分约 36896,Ice Storm Unlimited ≈ 771 257;RTX 4070TiS 仅为 23695 与 759 135。Fire Strike 标准与 Graphics 分数亦呈现相同趋势:RTX 4090 在 1920 × 1080 下的得分约 73 174,RTX 4070TiS 仅为 52 738。Cinebench R15 OpenGL 64 bit 的差距极小(321.8 vs 317),说明在纯 OpenGL 渲染时两卡性能相近;但在 DirectX 12 或 Vulkan 环境下,RTX 4090 的优势更为突出。
算力指标亦反映此差异:Autolykos、DaggerHashimoto、ETCHash 与 KAWPOW 的算力分别为 272 / 125 TFLOPS 与 180 / 85 TFLOPS,NexaPow 276.3 / 150。显卡单精度(FP32)与半精度(FP16) FLOPS 也呈 82.58 vs 44.10 TFLOPS 的比例,说明在需要高浮点性能的 AI 推理或科学计算时,RTX 4090 能提供近两倍计算力。
TDP 与功耗方面,RTX 4090 450 W,建议 850 W 电源;RTX 4070TiS 285 W,建议 600 W 电源。更低的功耗意味着更小的散热器占用空间、系统噪声和能源消耗,适合中高端台式机或紧凑机箱。
使用场景对比
| 场景 | 适合卡 |
|---|---|
| 4K/8K 高帧率游戏(尤其是光线追踪) | RTX 4090 |
| 1440 p 高帧率游戏、VR、专业可视化 | RTX 4070TiS(足够) |
| 深度学习推理、AI 训练 | RTX 4090(显存 24 GB) |
| 预算受限、系统功耗与散热有限 | RTX 4070TiS(TDP 285 W) |
| 需要大量显存(大模型、深度渲染) | RTX 4090(24 GB) |
| 轻量级图形处理、非 GPU 加速任务 | 两卡均可 |
选择建议
通过对核心、显存、带宽、功耗及基准分数的对比,可根据实际工作负载与系统环境选择更适合的显卡。