Улучшенные ядра RTX 30 серии
05/09/2020
Анонс Ampere RTX 30
1 сентября NVIDIA представила архитектуру Ampere серии RTX-30, отмечая 21-ю годовщину выпуска своего первого графического процессора, GeForce 256. Характеристики выглядят впечатляюще! Однако в итоге мы получили довольно много вопросов, и NVIDIA предоставила много дополнительной информации.
Сначала поговорим о потоковом мультипроцессоре Ampere. Самое большое изменение в играх - это, вероятно, удвоение производительности FP32. Каждый SM теперь имеет два кластера FP32, обеспечивающих до 128 операций FMA (объединенное множественное сложение) за цикл. Половина из них - это полноценные ядра FP32 + INT, а другая половина - только FP32. Это может показаться потенциальной проблемой, но в целом (особенно для игровых нагрузок) FP32 является наиболее важным, INT - в меньшей степени. Это сбалансированный подход для повышения общей производительности без чрезмерного раздувания ядра.Путь к данным был удвоен. Емкость L1 также на 33% больше, а размер раздела в два раза больше.

Новшества архитектуры Ampere
Одно из следующих внесенных изменений заключается в том, что Ampere может одновременно выполнять работу через ядра CUDA, ядра RT и ядра Tensor. Это позволяет игре запускать DLSS для масштабирования одного кадра, одновременно выполняя вычисления CUDA и RT для следующего кадра, сокращая время рендеринга и улучшая общую производительность.
Для ядер RT Ampere также добавил функцию интерполяции положения треугольника. Это особенно важно для таких вещей, как размытие в движении, когда не все треугольники, используемые для рендеринга сцены, находятся в одной и той же позиции или времени. Это изменение потенциально ускоряет прохождение лучей в 8 раз, поэтому это важное дополнение.
