Раскрыты подробности о следующей топовой видеокарте NVIDIA RTX 40
Точнее, о её графическом процессореKopite7kimi начал с конфигурации графического процессора. Он сравнил Ada Lovelace AD102 с другими графическими процессорами NVIDIA, в частности с Ampere GA102 и Turing TU102.
AD102 получит до 12 GPC (кластеров обработки графики). Это на 70 % больше, чем в GA102, где всего 7 GPC. Каждый GPU будет состоять из 6 блоков TPC и 2 SM, что соответствует конфигурации существующего чипа. Каждый SM будет содержать четыре подъядра, что также соответствует графическому процессору GA102. Что изменилось, так это конфигурация ядра FP32 и INT32. Общее количество блоков FP32+INT32 увеличится до 192. Всего будет 18 432 ядра CUDA.
Что касается кэш-памяти, то новые GPU получат 192 КБ кэш-памяти первого уровня на блок SM, что на 50% больше, чем у архитектуры Ampere. Суммарно будет 4,5 МБ кэш-памяти L1 в AD102. А вот кэш-памяти второго уровня будет 96 МБ —в 16 раз больше, чем у GA102.
Ещё в новой архитектуре увеличится количество блоков растеризации (ROP) — 32 единицы на блок GPC, или вдвое больше, чем сейчас.