Контакты

Видеокарты. Видеокарты Результаты тестов производительности и их анализ

  • Анализ среднегеометрических результатов и привлекательности покупки
  • реклама

    Вступление

    В данном обзоре будет изучена производительность новой видеокарты AMD – Radeon RX 480 8192 Мбайт. Ее соперниками стали следующие модели:

    • Radeon R9 Fury 4096 Мбайт;
    • Radeon R9 390X 8192 Мбайт;
    • Radeon R9 390 8192 Мбайт;
    • Radeon R9 380X 4096 Мбайт;

    • GeForce GTX 980 Ti 6144 Mбайт;
    • GeForce GTX 980 4096 Mбайт;
    • GeForce GTX 970 4096 Mбайт;
    • GeForce GTX 960 2098 Mбайт.

    реклама

    Тестовая конфигурация

    Тесты проводились на следующем стенде:

    • Процессор: Intel Core i7-6700K (Skylake, L3 8 Мбайт), 4000 @ 4600 МГц;
    • Материнская плата: Gigabyte GA-Z170X-Gaming 3, LGA 1151;
    • Система охлаждения CPU: Corsair Hydro Series H105 (~1300 об/мин);
    • Оперативная память: 2 x 4096 Мбайт DDR4 Corsair Vengeance LPX CMK8GX4M1A2400C14 (Spec: 2400 МГц / 14-16-16-31-1t / 1.2 В) , X.M.P. - on;
    • Дисковая подсистема №1: 64 Гбайт, SSD ADATA SX900;
    • Дисковая подсистема №2: 1 Тбайт, HDD Western Digital Caviar Green (WD10EZRX);
    • Блок питания: Corsair HX850 850 Ватт (штатный вентилятор: 140 мм на вдув);
    • Корпус: открытый тестовый стенд;
    • Монитор: 27" ASUS PB278Q BK (Wide LCD, 2560x1440 / 60 Гц).

    Видеокарты:

    • Radeon RX 480 8192 Мбайт - 1266/8000 @ 1320/8700 МГц (Sapphire);

    • Radeon R9 Fury 4096 Мбайт - 1000/500 @ 1100/500 МГц (Sapphire);
    • Radeon R9 390X 8192 Мбайт - 1050/6000 @ 1160/6500 МГц (Sapphire);
    • Radeon R9 390 8192 Мбайт - 1000/6000 @ 1140/6500 МГц (ASUS);
    • Radeon R9 380X 4096 Мбайт - 970/5700 @ 1150/6500 МГц (Gigabyte);

    • GeForce GTX 980 Ti 6144 Mбайт - 1076/7012 @ 1420/8100 МГц (Zotac);
    • GeForce GTX 980 4096 Mбайт - 1216/7012 @ 1440/8000 МГц (Palit);
    • GeForce GTX 970 4096 Mбайт - 1178/7012 @ 1430/8000 МГц (Zotac);
    • GeForce GTX 960 2098 Mбайт - 1178/7012 @ 1450/8000 МГц (Gigabyte).

    Программное обеспечение:

    • Операционная система: Windows 7 x64 SP1;
    • Драйверы видеокарты: Nvidia GeForce 372.70 WHQL и AMD Radeon Software Crimson 16.9.1.
    • Утилиты: Fraps 3.5.99 Build 15618, D3DGear 4.99.2017, AutoHotkey v1.0.48.05, MSI Afterburner 4.3.0 Beta 14.

    Инструментарий и методика тестирования

    Для более наглядного сравнения видеокарт все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1920 х 1080 и 2560 х 1440.

    В качестве средств измерения быстродействия применялись встроенные бенчмарки, утилиты Fraps 3.5.9 Build 15586 и AutoHotkey v1.0.48.05. Список игровых приложений:

    • Assassins Creed Syndicate (Пригород Лондона).
    • Doom (Поверхность Марса).
    • Dying Light: The Following (Ферма).
    • Fallout 4 (Перед ядерным взрывом).
    • Homefront: The Revolution (Рискованное предприятие).
    • Lords of the Fallen (Цитадель Замкового Камня).
    • Overwatch (Тренировочная база).
    • The Witcher 3: Wild Hunt - Blood and Wine (Туссент).
    • Tom Clancy"s The Division (Манхэттен).
    • Total War: Warhammer (Рейкландский руноклык).

    Во всех играх замерялись минимальные и средние значения FPS. В тестах, в которых отсутствовала возможность замера минимального FPS , это значение измерялось утилитой Fraps. VSync при проведении тестов был отключен.

    Перейдем непосредственно к тестам.

    Результаты тестов: сравнение производительности

    Assassins Creed Syndicate (Пригород Лондона)

    • Версия 1.5.0.
    • DirectX 11.
      • Сглаживание - FXAA.
      • Качество окружения - максимальное.
      • Качество текстур - высокое.
      • Качество теней - максимальное (PCSS).
      • Объемный свет – HBAO + Ultra.

    1920х1080

    Номинал
    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS

    реклама

    Doom (Поверхность Марса)

    реклама

    • Версия 1.0 Update 2.
    • id Tech 6.
      • Сглаживание - FXAA.
      • Хроматическая аберрация - включена.
      • Поле зрения - 90.
      • Масштабирование разрешения - 100%.
      • Качество освещения - ультра высокое.
      • Качество теней - ультра высокое.
      • Тень игрока - включена.
      • Качество направленного затемнения - высокое.
      • Качество декалей - ультра высокое.
      • Фильтрация декалей - анизотропная, х16.
      • Размер страницы при виртуальном текстурировании - ультра высокий.
      • Качество отражений - ультра высокое.
      • Качество частиц - ультра высокое.
      • Процедурные шейдеры - включены.
      • Качество размытия в движении - ультра высокое.
      • Глубина поля зрения - включена.
      • Сглаживание глубины поля зрения - включено.
      • HDR Bloom - включен.
      • Эффект бликов - включен.
      • Грязь на объективе - включена.
      • Режим рендеринга - кинематографический.
      • Степень увеличения резкости - 2.0.
      • Зернистость - 1.0.

    1920х1080

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS

    Противостояние в сегменте топовых видеокарт всегда привлекает внимание пользователей. Но кроме информационного ажиотажа есть и реальный спрос. Далеко не каждый игрок готов выложить те крупные суммы, которые нынче требуют за флагманские продукты. И если NVIDIA продолжает успешно штурмовать графический Олимп, то компания AMD в этот раз пошла иным путем, открывая новое поколение Radeon моделью среднего уровня, которая при этом должна обойти всех конкурентов в своей ценовой категории.

    Согласно статистике, на которую ссылается AMD, до 84% игроков используют дискретную графику стоимостью $100-300, а 95% игроков используют разрешение 1920x1080. На эту масштабную аудиторию и нацелен видеоадаптер Radeon RX 480, который предложит оптимальное сочетание производительности и стоимости благодаря новой архитектуре, новому техпроцессу, повышенным частотам и большому объему памяти.

    Архитектура AMD Polaris

    Новое поколение Radeon базируется на архитектуре Polaris, которая является развитием GCN-архитектуры. Это четвертое поколение в этой линейке. Рассматриваемая новинка носит кодовое имя Polaris 10. Графический процессор насчитывает 36 вычислительных модулей Compute Unit (CU), которые организованы в четыре массива Shader Engine со своим блоком обработки геометрии и блоками растеризации. Каждый CU оперирует 64 потоковыми процессорами и четырьмя текстурными модулями, подобно юнитам в старых GPU. В итоге получается 2304 потоковых процессора, 144 текстурных блока и 32 блока растеризации.

    Общая структура GPU напоминает другие процессоры AMD, а точнее, нечто среднее между Grenada (Hawaii) и Antigua, т.е. это промежуточный вариант между Radeon R9 390X и Radeon R9 380X . При этом повышена эффективность выполнения шейдеров, увеличен объем кеша L2 до 2 МБ и улучшена работа с ним, обновлен контроллер памяти, улучшены блоки обработки геометрии и поддержка асинхронных вычислений Async Compute, добавлена поддержка инструкций FP16 и Int 16. В итоге повышена эффективность, а высокие частоты обеспечивают дополнительное ускорение.

    Согласно данным AMD эффективность одного CU выросла на 15% в сравнении с Radeon R9 290. При обработке тесселяции совместно с тяжелыми режимами AA рост эффективности может быть двукратным или даже трехкратным. Поддерживается сжатие данных, что улучшает пропускную способность памяти. В частности, поддерживается алгоритм Delta Color Compression, который позволяет кодировать разницу цвета. Об этой методике мы рассказывали в описании архитектуры NVIDIA Pascal . У AMD такое сжатие поддерживается в том числе и на Radeon Fury X, но эффективность алгоритмов у Polaris 10 выше. При таком росте эффективности в передачи данных чип довольствуется шиной разрядностью 256 бит. В Radeon RX 480 используются микросхемы памяти GDDR5 с эффективной частотой обмена данными 8 ГГц.

    Асинхронные шейдеры позволяют оптимизировать выполнение комбинированной нагрузки, которая сочетает графические и неграфические вычисления. Эффективное распределение нагрузки реализуется благодаря новым аппаратным планировщикам и привычным уже блокам Asynchronous Compute Engines (ACE).

    Графический кристалл Polaris 10 выполнен по 14-нм техпроцессу FinFET, в то время как чипы NVIDIA Pascal производятся по нормам 16-нм. Это серьезный прорыв для индустрии, где несколько лет вся графика производилась по 28-нм техпроцессу. Такой тонкий техпроцесс позволяет серьезно снизить энергопотребление. И данная задача изначально была одной из ключевых при разработке нового поколения. Инженеры ориентировались на особенности новых 3D-транзисторов, оптимизировав структуру нового кристалла и реализовав улучшенные механизмы контроля напряжений. Среди прочего, кристаллы на базе нового техпроцесса меньше отличаются по своим характеристикам. Если снова отталкиваться от карты Radeon R9 290, с которой AMD сравнивает новинку, то рост показателя производительности на ватт почти двукратный.

    Для Radeon RX 480 заявлен TDP в 150 Вт, что близко к показателям GeForce GTX 970. При этом новинка должна быть производительнее. А если говорить о температурно-шумовых характеристиках, то согласно измерениям AMD у референсной версии Radeon RX 480 акустический шум немного ниже.

    Новый техпроцесс позволил повысить частоту GPU до 1266 МГц, что является максимальным значением Boost. В случае превышения лимита по мощности или температуре частота может поэтапно снижаться. Гарантированным базовым значением является 1120 МГц. Сравнить характеристики с предшественниками можно по таблице.

    Видеоадаптер Radeon RX 480 Radeon R9 390 Radeon R9 290 Radeon R9 380X Radeon R9 280X
    Ядро Polaris 10 Grenada Hawaii Antigua Tahiti
    н/д 6020 6020 5000 4313
    Техпроцесс, нм 14 28 28 28 28
    Площадь ядра, кв. мм 232 438 438 366 352
    2304 2560 2560 2048 2048
    Количество текстурных блоков 144 160 160 128 128
    Количество блоков рендеринга 32 64 64 32 32
    Частота ядра, МГц 1120-1266 До 1000 До 947 до 970 1000
    Шина памяти, бит 256 512 512 256 384
    Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
    Частота памяти, МГц 8000 6000 5000 5700 6000
    Объём памяти, МБ 8192/4096 8192 4096 4096 3072
    12 12 12 12 12
    Интерфейс PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0
    Уровень TDP, Вт 150 275 275 190 250

    Среди особенностей Radeon RX 480 нужно отметить наличие двух версий с разным объемом памяти. Основная модель оснащается 8 ГБ, а более дешевая модификация получит 4 ГБ.

    Видеокарты получат поддержку технологию AFR frame pacing для DirectX 12. Это методика сглаживает неравномерность при выводе кадров в CrossFire.

    Наряду с поддержкой DirectX 12 видеокарта совместима и с новым API Vulkan. И кроме простого гейминга Radeon RX 480 вполне может справиться с виртуальной реальностью VR. Оптимальную производительность обеспечит поддержка возможностей AMD LiquidVR, что подразумевает наилучшее распределение вычислительных ресурсов для смешанных задач, поддержка технологии Asynchronous Time Warp на Oculus Rift для корректного и быстрого обновления картинки при движениях. Сюда же входит технология AMD TrueAudio Next для корректного просчета распространения звуковых волн при помощи технологии трассировки лучей. Причем данные расчеты тоже входят в сферу применения Async Compute. Подобную инициативу развивает и NVIDIA. Но вариант от AMD предусматривает открытый инструментарий для разработчиков в рамках программы GPUOpen.

    Технология Variable Rate Shading позволяет регулировать качество изображения отдельных сегментов изображения при VR-рендеринге, поддерживая максимальное разрешение для центральной зоны и уменьшая его на периферии. Это экономит ресурсы и ускоряет производительность в VR.

    Видеоадаптер Radeon RX 480 поддерживает интерфейс DisplayPort 1.3 HBR и готов к работе по DisplayPort 1.4 с поддержкой нового стандарта HDR. То есть в будущем вы сможете подключить новые дисплеи HDR и просматривать соответствующий контент. При подключении через DisplayPort поддерживается вывод изображения вплоть до 5К с частотой 60 Гц, а также 4K при 120 Гц или 4K при 96 Гц в HDR-режиме.

    Также Polaris получил новый блок кодирования/декодирования видеоконтета H.264 и HEVC с поддержкой разрешений вплоть до 4K. Теперь вы сможете записывать видео из игр в высоком качестве или сразу стримить его. Хороший бонус для геймеров, ведь ранее даже на топовых Radeon через клиент AMD Gaming Evolved можно было захватывать лишь видео формата Full HD.

    Radeon RX 480 работает с новым программным центром AMD Radeon Settings, который предоставляет широкую функциональность для настройки параметров цветовой гаммы или рабочих параметров видеокарты. На данный момент нет сторонних утилит для разгона Polaris, но все эти функции доступны в новом приложении AMD WattMan. Для доступа к программе в AMD Radeon Settings нужно перейти на вкладку «Игры», а потом в «Глобальные настройки». Здесь можно тонко настраивать Boost или разгонять карту путем простого увеличения шкалы частот. Доступно управление алгоритмом вентилятора, изменение ограничений по мощности и температурам.

    После краткого обзора архитектурных особенностей взглянем на реальный экземпляр видеокарты Polaris 10.

    Перед нами референсная видеокарта. Она выполнена в узнаваемом уже стиле. Дизайн без изысков, кулер «турбинного» типа, внешне напоминает кирпичик.

    Длина Radeon RX 480 достигает 24 сантиметров. На корпусе и вентиляторе есть крупные логотипы Radeon.

    Плата оказывается очень короткой. Вентилятор нависает над текстолитом сбоку, в этом месте специально сделаны отверстия для притока воздуха.

    Radeon RX 480 уже не оснащается разъемами DVI, зато на задней панели есть три DisplayPort и один HDMI.

    Крышка корпуса легко откручивается без полного разбора устройства. Это позволяет оценить систему охлаждения в сборе. Мы видим крупное основание и отдельный алюминиевый радиатор на GPU.

    Металлическая пластина основания имеет оребрение для увеличения площади рассеивания тепла, в том числе в районе узла питания. Так что радиатор силовых элементов и микросхем памяти сделан весьма добротно.

    С другой стороны на основание монтируется радиальный вентилятор, который прогоняет воздух сквозь ребра основного радиатора.

    Охладитель графического чипа простоват. Никаких медных трубок, только медная вставка в зоне контакта. Да и габариты у радиатора, откровенно говоря, маловаты. Впрочем, речь идет о чипе с небольшим TDP, так что такая конструкция может быть вполне оправданной.

    Печатная плата меньше 18 сантиметров. Монтаж элементов очень плотный. Система питания насчитывает шесть фаз. В углу находится один разъем питания на шесть контактов.

    Процессор Polaris не имеет маркировки на поверхности, все обозначения расположены на подложке.

    Восемь гигабайт памяти набрано микросхемами Samsung K4G80325FB-HC25.

    Утилита GPU-Z верно определяет все характеристики. Частоты, как видно по нижнему скриншоту, отвечают рекомендованным. GPU работает на Boost 1266 МГц, память на 2000 МГц (эффективное значение 8000 МГц).

    Тестирование проходило на открытом стенде при 27 °C внутри помещения. В таких условиях температура карты легко переваливала за 80 °C во всех игровых тестах. В The Division при максимальном качестве графики пиковые значения доходили до 84 °C. На скриншоте внизу отражены максимальные параметры и значение частоты ядра в отдельный момент времени (по наведению на точку графика).

    Бенчмарк Metro: Last Light легко прогревал ядро до 85 °C. В обоих тестах частота варьировалась, были понижения до 1180 МГц и менее. Впрочем, значение 1200 МГц можно принять как среднее в тяжелых тестах.

    Шум умеренный, вентилятор раскручивался до 2200 об/мин.

    Как разогнать Radeon RX 480? Идем в AMD Settings, «Глобальные настройки».

    В настройках придется сразу задать высокую скорость для вентилятора, ведь особого запаса для охлаждения в разгоне у стандартного кулера нет. Потом экспериментируем с частотами. Также полезным будет увеличение целевой температуры, после которой начинается поэтапное снижение частоты. Но с этим нужно быть аккуратным и не допустить перегрева. При максимальных оборотах вентилятора мы подняли этот лимит на 4 °C, что помогло повысить средний Boost в условиях высоких рабочих температур.

    Итоговый разгон составил лишь +4,5% к начальной частоте ядре. Но с учетом повышения планки температурного лимита реальная разница по Boost может оказаться чуть выше. Память стабильно работала на 8720 МГц. При конфигурации частот 1235/8720 МГц удалось пройти все тесты, более высокие частоты могли приводить к сбоям.

    Прирост небольшой, зато шум возрастает серьезно. Охлаждение работает на пределе возможностей и в пиковые моменты подвывает на все 5000 об/мин. В ряде тестов частота стремилась к максимуму в 1325 МГц, но в Metro: Last Light бывали просадки ниже 1300 МГц. Такой момент отражен на нижнем скриншоте.

    В качестве дополнения приведем скриншот программы майнинга на Radeon RX 480 при номинальных частотах.

    Характеристики тестируемых видеокарт

    Рассмотренная видеокарта будет сравниваться с основным конкурентом в лице GeForce GTX 970. Обычную версию соперника заменит MSI GTX 970 Gaming 4G . Мощное охлаждение дает карте MSI преимуществе в виде постоянного максимального Boost. Чтобы приблизить производительность к уровню референсной карты GeForce GTX 970 с плавающим Boost, частоты MSI откалиброваны так, чтобы максимальный Boost не превышал 1200 МГц в игровых тестах и 1220 МГц в тестах 3DMark.

    В некоторых приложениях будут дополнительные режимы, где проведено сравнение с топовыми моделями AMD и NVIDIA. Поэтому приведем характеристики всех участников в таблице.

    Видеоадаптер Radeon RX 480 Radeon R9 Fury X GeForce GTX 1070 GeForce GTX 980 Ti GeForce GTX 970
    Ядро Polaris 10 Fiji GP104 GM200 GM204
    Количество транзисторов, млн. шт н/д 8900 7200 8000 5200
    Техпроцесс, нм 14 28 16 28 28
    Площадь ядра, кв. мм 232 596 314 601 398
    Количество потоковых процессоров 2304 4096 1920 2816 1664
    Количество текстурных блоков 144 256 120 176 104
    Количество блоков рендеринга 32 64 64 96 56
    Частота ядра, МГц 1120-1266 До 1050 1506-1683 1024-1100 1051-1178
    Шина памяти, бит 256 4096 256 386 256
    Тип памяти GDDR5 HBM GDDR5 GDDR5 GDDR5
    Частота памяти, МГц 8000 1000 8000 7010 7010
    Объём памяти, МБ 8192 4096 8192 6144 3584 + 512
    Поддерживаемая версия DirectX 12 12 12.1 12.1 12
    Интерфейс PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0
    Мощность, Вт 150 275 150 250 145

    Тестовый стенд

    Конфигурация тестового стенда следующая:

    • процессор: Intel Core i7-6950X (3,0@4,1 ГГц);
    • кулер: Noctua NH-D15 (два вентилятора NF-A15 PWM, 140 мм, 1300 об/мин);
    • материнская плата: Gigabyte GA-X99P-SLI;
    • память: G.Skill F4-3200C14Q-32GTZ (4x8 ГБ, DDR4-3200, CL14-14-14-35);
    • системный диск: Intel SSD 520 Series 240GB (240 ГБ, SATA 6Gb/s);
    • дополнительный диск: Hitachi HDS721010CLA332 (1 ТБ, SATA 3Gb/s, 7200 об/мин);
    • блок питания: Seasonic SS-750KM (750 Вт);
    • монитор: ASUS PB278Q (2560х1440, 27″);
    • операционная система: Windows 10 Pro x64;
    • драйвер Radeon RX 480: AMD Crimson 16.6.2.
    • драйвер Radeon R9 Fury: AMD Crimson 16.5.3.
    • драйвер GeForce GTX 1070: NVIDIA GeForce 368.39;
    • драйвер GeForce GTX 1080: NVIDIA GeForce 368.25;
    • драйвер GeForce GTX 980 Ti: NVIDIA GeForce 368.22.

    За основу взята тестовая методика, описанная в одной из прошлых статей . Но поскольку там использовалась конфигурация тестов для топовых видеокарт, в данном сравнении задействованы не все режимы и приложения. В некоторых случаях при вынужденном понижении качества графики сравниваются только Radeon RX 480 и GeForce GTX 970. В других случаях, где правки в настройки тестовых приложений не вносились, их результаты дополнены результатами флагманских видеокарт.

    Результаты тестирования

    Batman: Arkham Knight

    Radeon RX 480 одерживает вверх над GeForce GTX 970 в Arkham Knight . Новичок AMD в номинале демонстрирует уровень производительности разогнанного конкурента. Повышение частот позволяет выиграть еще несколько процентов.

    Battlefield 4

    Иная ситуация в Battlefield 4 . Тут уже преимущество за GeForce GTX 970, и уже Radeon RX 480 надо разгонять, чтобы он приблизился к сопернику.

    DiRT Rally

    Можно говорить о паритете между новичком AMD и GeForce GTX 970 при начальных частотах. В разгоне преимущество получает второй. Оба значительно отстают от топовых решений.

    DOOM

    В новом DOOM разница между старшими и младшими видеокартами не столь критична, но нагнать их все равно не удастся. Странный результат GeForce GTX 1070 можно писать не проблемы с оптимизацией. Что-то до Radeon RX 480, то он обгоняет GeForce GTX 970 только в случае повышения своих частот.

    Fallout 4

    В Fallout 4 мы заново провели тесты в обычном Ultra-режиме, поэтому старшие видеокарты из прошлых обзоров в сравнение не попали. При начальных частотах до 5% выигрывает Radeon у соперника, но после разгона баланс меняется в пользу GeForce.

    Far Cry Primal

    Более 11% выигрывает герой обзора у GeForce GTX 970 в Far Cry Primal при сравнении в номинальных режимах. В разгоне соперники равны. Сам разгон придает ускорение около 9%.

    Gears of War: Ultimate Edition

    Первый сюрприз от новичка. При максимальном качестве текстур Radeon RX 480 демонстрирует небольшое отставание от Radeon R9 Fury. С такими текстурами игре нужно более 4 ГБ, что и ограничивает потенциал флагмана AMD. По этой же причине в конце рейтинга GeForce GTX 970 со своей комбинированной памятью, где эффективно используются только 3,5 ГБ. Логично предположить, что в случае понижения качества текстур до обычного уровня разница между соперниками уменьшится.

    Grand Theft Auto 5

    Небольшой перевес над соперником у Radeon в GTA 5 при начальных частотах. После разгона ситуация противоположная, но разница не кардинальная.

    Just Cause 3

    Radeon RX 480 быстрее соперника на 5-11% в Just Cause 3 , и даже после разгона сохраняется крошечное преимущество. Примечательно, что ускоренный Radeon RX 480 отстает от Radeon R9 Fury X лишь на 10% — хороший результат!

    Metro: Last Light

    В Last Light мы провели два тестирования. При более простых настройках сравнили наших конкурентов в том режиме, что им по силам. Дополнительно сравнили их с топами при SSAA.

    Небольшое отставание от соперника в номинале и более веское после разгона. При этом все равно приятно, что можно комфортно играть даже в 2K.

    О конкуренции с топами речи не идет. Отставание Radeon RX 480 от Radeon R9 Fury X достигает 51%. Прирост от разгона 9%.

    Quantum Break

    Со времени первых тестов улучшились результаты GeForce GTX 970 в Quantum Break . Но даже после разгона этот соперник слабее Radeon RX 480 в номинале. Отставание нашего героя от Fury X на уровне 25%. Заслуга этого как в обновленной архитектуре, так и в большом объеме памяти (игра к этому требовательна).

    Rise of the Tomb Raider

    Вначале сравним основных соперников в Full HD при профиле очень высокого качества.

    Игра Rise of the Tomb Raider известна серьезными требованиями к объему памяти. Поэтому небольшое отставание GeForce GTX 970 от Radeon RX 480 можно считать удивительным. В разгоне соперник даже вырывается вперед.

    Если свести бойцов со старшими видеоадаптерами в более тяжелом режиме, то никто не справится с задачей, кроме флагманских GeForce. Обратите внимание на мизерную разницу между Polaris 10 и Fury X. С учетом того, что игра в таком режиме использует более 7 ГБ, такая разница не столь уж и удивительна. Тут, скорее, показатели GeForce GTX 970 вызывают вопрос — от ускорителя мы ожидали худших результатов.

    The Witcher 3: Wild Hunt

    Играть в The Witcher 3 при разрешении 2K будет тяжеловато, но планка в 30 fps новым Radeon легко преодолевается. А это тоже впечатляющий результат для представителя среднего класса. Преимущество над младшим GeForce на уровне 4-9%, в разгоне соперник немного отыгрывается.

    Tom Clancy"s The Division

    Игра The Division тоже не по силам Radeon RX 480 в режиме 2K, зато мы можем сравнить соперников в экстремальных условиях. И снова наш герой лучше, хотя в разгоне GeForce снова дышит в спину. Разница между Radeon RX 480 и Radeon R9 Fury X до 38% по средней частоте кадров.

    Total War: Warhammer

    Новый тест в новой игре. Использовался специальный бенчмарк с поддержкой DirectX 12.

    Результаты явно говорят в пользу Radeon RX 480. Соперник и после повышения своих частот по-прежнему слабее. Масштабируемость производительности при разгоне слаба у обоих участников, что, возможно, связано с особенностями бенчмарка.

    XCOM 2

    Последнее игровое тестирование в XCOM 2 . Игра может и старшие видеокарты поставить на колени при тяжелом сглаживании. Мы же ограничимся профилем Ultra с простым сглаживанием FXAA.

    Изначально Radeon RX 480 ближе к уровню форсированного соперника. Но лучший частотный потенциал второго позволяет ему уравнять шансы после разгона.

    3DMark 11

    Radeon RX 480 в этом тесте уступает 5% конкуренту, обгоняя его только после повышения частот.

    3DMark Fire Strike

    А вот тут иная ситуация, и Radeon RX 480 сразу впереди с отрывом более 6%. Когда доходит до разгона, соперник опять выходит вперед.

    Энергопотребление

    Замеры производились согласно описанной ранее методике, но без учета данных старших видеокарт в Total War: Attila.

    Практически идентичные показатели у Radeon RX 480, GeForce GTX 970 и GeForce GTX 1070. Вроде бы и не очень весомое достижение для Radeon, но на фоне прожорливых Radeon R9 290/390 это серьезный результат. Резкое повышение потребляемой мощности при разгоне не радует. Похоже, каждый дополнительный процент к частоте ядра будет даваться с трудом.

    Выводы

    По итогам тестирования можно отметить близкие результаты у видеокарт Radeon RX 480 и GeForce GTX 970. Де-факто в номинале преимущество чаще на стороне новинки AMD, но соперник отыгрывается при разгоне. В DirectX 12 ситуация более однозначная и она явно в пользу Radeon RX 480. На стороне Radeon большой объем памяти, который уже могут задействовать некоторые игры. По причине такого объема можно даже наблюдать забавную ситуацию в Rise of the Tomb Raider, где удается нагнать Radeon R9 Fury X. Но в целом равнять Radeon RX 480 и Radeon R9 Fury X не стоит, это решения разного уровня. Приятно отметить, что потенциал видеокарты позволяет играть не только в Full HD, многие игры она вытягивает даже в режиме 2K. В своей ценовой категории Radeon RX 480 выглядит отлично — быстрее главного конкурента, перспективнее в DirectX 12 и при этом дешевле.

    Новый 14-нм техпроцесс обеспечивает невысокий уровень энергопотребления, но видеокарту холодной не назвать. Ради того, чтобы сделать Radeon RX 480 максимально доступным предложением на рынке, производитель немного сэкономил на охлаждении. Родной кулер справляется с номинальным режимом, но запаса для разгона у него нет. Также в разгоне резко возрастает потребляемая мощность. Похоже, начальные частоты близки к максимуму, и далее много не выжать. Но эксперименты с хорошим охлаждением имеют смысл, свою пользу от этого вы получите. Только придется подождать нереферерсные версии Radeon RX 480 или потратиться на СВО.

    Среди преимуществ Radeon RX 480 стоит упомянуть улучшенную поддержку VR, возможность работы с HDR и аппаратное кодирование/декодирование видео сверхвысоких разрешений. И если с точки зрения производительности это не самое мощное предложение от AMD, то точно самое прогрессивное на данный момент.

    Видеокарта AMD Radeon RX 480 стала хитом среди огромного числа пользователей после большой пиар-компании, в которой производитель обещал достаточно высокую производительность, которая близка GTX 970 и R9390, за относительно небольшую стоимость в $229 за 8Gb и $199 за 4Gb.

    Такие характеристики не остались не замеченными и многие потенциальные покупатели с нетерпением ждали часа «Икс» для ознакомления с новинкой. Ожидания подтвердились. Разработчики, как и обещали, создали поистине интересный продукт, который приобрел популярность, а первые партии были распроданы очень быстро.

    Чуть хуже дела обстоят с «нереференсами», которые, даже спустя недели только начали поставляться в магазины.

    Но речь сейчас пойдет не о них, а о родоначальнике в линейки Polaris 10 в эталонном исполнении. Видеокарта AMD Radeon RX 480 8Gb оказалась интереснее своих предшественников за счет нового 14-нм техпроцесса, невысокого энергопотребления, возросшего частотного потенциала и обновленных драйверов Crimson, вносившие утилиту для разгона Wattman.

    Спецификация

    • Производитель: AMD
    • Модель: Radeon RX 480;
    • Графический процессор: Polaris 10;
    • Техпроцесс: 14 нм;
    • Частота GPU: 1266 МГц;
    • Кол-во шейдерных процессоров: 2304;
    • Видеопамять: 8 Гб;
    • Тип видеопамяти: GDDR5;
    • Разрядность шины видеопамяти: 256бит;
    • Частота видеопамяти:2000 МГц (8.0 ГГц QDR);
    • Поддержка CrossFire: есть;
    • Порты: HDMI, 3 xDisplayPort;
    • Разъем дополнительного питания: 6-pin;
    • Длина:241 мм;
    • Цена: 18500 руб.

    Внешний вид и дизайн

    Видеокарта AMD Radeon RX 480 8Gb представлена в естественной вариации в виде «референса» с привычной формой - радиальный вентилятор, прогоняющий воздух через всю платы и выбрасывающей горячий через заднюю решетку, и радиатор, скрытый обновленным декоративным кожухом, пришедший к нам от модели Radeon Fury X.

    Новинка может похвастаться небольшими габаритами: длина видеокарты составляет 241 мм, ширина - 112 мм. В системном блоке она перекроет всего два слота расширения. Разработчики перешли к новому дизайну, который включает в себя много черного цвета. Как говорили в компании: даже красный оттенок в логотипе серии отпугивал потенциальных покупателей, связывающих его с высоким нагревом. Рейстайлинг пошел AMD на пользу.

    Обратная сторона графического ускорителя раскрывает пару интересных моментов. Во-первых, как мы видим, длина печатной платы гораздо меньше всей видеокарты и составляет 170 мм, что отлично вписывается в габариты ITX-систем, позволяя AMD Radeon RX 480 8Gb установить в корпуса форм-фактора Mini-ITX. Во-вторых, защитная крепежная крестовина в центре графического процессора перераспределяет нагрузку радиатора, защищая чип от повреждений при перегибе. Как для новинки с не самой габаритной системой охлаждения это лишняя перестраховка.

    Боковые элементы скрыты плотными стенками кожуха, которые полностью перенаправляют горячий воздух к задней интерфейсной панели, где он выходит наружу и не нагревает внутренние комплектующие ПК.

    Дополнительное питание реализовано всего одним шестиконтактным разъемом, как бы намекая пользователю о низком энергопотреблении. Однако, это стало камнем преткновения для оверклокеров и новостным поводом, что это может привести к повреждению коннектора PCI-Express материнской платы. Как рассказали сами разработчики AMD, установка разъема 6-pin аргументирована тем, что многие бюджетные «машины», а видеокарта у нас из сегмента Middle-end, то есть для широкого и доступного класса, оснащаются блоками питания невысокой мощности, имеющий только шестиконтаткный коннектор питания для видеокарты.

    На задней интерфейсной панели тоже произошли значительные изменения. Привычный видеовыход DVI-D не установлен на моделях Radeon RX 480 8Gb эталонного дизайна, хотя контактная площадка имеется. Это сделано для того, чтобы горячий воздух встречал наименьшее сопротивление: ошибки модели Radeon R9290(X) исправлены. Сейчас новинка может похвастаться одним выходом HDMI версии 2.0b и тремя DisplayPort 1.4 (HDR).

    Система охлаждения

    Декоративный кожух системы охлаждения крепится по бокам винтами. Внутри он имеет простую форму с направляющей стенкой в передней части для радиального вентилятора или проще «турбины».

    Система охлаждения видеокарты AMD Radeon RX 480 8Gb, несмотря на свою невысокою стоимость, оказалась не так проста, как ожидалось. Перед инженерами стояла нелегкая задача - установка на видеокарту в $229 кулера, который сможет похвастаться эффективностью и низким уровнем шума.

    В центре расположен алюминиевый радиатор с высокими ребрами и полным отсутствием тепловых трубок.

    Сняв крестовину и демонтировав охладитель, понимаешь, что кулер и пластина не припаяны между собой как было прежде, а представляют отдельные составляющие. На практике, в случае установки сторонних систем охлаждения, это позволяет оставить черную пластину и охлаждать элементы на плате, как и задумано в "референсе".

    Радиатор представлен в виде простенькой конструкции с медной вставкой. Подобная алюминиевая болванка с оговорками справляется с нагревом чипа Polaris 10, однако, вентилятор и умные алгоритмы управления питанием неплохо справляются со своей работой.

    Зону VRM охлаждает единая черная пластина, которая на этом участке имеет оребрение. Данная конструкция встречается повсеместно на недорогих видеокартах.

    В целом, разработчики постарались не обделить вниманием ни один элемент на печатной плате, будь то транзисторы или микросхемы памяти. Подобной организации охлаждения удостаиваются не все графические ускорители.

    Печатная плата

    Новинка выполнена на печатной плате текстолита черного цвета, длина которого всего 170 мм. Такая длина была достигнута за счет плотной компоновки элементов и графического процессора, который не требует сложных разводок на PCB. Видеокарта AMD Radeon RX 480 8Gb построена с использованием высококачественной элементной базой.

    Подсистема питания расположена в левой части, она выполнена по схеме «6+1», где шесть фаз отводится на графический процессор и одна - на видеопамять. Для видеокарты с TDP равный 150 Вт имеется большой запас по мощности. В качестве ШИМ-контроллера используется микросхема IR3567B, которая устанавливается и на модели прошлых серий. Она поддерживает регулировку напряжения и защиты OVP, UVP, OCP и OTP.

    Чип Polaris 10 расположен в центре печатной платы, оснащен защитной рамкой и повернут на 45°С. Подобная реализация встречалась на графических процессорах Pitcairn. Он включает 2304 шейдеров, 32 блока растеризации, 144 текстурных блоков, произведен на 18 неделе 2016 года.

    Восемь микросхем видеопамяти общим объемом 8192 Мбайт функционируют на частоте 2000 МГц (эффективная частота - 8000 МГц). Это чипы компании Samsung, маркировка K4G80325FB-HC25. Они относятся к самым производительным решениям в линейке, однако, могут похвастаться и высоким разгонным потенциалом, который, к сожалению, пока ограничен на отметке в 2250 МГц.

    Конфигурация тестового стенда

    • Процессор: Intel Core i7-4770K (4000 МГц);
    • Материнская плата: MSI Z97 Gaming 5, версия БИОС 1.11;
    • Кулер: ;
    • Термоинтерфейс: Arctic Cooling MX-2;
    • Память: 2 x 4 Гбайт DDR3 2133, Kingston HyperX Genesis (KHX18C10/4);
    • Видеокарта:AMDRadeon RX 4808Gb;
    • Накопитель SSD: SanDisk X110 256 Гбайт;
    • Блок питания: ChieftecAPS-1000C 1000W;
    • Корпус: Cooler Master HAF 922;
    • Монитор: BenQ GW2460HM;
    • Операционная система: Windows 7 64-bit Service Pack 1;
    • Драйвера: AMD Catalyst 16.7.3 .

    В качестве центрального процессора был использованIntel Core i7-4770K, частота которого была повышена до 4000 МГц. Частота памяти была зафиксирована на отметке 1600 МГц при таймингах 9-9-9-27.Роль платформы выполняла материнская платаMSI Z97 Gaming 5.

    Видеокарта AMD Radeon RX 480 8Gb обладает повышенным частотным потенциалом. Базовая частота составляет 1120 МГц, которая динамически повышается до 1266 МГц. В простое вентилятор работает лишь при 800 об/мин, температура графического процессора держится на отметке 41°С.

    В играх система охлаждения работает при 2150 об/мин, и не смотря на аномальную жару не позволяет прогреться чипу выше 84°С.

    Синтетические тесты

    Для оценки производительности в синтетике использовались тесты Valley Benchmark, Heaven Benchmark и 3DMark 2013.










    Игровые тесты

    Перейдем к игровым приложениям и остановимся на методике тестирования. Измерение FPS проводилось с помощью утилит FRAPS и MSI AfterBurner, разрешение во всех играх было установлено на 1920х1080точек. Вручную отключены следующие параметры:

    • VSync (вертикальная синхронизация)

    Все остальные настройки в играх были установлены на максимально возможные.

    *список игр будет расширяться.

    Температура и разгон

    Видеокарта AMD Radeon RX 480 8Gb построена на архитектуре Graphics Core Next версии 1.4, которые преподнесло новые возможности и технологии, однако, поговорим о базовых настройках, касающихся такого параметра как Power Limit. Непосредственно Power Limit регулирует пороговое значения энергопотребления, при прохождении которого графический ускоритель начинает сбрасывать частоты. Разработчики постарались предоставить общественности, что Radeon RX 480 8Gb энергоэффективна, и эта правда, однако, новинка очень зажата в параметре TDP, и увеличение Power Limit как никакой другой видеокарте от AMD дает такуюприбавку производительности.


    WattMan — новая утилита от AMD для разгона видеокарт, встроенная в драйвер Crimson. Имеется возможность вручную устанавливать частоты ядра и видеопамяти, так и напряжение для GPU и Memory. Управление скоростью вращения вентилятора реализовано интересными способами, где мы теперь может выставлять как напрямую обороты в минуту, так и косвенные признаки как критическую температуру и целевую температуру.

    С помощью WattManбыл произведен разгон видеокарты AMD Radeon RX 480 8Gb, все выставленные значения для данного экземпляра вы можете наблюдать на скриншоте.

    Частоту ядра удалось поднять с 1266 МГц до 1350 МГц при напряжении 1.15 В - далее штатными средствами невозможно, сторонние утилиты позволяют увеличивать напряжение до 1.3 В, что позволяет разогнать видеокарту до 1500 МГц. Частота памяти, как и говорилось ранее, ограничена в 2250 МГц и пока средств обхода не разработано.

    Разгон составил 7% и 12% соответственно.

    Данные операции позволили повысить производительность на 14%.

    Аномальная жара воцарилась в помещении на время тестирования - около 30°С. Несмотря на данный фактор, система охлаждения работала достаточно тихо, а температура графического процессора не превышала 83-84°С в номинальном режиме и 89°С в ручном разгоне.

    Заключение

    В нашем полку пополнение в лице AMD Radeon RX 480 8Gb, которая построена на новом 14-нм техпроцессе, а ее производительность сопоставима с более дорогими моделями GeForce GTX 970 и Radeon R9390. Пусть новинка пока не везде обходит конкурентов по среднему значению FPS, однако, эта первая ласточка на FinFET и тонкая настройка и оптимизация драйверов только начинаются. Разработчики уже выпустили две версии программного обеспечения, которые повышают производительность в играх.

    Видеокарта AMD Radeon RX 480 8Gb может похвастаться улучшенной энергоэффективностью, частотным и разгонным потенциалом, улучшением микроархитектуры GCN, видеовыходы новых ревизий и тихой системой охлаждения.

    Подводя итоги хочется отметить, что оптимисты увидят в AMD Radeon RX 480 8Gb шаг вперед, реалисты - отличную видеокарту, а пессимисты - аналог GeForce GTX 970, выпущенный два года спустя.

    Достоинства:

    • Высокая производительность;
    • По современным меркам - 8 Гбайт видеопамяти;
    • Невысокое энергопотребление;
    • Тихая система охлаждения;
    • Качественная элементная база;
    • Рекомендованная стоимость.

    Недостатки:

    • Не обнаружено.

    Обзор AMD Radeon RX 480 8GB | Встречайте Polaris 10

    Восемь месяцев назад AMD начала раскрывать возможности GPU следующего поколения, начав с обновлённого контроллера дисплея с поддержкой HDMI 2.0b и DisplayPort 1.3 HBR3, FreeSync по HDMI и HDR-совместимый конвейер. Позже стала появляться дополнительная информация, в которой говорилось о выпуске двух разных GPU, один из которых разработан специально для рынка массовых настольных систем, а другой для мобильных решений, предлагающих производительность уровня консолей в тонких и лёгких форм-факторах.


    Второй продукт включает 16 вычислительных блоков (CU), 128-битную шину памяти и ускоренное кодирование/декодирования 4K-видео. Пока он не доступен. Видеокарта AMD Radeon RX 480 использует более крупный процессорный дизайн Polaris 10. В плане физических размеров он не больше процессора Nvidia GP100 с 15,3 млрд. транзисторов, но его возможностей достаточно, чтобы управлять лучшими гарнитурами виртуальной реальности. По уровню производительности карта находится в одном ряду с AMD Radeon R9 290 и Nvidia GeForce GTX 970.

    Средний уровень производительности карты трудно назвать сногсшибательным, особенно на фоне нового графического процессора Nvidia GP104. Однако AMD Radeon RX 480 стоит заметно дешевле аналогичных по скорости решений, а потребляемая мощность ограничена 150 Вт. Таким образом, AMD рассчитывает сделать виртуальную реальность доступной для более широкой аудитории геймеров (хорошо, если бы ей подыграли компании, которые продают HMD за $800 и $600).

    Доступны две версии AMD Radeon RX 480 : модель за $200 (MSRP), оснащённая 4 Гбайт видеопамяти GDDR5 со скоростью передачи данных 7 Гбит/с и версия за $240 (MSRP) с 8 Гбайт GDDR5 со скоростью 8 Гбит/с. Сегодня мы тестируем модель с объемом памяти 8 Гбайт.

    Особенности Polaris 10

    Polaris 10 состоит из 5,7 миллиардов транзисторов на кристалле площадью 230 мм2. Для сравнения, кристалл Hawaii имеет 6,2 миллиардов транзисторов и площадь 438 мм2. Несмотря на меньшее число транзисторов и пониженную примерно на 55% потребляемую мощность, RX 480 в большинстве тестов находится между R9 290 и 390. Во многом, это заслуга техпроцесса FinFET 14 нм от GlobalFoundries, который обеспечивает AMD заметные преимущества в производительности и энергопотреблении по сравнению с планарными транзисторами, изготовленными с использованием техпроцесса 28 нм. FinFET даёт более высокую частоту при любом уровне потребляемой мощности, и наоборот, при любой тактовой частоте чип с 14 нм потребляет меньше энергии. В случае Polaris AMD использовала оба преимущества, увеличив тактовые частоты и понизив энергопотребление. Так ей удалось превзойти более мощный в плане ресурсов GPU Hawaii сохранив потолок мощности в 150 Вт (хотя наши измерения показывают, что эта цифра немного преуменьшена).

    Несмотря на новое кодовое имя, Polaris 10 основан на архитектуре AMD Graphics Core Next четвёртого поколения. Поэтому строительные блоки процессорного дизайна Polaris многим энтузиастам покажутся знакомыми, а нам будет проще его описать.

    Спецификации

    AMD Radeon RX 480 AMD Radeon R9 390 AMD Radeon R9 290
    Polaris 10 Grenada Pro Hawaii Pro
    Вычислительные блоки (CU) 36 40 40
    Потоковые процессоры 2304 2560 2560
    Тактовая частота (базовая/Boost), МГц 1120/1266 1000 947
    Пиковая скорость вычислений, GFLOPs (при базовой частоте) 5161 5120 4849
    Количество блоков текстур 144 160 160
    Скороть заполнения текстур Гтекс/с 182,3 160 160
    Количество блоков растеризации 32 64 64
    Объем кэша L2, Мбайт 2 1 1
    Скорость передачи данных памяти, Гбит/с 8 (8 Гбайт) / 7 (4 Гбайт) 6 5
    Пропускная способность памяти, Гбайт/с 256 384 320
    Шина памяти, бит 256 512 512
    Тепловой пакет, Вт 150 275 250
    Количество транзисторов, млрд. 5,7 6,2 6,2
    Площадь кристалла, мм2 230 438 438
    Техпроцесс, нм 14 28 28
    Стартовая цена $240 (8 Гбайт) / $200 (4 Гбайт) $330 (8 Гбайт) $400 (4 Гбайт)

    За диспетчеризацию очерёдности графических инструкций в шейдерные блоки (Shader Engine) по-прежнему отвечает один командный процессор (GCP-Graphics Command Processor). Очерёдностью вычислительных инструкций занимаются асинхронные вычислительные блоки (ACE - Asynchronous Compute Engine). Только вместо восьми блоков ACE логика исполнения команд теперь состоит из четырёх ACE и двух аппаратных планировщиков (Hardware Scheduler), выполняющих задачи приоритизации очередей, управления временными/пространственными ресурсами и разгрузки задач планирования драйвера режима ядра ЦП. По сути, это не отдельные или новые блоки, а скорее дополнительный режим, в котором могут работать существующие конвейеры. Дэйв Нэлэско, старший управляющий AMD по технологическим процессам в графике, дал следующий комментарий:

    "HWS (Hardware Workgroup/Wavefront Schedulers) в сущности являются конвейерами ACE без контроллеров диспетчеризации. Их задача заключается в разгрузке ЦП путём управления процессом планирования очередей, заданных пользователем/драйвером, на доступных аппаратных слотах очереди. Это программируемые процессоры с микрокодом, к которым могут применяться различные политики планирования. Мы использовали их, чтобы реализовать функции Quick Response Queue и CU Reservation. Также удалось портировать эти изменения на видеокарты с архитектурой GCN третьего поколения с помощью обновления драйверов."

    Функция Quick Response Queues позволяет разработчикам приоритизировать определённые задачи, которые выполняются асинхронно, не вытесняя другие процессы полностью. Более подробное объяснение можно найти в блоге Дэйва (англ.). Если коротко, AMD хочет добиться гибкости. Её архитектура даёт возможность использовать разные подходы для оптимизации загрузки ресурсов и сведения задержки рендеринга к минимуму, а оба этих фактора крайне важны для приложений виртуальной реальности.

    Хорошо знакомые нам вычислительные блоки CU состоят из 64 шейдерных модулей, совместимых со стандартом IEEE 754-2008, разделённые на четыре векторных модуля, скалярного блока и 16 модулей загрузки/хранения выборки текстуры. Кроме того, в каждый CU входят четыре блока текстурирования, 16 Кбайт кэша L1, 64 Кбайт локального пространства для обмена данными и регистровое пространство для векторных и скалярных единиц. В AMD утверждают, что внесли много корректировок для улучшения эффективности CU, включая добавление поддержки FP16 (и Int16), оптимизацию доступа к кэшу и улучшение упреждающей выборки команд. В совокупности, эти изменения обеспечивают прирост производительности CU до 15% по сравнению с GPU Hawaii (GCN 2-го поколения).

    Девять CU образуют крупный шейдерный блок (SE - Shader Engine). Видеочип Polaris 10 имеет четыре таких SE и нам известно, что это максимум для этой архитектуры. Всего получается 2304 потоковых процессора и 144 блока текстурирования (64 шейдеров х 9 CU х 4 SE).

    Каждый шейдерный блок связан с блоком геометрии (GE - Geometry Engine). По информации AMD, в геометрический блок был добавлен ускоритель отсеивания геометрических примитивов (primitive discard accelerator), он отсеивает простейшие геометрические элементы, которые не растеризуются в пиксель до сканирующего преобразования, таким образом, увеличивается пропускная способность. Это автоматическая функция этапа предварительной растеризации графического конвейера и она является новшеством для Polaris. Кроме того, появился индексный кэш для клонированной геометрии, хотя мы не знаем его объём и степень влияния при клонировании.

    По аналогии с видеочипом Hawaii, процессор Polaris 10 способен отрисовывать четыре простейших элемента за такт. Однако, по сравнению с графическими процессорами Hawaii/Grenada с частотой до 1050 МГц (в случае R9 390X), AMD подняла базовую частоту AMD Radeon RX 480 до 1120 МГц, а частоту в режиме Boost до 1266 МГц. Выходит, что потерю ресурсов на кристалле компания компенсирует повышенной частотой. Производительность вычислений одинарной точности с плавающей запятой у Radeon R9 290X составляет 5,6 TFLOPS, а RX 480 достигает в режиме Boost 5,8 TFLOPS.

    Насколько реальна тактовая частота 1266 МГц? GPU Hawaii с трудом поддерживал указанную в спецификациях частоту, поскольку сильно нагревался, и мы хотели удостовериться, что c Polaris подобного не случится. Используя GPU-Z, мы сняли показания тактовой частоты в интегрированном бенчмарке игры Metro: Last Light Redux, повторённом 10 раз подряд, и получили следующий график:

    Тактовая частота в стресс-тесте – встроенный бенчмарк Metro: Last Light Redux, 10 проходов, МГц

    Разница между верхней (1265 МГц) и нижней (1118 МГц) точками на графике составляет 148 МГц. Можно сказать, что AMD чётко вписывается в указанные лимиты, хотя частота в процессе теста постоянно корректируется. Но, по крайней мере, средний показатель 1208 МГц находится ближе к верхнему значению.

    SE графических процессоров Hawaii и Fiji имеют по четыре бэкэнда рендеринга, способные выводить 16 пикселей за такт (всего 64 пикселей за такт). У Polaris 10 этот компонент урезан наполовину. На каждый SE приходится два бэкэнда рендеринга, каждый с четырьмя блоками ROP, в совокупности они отрисовывают 32 пикселя за такт. Разница с Radeon R9 290 на базе Hawaii весьма существенная. Ситуацию усугубляет 256-разрядная шина памяти Polaris 10, которая вдвое уже шины памяти видеочипа Hawaii (512-бит). Версия AMD Radeon RX 480 4 Гбайт использует память GDDR5 со скоростью передачи данных 7 Гбит/с и имеет пропускную способность 224 Гбайт/с, в то время как модель на 8 Гбайт, которую мы тестируем сегодня, использует память со скоростью передачи данных 8 Гбит/с, и пропускная способность увеличена до 256 Гбайт/с. Но в любом случае, это намного меньше, чем 320 Гбайт/ у R9 290.

    Сокращение аппаратных ресурсов частично компенсируется улучшенной дельта-компрессией цвета, которая сокращает количество передаваемой через шину информации. Также AMD поддерживает сжатие в соотношении 2/4/8:1 без потерь, как и архитектура Nvidia Pascal. Ко всему прочему, Polaris 10 использует кэш L2 объёмом 2 Мбайт, такой же объём использовался в Fiji. Это позволит уменьшить число обращений к памяти GDDR5 и ещё больше снизить зависимость GPU от широкой шины и высокой скорости передачи данных.

    Тем не менее, обеднение бэкэнда GPU должно сказаться на производительности с ростом разрешения и интенсивности применения сглаживания. Нам было интересно, как Polaris будет выглядеть на фоне Hawaii с ростом интенсивности нагрузки. Чтобы это проверить, мы запустили тест Grand Theft Auto V в скромном разрешении 1920x1080 с "Очень Высокими" настройками детализации графики и постепенно увеличивали качество сглаживания.

    На графике хорошо видно, что при изменении сглаживания MSAA с 2х до 4х AMD Radeon RX 480 заметно быстрее теряет среднюю частоту кадров, чем R9 390. При отключённом сглаживании RX 480 достигает 97,3 FPS, а R9 390 – 90,4 FPS . Но к концу графика AMD Radeon RX 480 показала только 57,5 кадров в секунду, в то время как 390-я в среднем выдавала 62,9 кадров в секунду.

    Обзор AMD Radeon RX 480 8GB | Контроллер дисплея, UVD, VCE & WattMan

    Новый контроллер дисплея

    Мы уже рассматривали некоторые усовершенствования контроллера дисплея Polaris в статье "Планы функционального развития GPU AMD в 2016 году" . Но она была опубликована почти семь месяцев назад.

    Тогда нам было известно, что Polaris будет поддерживать интерфейс DisplayPort 1.3 с режимом High Bit Rate 3, используя существующие кабели и разъёмы, чтобы обеспечить скорость передачи до 32,4 Гбит/с через четыре линии. Теперь спецификация контроллера включает стандарт DisplayPort 1.4-HDR. Он не повышает скорость передачи данных, но включает технологию Display Stream Compression 1.2, позволяющий передавать 10-битный 4K-контент с частотой обновления 96 Гц. Также стандарт DisplayPort 1.4 поддерживает цветовое пространство.

    В краткосрочной перспективе AMD всё ещё рассматривает DP 1.3 как инструмент для реализации FreeSync в 4K. По заявлениям компании, панели с частотой обновления 120 Гц будут доступны уже к концу 2016 года, но чтобы добиться хорошей производительности с высокими настройками графики в такой конфигурации, возможностей AMD Radeon RX 480 будет недостаточно. При этом процессорный дизайн Vega с поддержкой HBM2 официально не появится до 2017 года.

    Поддержку HDR в Polaris мы уже обсуждали в конце прошлого года, но AMD повторяет, что конвейер дисплея готов к первому поколению 10-битных дисплеев с HDR, и 12-битных экранов с HDR в будущем. Легкопрограммируемый блок обработки цвета включает повторное наложение цветовой гаммы, управление гаммой, обработку с плавающей запятой и проекцию 1:1 с любым дисплеем.

    Ускорение кодирования/декодирования видео

    В годы расцвета компания ATI была известна производительными и качественными системами ускорения декодирования видео, которые переносили задачи воспроизведения видео с центрального процессора на комбинацию программируемых шейдеров и блоков с фиксированной функцией, установленных в GPU.

    У нас нет подробных данных насчёт того, на каком этапе декодер Polaris выполняет свои задачи, но известно, что он основан на декодере UVD и, по-видимому, имеет фиксированную функциональность. AMD указывает в спецификациях наличие декодирования HEVC в режиме до 4K60 с применением профиля Main 10, который поддерживает формат 10-бит 4:2:0 (всё это необходимо для работы HDR). Есть аппаратная поддержка декодирования стандарта VP9, хотя драйверы AMD её ещё не внедрили, нам лишь известно, что функция запланирована в будущем обновлении. Если AMD хочет реализовать цветовую субдискретизацию HEVC 10-bit/4:2:0 с HDR, потребуется совместимость как минимум с профилем 2. Также предусмотрено аппаратное ускорение формата M-JPEG в режимах до 4K30.

    Развитие кодировщика видео AMD (VCE - Video Coding Engine) также не очень хорошо задокументировано. Известно, что Polaris может кодировать видео в стандарте HEVC 8-бит до 4K60, но GPU на базе архитектуры GCN 1.2 имеют такое же оснащение. Складывается ощущение, что AMD работает над расширением списка совместимых с VCE приложений. Само собой, поддерживается фирменный клиент Gaming Evolved. Но кроме этого, в списках присутствует программа Open Broadcaster Software, которая ранее поддерживала только QuickSync и NVEnc. Также есть Plays.tv – социальная сеть от компании, отвечающей за клиент Gaming Evolved.

    Новый середнячок, догоняющий топовые ускорители предыдущего поколения

    • Часть 2 - Практическое знакомство

    Представляем базовый детальный материал с исследованием AMD Radeon RX 480.

    Объект исследования : Ускоритель трехмерной графики (видеокарта) AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E

    Сведения о разработчике : Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) около 2000 человек.

    Часть 1: Теория и архитектура

    В своих прошлых статьях мы неоднократно сетовали на застой в области графических процессоров, связанный с задержками производства GPU по новым технологическим процессам и фактическим пропуском одного из них - 20 нм техпроцесса, который оказался непригодным для массового выпуска сложных видеочипов. На протяжении долгих пяти (!) лет обе компании, являющиеся производителями GPU, выпускали решения на основе уже весьма старого 28 нм техпроцесса.

    Производители микроэлектронных чипов смогли наладить массовое производство с применением новых FinFET-техпроцессов (14 и 16 нм, в зависимости от производителя) таких сложных и крупных чипов лишь ближе к середине года. Не так давно «отстрелялась» компания Nvidia, выпустившая довольно дорогие видеокарты, предназначенные для верхней части их линейки, а теперь настало время компании AMD, которая пошла своим путем, выпустив сначала не самые дорогие видеокарты, примерно аналогичные моделям Radeon HD 4850 и HD 4870, ставшими достаточно популярными в свое время.

    Чтобы лучше понять ход мысли представителей AMD, отличающийся от такового у их конкурентов, давайте рассмотрим их представления о наиболее востребованных на рынке видеокартах. По данным AMD, довольно малая доля игроков на ПК покупает дорогие видеокарты, обеспечивающие комфорт при высоких разрешениях и максимальных настройках, а большинство из них использует сильно устаревшие GPU. 84% игроков покупают видеокарты по цене от $100 до $300 по данным AMD, и лишь остальные игроки выбирают то, что дороже.

    Понятно, что большинство не сможет даже попробовать столь популярную сейчас тему виртуальной реальности при таковом желании, ведь VR требует очень приличных вычислительных мощностей. Кроме этого, по мнению AMD, не все пользователи желают вкладываться в то оборудование, что устареет уже через пару лет. Правда, вряд ли все они кинутся покупать VR-шлемы... С другой стороны, с устаревшими видеокартами у них и возможности то опробовать виртуальную реальность не появится. Всего 13 миллионов ПК по всему миру имеют достаточно мощную конфигурацию для запуска VR-приложений - это всего 1% из почти полутора миллиардов компьютеров, имеющихся у пользователей на руках.

    По данным опросов, приводимых AMD, две трети пользователей не планируют приобрести оборудование для VR именно из-за дороговизны такой конфигурации. Это в дополнение к вполне разумным доводам вроде тех, что шлемы пока что слишком громоздкие и с мешающими проводами, а виртуальная реальность в принципе применима лишь к малой части игровых применений. Все же, самой важной преградой для распространения VR является цена оборудования. И AMD считает для себя перспективной возможность обеспечить миллионы ПК графическими процессорами необходимой мощности в следующие несколько лет. Правда, остается непонятным, почему AMD считает недоступным компонентом именно видеокарту, если VR-шлем и контроллеры сами по себе стоят дороже? Впрочем, порог входа в VR они действительно могут немного снизить, предложив решения достаточной производительности за сравнительно малые деньги.

    И AMD продвигает свои новые решения во многом именно как производительные и энергоэффективные видеокарты, призванные «демократизировать» довольно дорогую виртуальную реальность, обеспечив желающих достаточной мощью GPU. А еще одной целью новых графических решений компании являются как компактные ПК со сверхнизким потреблением энергии, так и игровые ноутбуки, для которых сейчас можно легко обеспечить мощность, аналогичную или даже превосходящую возможности игровых консолей. К примеру, младший чип Polaris имеет не только низкое энергопотребление, но и специально предназначен для компактных ноутбуков - общая высота упаковки этого GPU составляет всего 1,5 мм по сравнению с 1,9 мм у Bonaire, что поможет AMD выиграть конкурсы на поставку решений для мобильных ПК.

    Для четкого попадания в такие требования, в AMD решили спроектировать две модели графических процессоров: Polaris 10 и Polaris 11, соответствующие определенным уровням возможностей и производительности. Старший чип серии Polaris обеспечит ПК-игроков достаточной мощностью для VR-приложений и всех современных игр, а менее производительный младший GPU предназначен для тонких и легких ноутбуков, но предлагает возможности и производительность, превосходящие параметры игровых приставок.

    Соответственно, на момент анонса, AMD предлагает следующие решения для настольных компьютеров:
    Radeon RX 460 - энергоэффективная видеокарта с низким потреблением энергии для нетребовательных игр и будущих мобильных решений, с мощностью в более чем 2 терафлопа, имеющая 2 ГБ видеопамяти, соединенной по 128-битной шине;
    Radeon RX 470 - весьма выгодная видеокарта среднего уровня за приемлемую цену, обладающая достаточной мощностью для игр в Full HD-разрешении, с мощностью более чем 4 терафлопа, 4 ГБ видеопамяти и 256-битной шиной;
    Radeon RX 480 - пока что самое производительное решение нового семейства, предназначенное для VR и современных игр с производительностью более чем 5 терафлопа, 4 или 8 гигабайтами памяти с 256-битной шиной, потребляющее менее чем 150 Вт.

    Сегодня мы рассмотрим как раз модель Radeon RX 480, которая предлагает премиальные возможности для игроков - Premium HD Gaming. Что это за термин в понимании AMD? Сюда включены как возможности новых графических API, вроде асинхронного исполнения в DirectX 12, так и технологии FreeSync и CrossFire. Но главное - преимущество над аналогичными по цене решениями конкурента, в современных играх с поддержкой DirectX 12:

    В большинстве игр текущего года с поддержкой DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War и Forza APEX) даже видеокарты предыдущего поколения AMD Radeon зачастую превосходят аналоги по цене у Nvidia: мы отмечали преимущество Fury X против 980 Ti, R9 390 против GTX 970 и R9 380 против GTX 960, а уж свежая модель на базе Polaris 10 просто обязана выступить еще лучше.

    Кроме DirectX 12 можно отметить и еще один API - Vulkan. В соответствующей версии игры Doom компания AMD заявляет прирост до 45% на Radeon RX 480 по сравнению с OpenGL-версией игры, хотя на старых видеокартах разница ожидается несколько меньше - порядка 20-25%.

    А что с виртуальной реальностью, действительно ли новинка AMD способна на достаточную производительность для VR-приложений? Благодаря высокой мощности GPU и поддержке таких возможностей как Asynchronos Time Warp, обеспечивается комфортный просмотр соответствующих VR-приложений, да еще при невысоком потреблении энергии. Так, общепринятый тест для оценки производительности SteamVR Performance Test показывает явное превосходство над решениями предыдущего поколения (непонятно, правда, почему сравнивали именно с Radeon R9 380?):

    Так как основой модели Radeon RX 480 является графический процессор Polaris 10, имеющий архитектуру GCN четвертого поколения, которая во многих деталях схожа с ранее вышедшими решениями компании AMD, то перед прочтением теоретической части статьи будет полезно ознакомиться и с нашими предыдущими материалами по прошлым видеокартам компании, основанным на архитектуре GCN предыдущих поколений:

    • AMD Radeon R9 Fury X: Новый флагман AMD с поддержкой HBM
    • AMD Radeon R9 285: Tahiti получил шину 256 бит и превратился в Tonga
    • AMD Radeon R9 290X: Дотянись до Гавайев! Получишь новые вершины скорости и функциональности
    • AMD Radeon HD 7970: Новый однопроцессорный лидер 3D-графики

    Рассмотрим подробные характеристики видеоплаты Radeon RX 480, основанной на полной версии графического процессора нового поколения Polaris 10.

    Графический ускоритель Radeon RX 480
    Параметр Значение
    Кодовое имя чипа Polaris 10 XT (Ellesmere)
    Технология производства 14 нм FinFET
    Количество транзисторов 5,7 млрд.
    Площадь ядра 232 мм²
    Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
    Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_0
    Шина памяти 256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
    Частота графического процессора 1120 (1266) МГц
    Вычислительные блоки 36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
    Блоки текстурирования 144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
    Блоки растеризации (ROP) 32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) - 128 отсчетов за такт
    Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready

    Спецификации референсной видеокарты Radeon RX 480
    Параметр Значение
    Частота ядра 1120 (1266) МГц
    Количество универсальных процессоров 2304
    Количество текстурных блоков 144
    Количество блоков блендинга 32
    Эффективная частота памяти 7000-8000 (4×1750-2000) МГц
    Тип памяти GDDR5
    Шина памяти 256-бит
    Объем памяти 4/8 ГБ
    Пропускная способность памяти 224-256 ГБ/с
    Вычислительная производительность (FP32) до 5,8 терафлопс
    Теоретическая максимальная скорость закраски 41 гигапиксел/с
    Теоретическая скорость выборки текстур 182 гигатекселя/с
    Шина PCI Express 3.0
    Разъемы Один разъем HDMI и три DisplayPort
    Энергопотребление до 150 Вт
    Дополнительное питание Один 6-контактный разъем
    Число слотов, занимаемых в системном корпусе 2
    Рекомендуемая цена $199/$229 (для рынка США)

    Название выпущенной сегодня модели видеокарты компании AMD вполне соответствует их текущей системе наименований. Ее имя отличается от предшественников измененным символом в первой части индекса и цифрой поколения - RX 480. Если со вторым изменением все понятно, ведь поколение действительно новое, то замена R9 на RX не совсем логична, на наш взгляд, ведь эта цифра раньше показывала уровень видеокарты: R7 были медленнее, чем R9, но все они выпускались в рамках одного поколения. А теперь непонятно, во-первых, почему у RX 480 эта цифра больше, чем у R9 390X, к примеру, и какие цифры после R в имени будут у младших решений, основанных на новых GPU.

    Первая модель в новом семействе Radeon 400 становится в текущей линейке компании на место предыдущих решений, аналогичных по позиционированию, замещая их на рынке. Так как выпущенная видеокарта относится скорее к среднему уровню по цене и скорости с учетом нового поколения, то для будущих решений на GPU еще большей мощности решили оставить индекс 490.

    Референсный вариант Radeon RX 480 будет предлагаться по рекомендованной цене в $199 в случае 4 ГБ варианта и $229 для 8-гигабайтной модели, и эти цены ну очень привлекательны! По сравнению с топовыми видеокартами предыдущего поколения, это очень хороший ценник, так как Radeon RX 480 по скорости не должна уступать таким моделям, как Radeon R9 390 и GeForce GTX 970. Именно с ними и будет конкурировать новинка, по крайней мере, в начале своего жизненного пути, до выхода планируемой к скорому выпуску GeForce GTX 1060. Но на момент своего выхода, сегодняшняя новинка абсолютно точно становится лучшим предложением по производительности в своем классе.

    Референсные видеокарты Radeon RX 480 будут поставляться в версиях с 4 ГБ памяти GDDR5 с эффективной частотой в 7 ГГц, и с 8 ГБ памяти с частотой в 8 ГГц. Но по мере поступления в продажу видеокарт собственного производства партнеров AMD, появятся и другие варианты, но все они будут оснащены GDDR5-памятью с частотой как минимум 7 ГГц - такова воля AMD.

    Решение по установке 4 и 8 ГБ памяти очень мудрое. Младший вариант позволит немного сэкономить, ведь 4 ГБ на данный момент можно считать «золотой серединой», а преимущество от 8 ГБ памяти у второго варианта Radeon RX 480 раскроется в перспективе. Хотя и 4-гигабайтный вариант видеокарты обеспечит приемлемую производительность в современных играх, но 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут. В качестве примера, преимущество в котором уже заметно, можно привести игру Rise of the Tomb Raider в DirectX 12-версии, при очень высоких настройках и разрешении 2560x1440 пикселей:

    Больший объем видеопамяти у Radeon RX 480 8 ГБ и Radeon R9 390 помогает избежать крайне неприятных падений производительности и рывков FPS, по сравнению с 4-гигабайтными вариантами, включая решения конкурентов GeForce GTX 970 и GTX 960. Именно Radeon RX 480 8 ГБ дает возможность получения плавного игрового процесса с отсутствием притормаживаний, связанных с подгрузкой данных, не помещающихся в локальную видеопамять. И так как игровые консоли нынешнего поколения имеют по 8 ГБ общей памяти, то преимущество от большего объема памяти будет только расти со временем, и 8-гигабайтный вариант Radeon RX 480 отлично подойдет для игр, который будут выходить в следующие несколько лет.

    Для дополнительного питания платой используется один 6-контактный разъем, а значение типичного энергопотребления у модели Radeon RX 480 на графическом процессоре Polaris 10 установлено на уровне 150 Вт. В реальности без разгона плата потребляет даже еще меньше, порядка 120 Вт энергии, но небольшой запас по питанию позволит улучшить оверклокерский потенциал. К слову, партнерами AMD планируется скорый выход фабрично разогнанных версий этой видеокарты, отличающихся и системами охлаждения и питания.

    Архитектурные особенности

    Графический процессор Polaris 10 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному на данный момент. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

    В своей основе, архитектура Polaris изменилась не слишком сильно, хотя не основные блоки видеочипа изменились заметнее - были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это очередное поколение известной архитектуры Graphics Core Next (GCN), уже четвертое по счету. Пока что в состав семейства вошли два чипа: Polaris 10 (ранее известный как Ellesmere) и Polaris 11 (ранее известный как Baffin).

    И все же некоторые аппаратные изменения в GPU были внесены. В список улучшений и изменений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

    В состав полноценного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти нового графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

    Заявлено улучшение геометрических движков в Polaris - в частности, появился так называемый ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники (например, с нулевой площадью). Также в новом GPU был введен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

    Ускоритель отбрасывания геометрических примитивов помогает увеличить скорость обработки геометрии, особенно в задачах вроде тесселяции с мультисэмплингом. На диаграмме видно, что в разных условиях новый блок позволяет увеличить производительность до трех раз. Впрочем, это синтетические данные заинтересованной стороны, лучше смотреть по игровым результатам независимых тестов.

    Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров - введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения.

    В очередной раз был улучшен и планировщик заданий hardware scheduler (HWS), использующийся при асинхронных вычислениях. В его задачи входит: разгрузка CPU от задач планирования, приоритезация задач реального времени (виртуальная реальность или обработка звука), параллельное выполнение задач и процессов, менеджмент ресурсов, координация и балансирование загрузки исполнительных блоков. Функциональность этих блоков можно обновить при помощи микрокода.

    Кроме того, что объем кэш-памяти второго уровня был увеличен вдвое до 2 МБ, была изменена обработка и кэширование данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, что в случае Polaris означает пропускную способность шины памяти до 256 ГБ/с. Но и на этом в AMD не остановились, дополнительно улучшив алгоритмы сжатия данных без потерь (Delta Color Compression - DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1.

    Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и до 35-40%.

    Если сравнивать Radeon RX 480 с Radeon R9 290, то новое решение потребляет заметно меньше энергии для обеспечения той же эффективной пропускной способности, по сравнению с видеокартой предыдущего поколения. В результате, у новинки заметно выше и производительность в пересчете на бит - хотя у Radeon R9 290 выше пиковая ПСП, но она куда энергоэффективнее используется в Polaris 10 - общее потребление энергии интерфейсом памяти составляет 58% от потребления старого GPU.

    В целом, изменения четвертого поколения GCN в графическом процессоре Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и техник управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. Если брать самый низкий уровень, то вычислительные блоки CU в Polaris 10 (Radeon RX 480) примерно на 15% производительнее блоков чипа Hawaii (Radeon R9 290).

    Сложно судить, насколько велик вклад той или иной оптимизации в общий прирост скорости, но если брать все оптимизации в комплексе, то разница в энергоэффективности между Radeon RX 470 и Radeon R9 270X, по оценке специалистов компании AMD, достигает 2,8-кратной. Причем, они оценивают вклад FinFET-техпроцесса меньше вклада своих оптимизаций. Вероятно, было выбрано самое выгодное сравнение, а для других моделей прирост по энергоэффективности несколько меньше. Например, если сравнить показатели RX 480 и R9 290, то разница по энергоэффективности будет ближе к двукратной. В любом случае, такие огромные приросты бывают раз в несколько лет, и уже поэтому у нас нет никаких сомнений в том, что продажи Radeon RX 480 будут успешными.

    Технологический процесс и его оптимизация

    Как мы уже говорили, главное в Polaris - это не изменения в аппаратных блоках, а большой шаг вперед из-за применения в производстве этого GPU нового техпроцесса 14 нм с использованием транзисторов с вертикально расположенным затвором (FinFET - Fin Field Effect Transistor), также известных как транзисторы с трехмерной структурой затвора или 3D-транзисторы.

    Динамическое энергопотребление растет линейно с ростом количества вычислительных блоков, и кубически при повышении частоты при помощи повышения напряжения (так, прирост частоты и напряжения на 15% увеличивает потребление более чем наполовину!), и в результате графические процессоры зачастую работают на более низких тактовых частотах, зато используют чипы большей плотности, чтобы поместить в них большее количество вычислительных устройств, которые работают параллельно.

    Последние пять лет графические процессоры выпускались при помощи 28 нм техпроцессов, а промежуточный 20 нм не дал требуемых параметров. Освоения еще более совершенных техпроцессов пришлось ждать довольно долго, и вот, для производства графических процессоров семейства Polaris, компания AMD выбрала производства компаний Samsung Electronics и GlobalFoundries с их 14 нм FinFET-техпроцессом, который обеспечивает производство одних из самых плотных микропроцессоров. Применение FinFET-транзисторов имеет решающее значение для снижения энергопотребления и снижения напряжения GPU примерно на 150 мВ, по сравнению с предыдущим поколением, сокращая мощность на треть.

    На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведенного с применением различных техпроцессов. Компании Samsung Electronics и GlobalFoundries разделяют заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство несложно, разделяя между ними заказы исходя из выхода годных чипов и других параметров, что должно позволить решить потенциальные проблемы с недостаточными объемами производства.

    Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности. Если описывать вкратце, то FinFET-транзистор - это транзистор с каналом, окруженным затвором через прослойку в виде изолятора с трех сторон - по сравнению с планарным, где поверхность сопряжения - это одна плоскость. FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно, для освоения соответствующих техпроцессов потребовалось пять лет.

    Зато новая форма транзисторов обеспечивает больший выход годных, меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники. Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

    В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведенными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведенных чипов одной модели) - сравните разброс параметров для FinFET-техпроцесса 14 нм и привычного 28 нм у TSMC:

    На этой диаграмме видны как большая средняя производительность для FinFET-продуктов, так и меньшие утечки в среднем, и меньший разброс в показателях производительности и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

    В итоге графические процессоры, произведенные при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных.

    Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и легких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъемов питания.

    Но для того, чтобы добиться большей энергоэффективности, недостаточно просто перевести чип на более «тонкий» техпроцесс, требуются многочисленные изменения в его дизайн. К примеру, в Polaris применяется адаптивное тактирование GPU. Графические процессоры работают при низком напряжении и высокой силе тока, и поставлять качественное напряжение от схем питания довольно сложно. Разброс в напряжении может достигать 10-15% от номинального значения, и среднее напряжение приходится повышать для того, чтобы перекрыть эту разницу, и на это тратится впустую куча энергии.

    Адаптивное тактирование в решениях AMD восстанавливает эти потери со снижением энергозатрат на четверть. Для этого, в дополнение к уже существующим сенсорам энергопотребления и температуры добавляется еще и сенсор частоты. В результате работы алгоритма достигается максимальная энергоэффективность для всего чипа.

    Также производится калибровка блока питания при загрузке системы. При испытаниях процессора запускается специальный код для анализа напряжения, и интегрированными мониторами питания записывается значение напряжение. Затем при загрузке ПК запускается тот же код и замеряется полученное напряжение, и регуляторы напряжения на плате устанавливают такое же напряжение, какое было при тестировании. Это исключает затраты энергии, которая расходуется из-за разницы в системах.

    Есть в Polaris и адаптивная компенсация старения транзисторов - обычно графические процессоры требуют запаса тактовой частоты порядка 2-3% для приспособления к старению транзисторов чипа, да и другие компоненты также демонстрируют старение (например, GPU получает более низкое напряжение от системы). Современные решения AMD умеют делать самостоятельную калибровку и адаптироваться к изменяющимся условиям со временем, что обеспечивает надежную работу видеокарты в течение продолжительного времени и немного повышенную производительность.

    Radeon WattMan - новые возможности разгона и мониторинга

    Важной составляющей любого современного видеодрайвера являются настройки для разгона, позволяющие выжать из GPU все его возможности. Ранее этим заведовал раздел AMD Overdrive в драйверах решений этой компании, а вместе с выходом новых решений в AMD решили кардинально обновить и этот раздел драйвера, назвав его Radeon WattMan.

    Radeon WattMan - это новая утилита AMD для разгона, позволяющая изменять напряжение GPU, частоту графического процессора и видеопамяти, скорость вращения вентилятора системы охлаждения и целевую температуру. Radeon WattMan основан на возможностях, виденных ранее в Radeon Software, но предлагает несколько новых функций по тонкому разгону - с иными возможностями по управлению напряжением и частотой GPU. Также в WattMan появился удобный мониторинг активности GPU, тактовых частот, температур и скорости вентилятора.

    Удобно сделано то, что как и в других настройках Radeon Software Crimson Edition, можно задать собственный профиль разгона для каждого приложения или игры, который будет применен при их запуске. А после завершения работы приложения, настройки вернутся к глобальным по умолчанию. Radeon WattMan можно найти в Radeon Settings, он заместил текущую панель AMD OverDrive, и совместим с серией AMD Radeon RX 400.

    Возможно как простое управление частотой GPU, так и тонкая настройка кривой частот. Простая настройка частоты работает по умолчанию и позволяет изменять заданные инженерами AMD значения, оптимальные для каждого состояния GPU. Изменение кривой частоты возможно с точностью в 0,5%. Есть и динамическое изменение кривой частоты, когда тактовая частота ядра GPU и видеопамяти может изменяться для каждого состояния вместе с изменением напряжения для каждого из них. Напряжения для GPU и памяти устанавливаются независимо друг от друга.

    Есть в WattMan и продвинутое управление скоростью вращения вентилятора в системе охлаждения, когда устанавливается минимальная скорость, целевая скорость и минимальный акустический предел. При этом целевая скорость вращения - это максимум, при котором будет вращаться вентилятор при температуре не выше целевой. Улучшенное управление температурой позволяет выставить максимальное и целевое значения температуры. Вместе с пределом потребления энергии, это позволяет выставить более тонкие настройки.

    Максимальная температура - это абсолютный максимум, при котором частота графического чипа не снижается, но после ее достижения, частота начнет снижаться. А целевая температура - значение, по достижению которого будет расти скорость вращения вентилятора. Предельное значение питания для GPU можно повысить или понизить в пределах до 50% (в случае модели Radeon RX 480).

    Кажется, мы где-то уже видели возможность тонкого изменения кривой частот и напряжений, причем совсем недавно, правда? Но чего мы еще точно не видели, так это удобного интерфейса мониторинга и настроек в самих драйверах, а не сторонних утилитах, и AMD можно лишь похвалить за такую заботу о пользователях.

    Новый интерфейс мониторинга позволяет записывать и просматривать активность графического процессора, его температуру, скорость вентилятора и частоты. Причем, есть как глобальный мониторинг (Global WattMan), так и отдельный мониторинг для пользовательских профилей, который мониторит пиковые и средние данные только когда приложение открыто. Данные собираются и в фоновом режиме, утилите Radeon Settings не обязательно быть запущенной, данные собираются максимум до 20 минут работы приложения.

    В целом, AMD есть еще над чем работать для улучшения удобства интерфейса WattMan, так как он не предназначен для управления с клавиатуры, например, но саму по себе инициативу можно лишь приветствовать - удобные инструменты настройки и мониторинга прямо в драйверах могут стать дополнительным плюсом новых решений семейства Radeon RX 400.

    Новые возможности по выводу изображения

    Мы уже рассказывали ранее о том, что новые решения компании AMD будут отличаться поддержкой самых последних стандартов DisplayPort и HDMI. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR. Новые версии этого стандарта используют существующие кабели и разъемы, но могут накладываться дополнительные ограничения на их длину.

    Главным преимуществом стандарта DisplayPort 1.3 HBR3 является увеличение пропускной способности до 32,4 Гбит/с (на 80% больше, чем у HDMI 2.0b), что отодвигает предел по пропускной способности, имеющийся в предыдущем поколении DisplayPort 1.2. Новый стандарт позволяет подключать 5K-мониторы в RGB-формате при 60 Гц, используя единственный кабель (сейчас приходится подключать пару разъемов и кабелей), а также UHDTV-телевизоры с разрешением 8K (7680×4320), используя цветовую субдискретизацию 4:2:0 при 60 Гц. Также по DisplayPort 1.3 можно подключать и стереодисплеи с 120 Гц и 4K-разрешением. Появление 5K-дисплеев, рассчитанных на один кабель, и 4K-дисплеев с поддержкой HDR, ожидается ближе к концу этого года.

    Также Polaris готов к внедрению стандарта DisplayPort 1.4-HDR, поддерживающего вывод изображения с глубиной цвета до 10-bit в разрешении 4K и с частотой обновления до 96 Гц. Новинкой компании поддерживаются Рекомендации ITU Rec.2020 по цветовому пространству для UHDTV, а также стандарты CTA-861.3 и SMPTE 2084 EOTF для передачи HDR-данных.

    Новый стандарт DisplayPort 1.3 будет полезен и для продвижения технологии FreeSync для 4K-мониторов. Компания AMD ожидает появления первых таких устройств с поддержкой технологии динамического обновления до 120 Гц к концу 2016 года. Такие мониторы будут способны работать в 4K-разрешении с применением технологий FreeSync при 30-120 FPS и будут поддерживать компенсацию низкой частоты кадров Low Framerate Compensation.

    Вот список характеристик для мониторов нового поколения, которые становятся возможными при использовании новой версии стандарта DisplayPort 1.3 с расширенной пропускной способностью: мониторы с разрешением 1920×1080 пикселей: 240 Гц SDR и 240 Гц HDR, мониторы с разрешением 2560×1440: 240 Гц SDR и 170 Гц HDR, 4K-мониторы: 120 Гц SDR и 60 Гц HDR, 5K-мониторы: 60 Гц SDR.

    Если уж мы начали говорить про FreeSync, то нужно упомянуть, что в решениях архитектуры Polaris эта технология будет работать и с мониторами, имеющими разъемы HDMI 2.0b. На данный момент компания работает со своими партнерами, в числе которых Acer, LG, Mstar, Novatek, Realtek и Samsung, для обеспечения работы технологии динамического частоты обновления, в том числе и при помощи HDMI. Список планируемых к выпуску мониторов включает изделия с размерами экрана от 20 до 34 дюймов и различным разрешением.

    Одной из самых интересных и перспективных возможностей Polaris по выводу информации является поддержка HDR-дисплеев с расширенным динамическим диапазоном. Для получения качественной картинки нужен вывод изображений в широком цветовом охвате с увеличенной контрастностью и максимальной яркостью, а на нынешних дисплеях человек видит лишь малую часть того, что может наблюдать своими глазами в окружающем мире. Диапазон воспринимаемых нами яркостей и цветов куда больше того, что могут дать нам текущие устройства вывода.

    Внедрения High Dynamic Range во все стадии конвейера обработки изображения ждут многие энтузиасты качественного изображения. Для того чтобы хоть приблизиться к возможностям человеческого зрения, был введен новый индустриальный стандарт для телевизоров - HDR UHDTV, обеспечивающий диапазон яркости от 0.005 до 10000 нт. Первые HDR-устройства имеют яркость до 600-1200 кд/м 2 , а ЖК-мониторы с поддержкой High Dynamic Range (HDR) и локальной подсветкой в будущем смогут обеспечить до 2000 нт, а OLED-дисплеи - до 1000 нт, но при идеальном черном цвете и большей контрастности.

    При использовании HDR пользователям будет демонстрироваться и расширенный цветовой диапазон, так как распространенное сейчас цветовое пространство sRGB сильно отстает от возможностей зрения человека. Нынешний контент почти весь создан в рамках стандартов BT.709, sRGB, SMPTE 1886 (Gamma 2.4), а новый стандарт HDR-10, Rec.2020 (BT.2020), SMPTE 2084 способен обеспечить отображение более миллиарда цветов при 10-бит на компонент, что приближает качество цветопередачи к естественному для человека.

    Не нужно путать тему устройств отображения с HDR-возможностями с тем, что давно появилось в играх и называется HDR-рендерингом. Действительно, многие современные игровые движки используют рендеринг с расширенным динамическим диапазоном, чтобы сохранить данные в тенях и светах, но делается это исключительно до вывода информации на дисплей. А далее изображение все равно приводится к обычному динамическому диапазону, чтобы вывести его на SDR-монитор.

    Для этого используются специальные алгоритмы тонального отображения (tone mapping ) - преобразования тональных значений из широкого диапазона в узкий. С учетом появления HDR-устройств нужны как улучшенные алгоритмы tone mapping, так и ориентация их уже на HDR-дисплеи. Аппаратный движок обработки цветовых данных в Polaris имеет программируемые возможности по управлению гаммой и преобразования цветового охвата (gamut remapping), все расчеты идут с высокой точностью, и результат будет полностью соответствовать возможностям дисплея.

    Хотя даже нынешние видеокарты Radeon в определенной мере готовы для работы с HDR-мониторами, вышедшие новые модели обеспечивают заметно более высокую частоту обновления и глубину цвета. Графические процессоры Polaris готовы к HDR-мониторам с глубиной цвета в 10-бит и 12-бит на компоненту, хотя первые такие дисплеи будут поддерживать только 10-бит, но затем последуют и более продвинутые, которые превзойдут возможности человеческого зрения.

    Для того, чтобы получить качественное HDR-изображение в игровых приложениях, необходимо переделывать не только графическую часть игрового движка, но и часть контента: те же текстуры должны также храниться в форматах, позволяющих использовать широкий цветовой и яркостный охват. Компания AMD работает с игровыми разработчиками для того, чтобы будущие игры уже могли полноценно использовать возможности HDR-дисплеев, и для этого они выпустили специальный Radeon Photon SDK.

    И тут есть над чем поработать. Тональное отображение (tone mapping) в играх должно делаться графическим движком, так как этот процесс, производимый дисплеем добавляет значительные задержки. AMD предлагает делать так: монитор опрашивается на предмет его возможностей по цвету, контрасту и яркости, затем с учетом этой информации игровой движок делает tone mapping и выводит его на дисплей в готовом виде. Так как игровые движки уже делают tone mapping в SDR, им просто нужно добавить возможность вывода в HDR.

    Photon SDK уже доступен для разработчиков, поддержка HDR для видеоданных и рендеринга в DirectX 11-приложениях в драйвере уже готова, а поддержка DirectX 12 планируется с будущим его обновлением. Остается добавить, что Polaris поддерживает HDR-дисплеи, соединенные при помощи разъема HDMI 2.0b (с HDCP 2.2) в разрешении 1920×1080 при 192 Гц, в разрешении 2560×1440 при 96 Гц и 3840×2160 при 60 Гц и кодировании цвета 4:2:2. В случае присоединения по DisplayPort 1.4-HDR (также с HDCP 2.2) возможности шире: 1920×1080 при 240 Гц, 2560×1440 при 192 Гц и 3840×2160 при 96 Гц. Осталось дождаться таких мониторов с ценой ниже, чем у чугунного моста.

    Улучшенное кодирование и декодирование видеоданных

    Как часто бывает, в новых поколениях графических процессоров заодно улучшают и блоки аппаратной обработки видеоданных. Ведь время не стоит на месте, появляются все новые форматы и условия их использования (частота кадров, глубина цвета и т.п.) Поэтому неудивительно, что в Polaris были проведены кое-какие улучшения по декодированию и кодированию видеоданных.

    Если кодировать видеоряд в формат H.264 вплоть до 4K-разрешения при 30 или даже 60 FPS умели и предыдущие решения, то кодирование видео в формат HEVC (H.265) Polaris научился впервые. Аппаратным блоком кодирования видео в новом GPU поддерживаются следующие разрешения и частоты кадров: 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS.

    Мало того, на видеокартах серии Radeon RX была добавлена поддержка и высококачественного кодирования потокового видео из игр. Ведь качество кодирования всегда было слабым местом потокового видео, и при быстро меняющемся изображении его качество серьезно страдало. Высокого же качества картинки можно добиться при двухпроходном кодировании с анализом картинки в первом проходе, которое и было внедрено в Polaris. Аппаратное двухпроходное кодирование работает как с H.264, так и с форматом HEVC, и подобный подход дает заметно более высокое качество видеопотока.

    Чтобы раскрыть аппаратные возможности архитектуры Polaris, нужна поддержка и со стороны программного обеспечения. Качественный аппаратный кодер для игр поддерживается следующими утилитами: Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

    Также Polaris оснащен и самым продвинутым аппаратным блоком, декодирующий видеоданные. Видеодекодер компании AMD умеет работать с форматом HEVC и профилем кодирования Main-10 в разрешениях до 4K с частотой кадров в 60 FPS, MJPEG в 4K-разрешении с 30 FPS, H.264 в разрешении 4K до 120 FPS, MP4-P2 до 1080p при 60 FPS и VC1 до 1080p при 60 FPS.

    Поддержка систем виртуальной реальности

    За несколько последних лет текущая реинкарнация шлемов виртуальной реальности прошла немалую дорогу, постоянно улучшая свои потребительские характеристики (хотя до идеала все равно еще очень далеко). Если начиналось все с менее чем Full HD-разрешения на оба глаза в 2014 году при не более чем 30 FPS, то теперь дело дошло до разрешения 1080×1200 пикселей на каждый глаз при 90 FPS и 10 мс задержками. И сейчас ощущения от VR куда комфортнее и реалистичнее.

    Компания AMD также со своей стороны занимается улучшением характеристик, связанных с VR. Так, технология LiquidVR предполагает реализацию некоторых возможностей, улучшающих VR на решениях компании. В числе последних изменений поддержка аудиотехнологии TrueAudio Next, резервирование вычислительных блоков под конкретные задачи, технология асинхронных вычислений Quick Response Queue, переменное разрешение и качество рендеринга для VR, поддержка DirectX 12 и Vulkan.

    Так, технология продвинутой обработки звука TrueAudio Next включает всю работу со звуками на GPU в реальном времени - с соблюдением физических законов распространения звуковых волн и применением просчета лучей (рейтрейсинг) для множества источников звука. Это позволяет получить качественный звук с низкими задержками и при помощи настроек (количество обрабатываемых источников и количество отражений звуковых волн) получить хорошо масштабируемое решение.

    Еще одной возможностью по работе с VR, которая недавно появилась, стало выделение нескольких вычислительных устройств Compute Unit под различные задачи, вроде обработки звука - в таком случае, эти CU будут заниматься исключительно этими задачами, чтобы избежать проблем, связанных с одновременным исполнением различных задач на GPU в реальном времени - это решение обеспечивает немедленное исполнение критичного кода и работает с любыми типами шейдеров, вычислительными или графическими.

    А архитектуре Polaris был улучшен командный процессор - появилась новая техника качества обслуживания (QoS - quality of service) под названием Quick Response Queue. Эта техника позволяет разработчикам через API назначать высокоприоритетными некоторые вычислительные задачи. Оба типа задач (обычные и приоритетные) разделяют те же ресурсы GPU, но высший приоритет позволяет удостовериться, что такие задачи будут использовать большее количество ресурсов и завершатся первыми, без переключения командного процессора на низкоприоритетные задачи.

    Конкретно в LiquidVR эта техника используется при асинхронном искажении времени (Asynchronous Time Warp), используемом в системах виртуальной реальности для того, чтобы избежать отброшенных кадров, ухудшающих плавность процесса - в VR это очень требовательная к задержкам задача, и приоритезация задач поможет удостовериться, что искажение времени происходит ровно тогда, когда нужно. Техника Quick Response Queue (QRQ) дает четкое управление над таймингами, минимизируя их.

    Без использования техники асинхронного искажения времени в системах виртуальной реальности получается так, что графический процессор при работе отбрасывает около 5% кадров, а с Asynchronous Time Warp эти кадры не отбрасываются, что снижает «дрожание» (разное время рендеринга соседних кадров) в десятки раз. На данный момент возможность уже входит в состав библиотеки, доступной на сайте GPUOpen.

    Мы уже знаем еще об одной оптимизации, связанной с VR - использование нескольких проекций при рендеринге сцены виртуальной реальности с разным разрешением. Мы уже не один раз рассказывали об этой возможности, которая оптимизирует VR-рендеринг, используя независимые настройки разрешения и качества разрешения для нескольких проекциях, которыми имитируется воронкообразный тип рендеринга, используемый в VR-шлемах. В этом случае для центра кадра применяется рендеринг в высоком разрешении, а на периферии оно снижается для оптимизации производительности.

    В составе LiquidVR есть поддержка DirectX 12 - идеального графического API для виртуальной среды, так как он позволяет повысить количество функций вызовов отрисовки в сцене, помогает снизить нагрузку на CPU, имеет родную поддержку для асинхронного исполнения вычислений и многочипового рендеринга, а также дает некоторые возможности для низкоуровневого доступа к GPU. Примеры использования DirectX 12 в составе LiquidVR, а также соответствующая документация доступны на сайте GPUOpen.com.

    Программные технологии Radeon Software

    В компании AMD продолжают улучшать не только аппаратную составляющую своих продуктов, но и программные компоненты. В очередной раз они решили оптимизировать частоту выпуска новых версий видеодрайверов, так как некоторые пользователи оставались недовольны тем, что было в прошлом году. Долгие годы они ежемесячно выпускали обновленные WHQL-драйверы, но некоторым пользователям казалось, что это слишком часто. После того, как они снизили частоту выпуска релизов драйверов, другие пользователи оказались недовольны уже редкими выходами.

    Так, в 2015 году было выпущено три WHQL драйвера и 9 бета-версий, а план на 2016 такой: шесть полноценных драйверов с WHQL-сертификацией за год + такое количество специальных версий с оптимизациями для игр, какое понадобится (в идеале - также WHQL). Пока что у них получается почти всегда, с момента выхода игр были доступны драйверы Radeon Software Crimson Edition для игр The Division, Far Cry Primal, Hitman, Quantum Break и других. С игрой Doom и видеокартами на чипах предыдущих поколений GCN вышла небольшая заминка, правда, но с кем не бывает?

    Продолжают в AMD обращать внимание на оптимизацию драйверов, предназначенную для плавной смены кадров, особенно в многочиповых конфигурациях. Так, CrossFire API для DirectX 11 был включен в состав GPUOpen, а для некоторых DirectX 12-приложений планируется поддержка многочипового рендеринга с плавной сменой кадров и малой разницей во времени рендеринга соседних кадров, а не только с высоким FPS.

    В будущих драйверах Radeon Software для DX12–игр планируется специальная поддержка AFR frame pacing - технология, которая специальным образом добавляет задержки перед тем, как вывести изображение на экран, что улучшает плавность и устраняет рывки при многочиповом рендеринге.

    Очень важно, что все большее внимание уделяется операционным системам, отличным от Windows. Так, представлена поддержка Polaris для дистрибутивов Linux на основе открытого кода - в этих драйверах уже есть поддержка Vulkan-версии игры Dota 2, например.

    Из любопытного отметим специальную программу для бета-тестирования Radeon Software Beta Program. Эта программа работает под управлением отдела обеспечения качества (Quality Assurance - QA), и в нее может вступить любой пользователь, написав по адресу [email protected] для получения дополнительной информации.

    Самые важные изменения произошли с настройками Radeon Settings, включенными в состав нового драйвера. Там появилась глобальная поддержка Crossfire и энергоэффективности, масштабирование HDMI и масштабирование в зависимости от конкретного приложения, изменение цветовой температуры, выбор языка пользовательского интерфейса и многое другое - о возможностях разгона и мониторинга мы уже рассказали выше.

    Все это касается конечных пользователей, но постоянно происходят и изменения в программной поддержке, предназначенные для разработчиков. Открытая инициатива GPUOpen давно известна как удобный метод для обеспечения разработчиков SDK, библиотеками и примерами с открытым кодом. Только за последний месяц на портале появилось 14 больших обновлений, за четыре месяца разработчиками было написано 41 блогов, а всего с момента запуска инициативы в конце января было размещено более 60 примеров кода, SDK, библиотек и утилит.

    Из последних примеров отметим ShadowFX с поддержкой DirectX 12, улучшения GeometryFX для DirectX 11, обновленный TressFX 3.1 (DirectX 11). Появились новые библиотеки, SDK и примеры для многочипового рендеринга в DirectX 12, пример out of order растеризации для Vulkan, FireRays для Vulkan и OpenCL, поддержка CrossFire API для DirectX 11. Также AMD стала первым производителем аппаратного обеспечения, выпустившим расширение для SPIR-V - шейдерного языка в графическом API Vulkan с поддержкой инструкций GCN). Также появилась поддержка Radeon для OpenVX - открытого кроссплатформенного стандарта для ускорения приложений машинного зрения.

    А недавно AMD представила расширение Shader Intrinsic Functions для библиотеки GPUOpen, которое облегчит оптимизацию ПК-версий игр, облегчив разработку многоплатформенных приложений и портирование игр с консолей. При использовании Shader Intrinsic Functions разработчик может получить прямой доступ к низкоуровневым инструкциям, как на консолях - при помощи вставок низкоуровневого кода в исходники высокого уровня. Эту возможность можно использовать в приложениях с поддержкой DirectX 11, DirectX 12 и Vulkan.

    Выводы по теоретической части

    Видеокарта модели Radeon RX 480 стала первенцем семейства Polaris, первой вышедшей на рынок моделью в новой линейке компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями, это позволило серьезно повысить энергоэффективность нового решения, и в результате по этому показателю новинка вдвое-втрое лучше предыдущих видеокарт компании AMD.

    Хотя графический процессор Polaris 10 архитектурно весьма схож с предыдущими чипами и во многом повторяет их решения, и графические архитектуры разных поколений GCN не слишком сильно отличаются друг от друга, в новом графическом процессоре было сделано множество улучшений для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были серьезно улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео.

    Polaris 10 - лучшее графическое ядро компании AMD, которое принесло новые функциональные возможности, но главное - стало значительно более эффективным. Так, улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений, по сравнению с архитектурой GCN предыдущих поколений. Вместе с применением нового техпроцесса 14 нм FinFET и другими оптимизациями, это позволило заметно улучшить энергоэффективность - вплоть до 2,8 раз, по оценке компании. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

    В списке функциональных изменений и улучшений - поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, запись игрового процесса на лету без участия мощностей CPU, качественный режим кодирования видео с двумя проходами, и т.д. Также можно отметить появление поддержки стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

    Но главное в представленном сегодня продукте Radeon RX 480 - его цена. Пусть некоторым покажется, что функциональных нововведений и оптимизаций в Polaris не так уж много, зато этот новый продукт, использующий современный технологический процесс, позволил серьезно снизить цену видеокарты, вполне достаточной как для последних игр с высокими настройками качества, так и для применения в составе систем виртуальной реальности, довольно требовательной к мощности GPU.

    Сочетание сравнительно низкой цены и достаточно высокой производительности делает Radeon RX 480 одной из самых удачных по соотношению цены и производительности видеокарт на момент ее выпуска, если не самой выгодной. Важно, что она ориентирована на средний ценовой сегмент, привлекающий куда большее количество потенциальных покупателей, чем топовые решения, и выпуск именно такой модели в первую очередь может положительно сказаться на рыночной доле компании AMD в сегменте игровых видеокарт.

    В следующих частях нашей статьи мы оценим производительность новой видеокарты AMD Radeon RX 480 на практике, сравнив ее скорость с показателями близких по цене ускорителей компаний Nvidia и AMD. Сначала мы рассмотрим данные, полученные в нашем наборе синтетических тестов, а затем перейдем и к самому интересному - игровым тестам.

    Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
    Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair
    Понравилась статья? Поделитесь ей