Температура карты rx 480. Видеокарты. Результаты тестов производительности и их анализ

Обзор AMD Radeon RX 480 8GB | Встречайте Polaris 10

Восемь месяцев назад AMD начала раскрывать возможности GPU следующего поколения, начав с обновлённого контроллера дисплея с поддержкой HDMI 2.0b и DisplayPort 1.3 HBR3, FreeSync по HDMI и HDR-совместимый конвейер. Позже стала появляться дополнительная информация, в которой говорилось о выпуске двух разных GPU, один из которых разработан специально для рынка массовых настольных систем, а другой для мобильных решений, предлагающих производительность уровня консолей в тонких и лёгких форм-факторах.


Второй продукт включает 16 вычислительных блоков (CU), 128-битную шину памяти и ускоренное кодирование/декодирования 4K-видео. Пока он не доступен. Видеокарта AMD Radeon RX 480 использует более крупный процессорный дизайн Polaris 10. В плане физических размеров он не больше процессора Nvidia GP100 с 15,3 млрд. транзисторов, но его возможностей достаточно, чтобы управлять лучшими гарнитурами виртуальной реальности. По уровню производительности карта находится в одном ряду с AMD Radeon R9 290 и Nvidia GeForce GTX 970.

Средний уровень производительности карты трудно назвать сногсшибательным, особенно на фоне нового графического процессора Nvidia GP104. Однако AMD Radeon RX 480 стоит заметно дешевле аналогичных по скорости решений, а потребляемая мощность ограничена 150 Вт. Таким образом, AMD рассчитывает сделать виртуальную реальность доступной для более широкой аудитории геймеров (хорошо, если бы ей подыграли компании, которые продают HMD за $800 и $600).

Доступны две версии AMD Radeon RX 480 : модель за $200 (MSRP), оснащённая 4 Гбайт видеопамяти GDDR5 со скоростью передачи данных 7 Гбит/с и версия за $240 (MSRP) с 8 Гбайт GDDR5 со скоростью 8 Гбит/с. Сегодня мы тестируем модель с объемом памяти 8 Гбайт.

Особенности Polaris 10

Polaris 10 состоит из 5,7 миллиардов транзисторов на кристалле площадью 230 мм2. Для сравнения, кристалл Hawaii имеет 6,2 миллиардов транзисторов и площадь 438 мм2. Несмотря на меньшее число транзисторов и пониженную примерно на 55% потребляемую мощность, RX 480 в большинстве тестов находится между R9 290 и 390. Во многом, это заслуга техпроцесса FinFET 14 нм от GlobalFoundries, который обеспечивает AMD заметные преимущества в производительности и энергопотреблении по сравнению с планарными транзисторами, изготовленными с использованием техпроцесса 28 нм. FinFET даёт более высокую частоту при любом уровне потребляемой мощности, и наоборот, при любой тактовой частоте чип с 14 нм потребляет меньше энергии. В случае Polaris AMD использовала оба преимущества, увеличив тактовые частоты и понизив энергопотребление. Так ей удалось превзойти более мощный в плане ресурсов GPU Hawaii сохранив потолок мощности в 150 Вт (хотя наши измерения показывают, что эта цифра немного преуменьшена).

Несмотря на новое кодовое имя, Polaris 10 основан на архитектуре AMD Graphics Core Next четвёртого поколения. Поэтому строительные блоки процессорного дизайна Polaris многим энтузиастам покажутся знакомыми, а нам будет проще его описать.

Спецификации

AMD Radeon RX 480 AMD Radeon R9 390 AMD Radeon R9 290
Polaris 10 Grenada Pro Hawaii Pro
Вычислительные блоки (CU) 36 40 40
Потоковые процессоры 2304 2560 2560
Тактовая частота (базовая/Boost), МГц 1120/1266 1000 947
Пиковая скорость вычислений, GFLOPs (при базовой частоте) 5161 5120 4849
Количество блоков текстур 144 160 160
Скороть заполнения текстур Гтекс/с 182,3 160 160
Количество блоков растеризации 32 64 64
Объем кэша L2, Мбайт 2 1 1
Скорость передачи данных памяти, Гбит/с 8 (8 Гбайт) / 7 (4 Гбайт) 6 5
Пропускная способность памяти, Гбайт/с 256 384 320
Шина памяти, бит 256 512 512
Тепловой пакет, Вт 150 275 250
Количество транзисторов, млрд. 5,7 6,2 6,2
Площадь кристалла, мм2 230 438 438
Техпроцесс, нм 14 28 28
Стартовая цена $240 (8 Гбайт) / $200 (4 Гбайт) $330 (8 Гбайт) $400 (4 Гбайт)

За диспетчеризацию очерёдности графических инструкций в шейдерные блоки (Shader Engine) по-прежнему отвечает один командный процессор (GCP-Graphics Command Processor). Очерёдностью вычислительных инструкций занимаются асинхронные вычислительные блоки (ACE - Asynchronous Compute Engine). Только вместо восьми блоков ACE логика исполнения команд теперь состоит из четырёх ACE и двух аппаратных планировщиков (Hardware Scheduler), выполняющих задачи приоритизации очередей, управления временными/пространственными ресурсами и разгрузки задач планирования драйвера режима ядра ЦП. По сути, это не отдельные или новые блоки, а скорее дополнительный режим, в котором могут работать существующие конвейеры. Дэйв Нэлэско, старший управляющий AMD по технологическим процессам в графике, дал следующий комментарий:

"HWS (Hardware Workgroup/Wavefront Schedulers) в сущности являются конвейерами ACE без контроллеров диспетчеризации. Их задача заключается в разгрузке ЦП путём управления процессом планирования очередей, заданных пользователем/драйвером, на доступных аппаратных слотах очереди. Это программируемые процессоры с микрокодом, к которым могут применяться различные политики планирования. Мы использовали их, чтобы реализовать функции Quick Response Queue и CU Reservation. Также удалось портировать эти изменения на видеокарты с архитектурой GCN третьего поколения с помощью обновления драйверов."

Функция Quick Response Queues позволяет разработчикам приоритизировать определённые задачи, которые выполняются асинхронно, не вытесняя другие процессы полностью. Более подробное объяснение можно найти в блоге Дэйва (англ.). Если коротко, AMD хочет добиться гибкости. Её архитектура даёт возможность использовать разные подходы для оптимизации загрузки ресурсов и сведения задержки рендеринга к минимуму, а оба этих фактора крайне важны для приложений виртуальной реальности.

Хорошо знакомые нам вычислительные блоки CU состоят из 64 шейдерных модулей, совместимых со стандартом IEEE 754-2008, разделённые на четыре векторных модуля, скалярного блока и 16 модулей загрузки/хранения выборки текстуры. Кроме того, в каждый CU входят четыре блока текстурирования, 16 Кбайт кэша L1, 64 Кбайт локального пространства для обмена данными и регистровое пространство для векторных и скалярных единиц. В AMD утверждают, что внесли много корректировок для улучшения эффективности CU, включая добавление поддержки FP16 (и Int16), оптимизацию доступа к кэшу и улучшение упреждающей выборки команд. В совокупности, эти изменения обеспечивают прирост производительности CU до 15% по сравнению с GPU Hawaii (GCN 2-го поколения).

Девять CU образуют крупный шейдерный блок (SE - Shader Engine). Видеочип Polaris 10 имеет четыре таких SE и нам известно, что это максимум для этой архитектуры. Всего получается 2304 потоковых процессора и 144 блока текстурирования (64 шейдеров х 9 CU х 4 SE).

Каждый шейдерный блок связан с блоком геометрии (GE - Geometry Engine). По информации AMD, в геометрический блок был добавлен ускоритель отсеивания геометрических примитивов (primitive discard accelerator), он отсеивает простейшие геометрические элементы, которые не растеризуются в пиксель до сканирующего преобразования, таким образом, увеличивается пропускная способность. Это автоматическая функция этапа предварительной растеризации графического конвейера и она является новшеством для Polaris. Кроме того, появился индексный кэш для клонированной геометрии, хотя мы не знаем его объём и степень влияния при клонировании.

По аналогии с видеочипом Hawaii, процессор Polaris 10 способен отрисовывать четыре простейших элемента за такт. Однако, по сравнению с графическими процессорами Hawaii/Grenada с частотой до 1050 МГц (в случае R9 390X), AMD подняла базовую частоту AMD Radeon RX 480 до 1120 МГц, а частоту в режиме Boost до 1266 МГц. Выходит, что потерю ресурсов на кристалле компания компенсирует повышенной частотой. Производительность вычислений одинарной точности с плавающей запятой у Radeon R9 290X составляет 5,6 TFLOPS, а RX 480 достигает в режиме Boost 5,8 TFLOPS.

Насколько реальна тактовая частота 1266 МГц? GPU Hawaii с трудом поддерживал указанную в спецификациях частоту, поскольку сильно нагревался, и мы хотели удостовериться, что c Polaris подобного не случится. Используя GPU-Z, мы сняли показания тактовой частоты в интегрированном бенчмарке игры Metro: Last Light Redux, повторённом 10 раз подряд, и получили следующий график:

Тактовая частота в стресс-тесте – встроенный бенчмарк Metro: Last Light Redux, 10 проходов, МГц

Разница между верхней (1265 МГц) и нижней (1118 МГц) точками на графике составляет 148 МГц. Можно сказать, что AMD чётко вписывается в указанные лимиты, хотя частота в процессе теста постоянно корректируется. Но, по крайней мере, средний показатель 1208 МГц находится ближе к верхнему значению.

SE графических процессоров Hawaii и Fiji имеют по четыре бэкэнда рендеринга, способные выводить 16 пикселей за такт (всего 64 пикселей за такт). У Polaris 10 этот компонент урезан наполовину. На каждый SE приходится два бэкэнда рендеринга, каждый с четырьмя блоками ROP, в совокупности они отрисовывают 32 пикселя за такт. Разница с Radeon R9 290 на базе Hawaii весьма существенная. Ситуацию усугубляет 256-разрядная шина памяти Polaris 10, которая вдвое уже шины памяти видеочипа Hawaii (512-бит). Версия AMD Radeon RX 480 4 Гбайт использует память GDDR5 со скоростью передачи данных 7 Гбит/с и имеет пропускную способность 224 Гбайт/с, в то время как модель на 8 Гбайт, которую мы тестируем сегодня, использует память со скоростью передачи данных 8 Гбит/с, и пропускная способность увеличена до 256 Гбайт/с. Но в любом случае, это намного меньше, чем 320 Гбайт/ у R9 290.

Сокращение аппаратных ресурсов частично компенсируется улучшенной дельта-компрессией цвета, которая сокращает количество передаваемой через шину информации. Также AMD поддерживает сжатие в соотношении 2/4/8:1 без потерь, как и архитектура Nvidia Pascal. Ко всему прочему, Polaris 10 использует кэш L2 объёмом 2 Мбайт, такой же объём использовался в Fiji. Это позволит уменьшить число обращений к памяти GDDR5 и ещё больше снизить зависимость GPU от широкой шины и высокой скорости передачи данных.

Тем не менее, обеднение бэкэнда GPU должно сказаться на производительности с ростом разрешения и интенсивности применения сглаживания. Нам было интересно, как Polaris будет выглядеть на фоне Hawaii с ростом интенсивности нагрузки. Чтобы это проверить, мы запустили тест Grand Theft Auto V в скромном разрешении 1920x1080 с "Очень Высокими" настройками детализации графики и постепенно увеличивали качество сглаживания.

На графике хорошо видно, что при изменении сглаживания MSAA с 2х до 4х AMD Radeon RX 480 заметно быстрее теряет среднюю частоту кадров, чем R9 390. При отключённом сглаживании RX 480 достигает 97,3 FPS, а R9 390 – 90,4 FPS . Но к концу графика AMD Radeon RX 480 показала только 57,5 кадров в секунду, в то время как 390-я в среднем выдавала 62,9 кадров в секунду.

Обзор AMD Radeon RX 480 8GB | Контроллер дисплея, UVD, VCE & WattMan

Новый контроллер дисплея

Мы уже рассматривали некоторые усовершенствования контроллера дисплея Polaris в статье "Планы функционального развития GPU AMD в 2016 году" . Но она была опубликована почти семь месяцев назад.

Тогда нам было известно, что Polaris будет поддерживать интерфейс DisplayPort 1.3 с режимом High Bit Rate 3, используя существующие кабели и разъёмы, чтобы обеспечить скорость передачи до 32,4 Гбит/с через четыре линии. Теперь спецификация контроллера включает стандарт DisplayPort 1.4-HDR. Он не повышает скорость передачи данных, но включает технологию Display Stream Compression 1.2, позволяющий передавать 10-битный 4K-контент с частотой обновления 96 Гц. Также стандарт DisplayPort 1.4 поддерживает цветовое пространство.

В краткосрочной перспективе AMD всё ещё рассматривает DP 1.3 как инструмент для реализации FreeSync в 4K. По заявлениям компании, панели с частотой обновления 120 Гц будут доступны уже к концу 2016 года, но чтобы добиться хорошей производительности с высокими настройками графики в такой конфигурации, возможностей AMD Radeon RX 480 будет недостаточно. При этом процессорный дизайн Vega с поддержкой HBM2 официально не появится до 2017 года.

Поддержку HDR в Polaris мы уже обсуждали в конце прошлого года, но AMD повторяет, что конвейер дисплея готов к первому поколению 10-битных дисплеев с HDR, и 12-битных экранов с HDR в будущем. Легкопрограммируемый блок обработки цвета включает повторное наложение цветовой гаммы, управление гаммой, обработку с плавающей запятой и проекцию 1:1 с любым дисплеем.

Ускорение кодирования/декодирования видео

В годы расцвета компания ATI была известна производительными и качественными системами ускорения декодирования видео, которые переносили задачи воспроизведения видео с центрального процессора на комбинацию программируемых шейдеров и блоков с фиксированной функцией, установленных в GPU.

У нас нет подробных данных насчёт того, на каком этапе декодер Polaris выполняет свои задачи, но известно, что он основан на декодере UVD и, по-видимому, имеет фиксированную функциональность. AMD указывает в спецификациях наличие декодирования HEVC в режиме до 4K60 с применением профиля Main 10, который поддерживает формат 10-бит 4:2:0 (всё это необходимо для работы HDR). Есть аппаратная поддержка декодирования стандарта VP9, хотя драйверы AMD её ещё не внедрили, нам лишь известно, что функция запланирована в будущем обновлении. Если AMD хочет реализовать цветовую субдискретизацию HEVC 10-bit/4:2:0 с HDR, потребуется совместимость как минимум с профилем 2. Также предусмотрено аппаратное ускорение формата M-JPEG в режимах до 4K30.

Развитие кодировщика видео AMD (VCE - Video Coding Engine) также не очень хорошо задокументировано. Известно, что Polaris может кодировать видео в стандарте HEVC 8-бит до 4K60, но GPU на базе архитектуры GCN 1.2 имеют такое же оснащение. Складывается ощущение, что AMD работает над расширением списка совместимых с VCE приложений. Само собой, поддерживается фирменный клиент Gaming Evolved. Но кроме этого, в списках присутствует программа Open Broadcaster Software, которая ранее поддерживала только QuickSync и NVEnc. Также есть Plays.tv – социальная сеть от компании, отвечающей за клиент Gaming Evolved.

Новый середнячок, догоняющий топовые ускорители предыдущего поколения

  • Часть 2 - Практическое знакомство

Представляем базовый детальный материал с исследованием AMD Radeon RX 480.

Объект исследования : Ускоритель трехмерной графики (видеокарта) AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E

Сведения о разработчике : Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) около 2000 человек.

Часть 1: Теория и архитектура

В своих прошлых статьях мы неоднократно сетовали на застой в области графических процессоров, связанный с задержками производства GPU по новым технологическим процессам и фактическим пропуском одного из них - 20 нм техпроцесса, который оказался непригодным для массового выпуска сложных видеочипов. На протяжении долгих пяти (!) лет обе компании, являющиеся производителями GPU, выпускали решения на основе уже весьма старого 28 нм техпроцесса.

Производители микроэлектронных чипов смогли наладить массовое производство с применением новых FinFET-техпроцессов (14 и 16 нм, в зависимости от производителя) таких сложных и крупных чипов лишь ближе к середине года. Не так давно «отстрелялась» компания Nvidia, выпустившая довольно дорогие видеокарты, предназначенные для верхней части их линейки, а теперь настало время компании AMD, которая пошла своим путем, выпустив сначала не самые дорогие видеокарты, примерно аналогичные моделям Radeon HD 4850 и HD 4870, ставшими достаточно популярными в свое время.

Чтобы лучше понять ход мысли представителей AMD, отличающийся от такового у их конкурентов, давайте рассмотрим их представления о наиболее востребованных на рынке видеокартах. По данным AMD, довольно малая доля игроков на ПК покупает дорогие видеокарты, обеспечивающие комфорт при высоких разрешениях и максимальных настройках, а большинство из них использует сильно устаревшие GPU. 84% игроков покупают видеокарты по цене от $100 до $300 по данным AMD, и лишь остальные игроки выбирают то, что дороже.

Понятно, что большинство не сможет даже попробовать столь популярную сейчас тему виртуальной реальности при таковом желании, ведь VR требует очень приличных вычислительных мощностей. Кроме этого, по мнению AMD, не все пользователи желают вкладываться в то оборудование, что устареет уже через пару лет. Правда, вряд ли все они кинутся покупать VR-шлемы... С другой стороны, с устаревшими видеокартами у них и возможности то опробовать виртуальную реальность не появится. Всего 13 миллионов ПК по всему миру имеют достаточно мощную конфигурацию для запуска VR-приложений - это всего 1% из почти полутора миллиардов компьютеров, имеющихся у пользователей на руках.

По данным опросов, приводимых AMD, две трети пользователей не планируют приобрести оборудование для VR именно из-за дороговизны такой конфигурации. Это в дополнение к вполне разумным доводам вроде тех, что шлемы пока что слишком громоздкие и с мешающими проводами, а виртуальная реальность в принципе применима лишь к малой части игровых применений. Все же, самой важной преградой для распространения VR является цена оборудования. И AMD считает для себя перспективной возможность обеспечить миллионы ПК графическими процессорами необходимой мощности в следующие несколько лет. Правда, остается непонятным, почему AMD считает недоступным компонентом именно видеокарту, если VR-шлем и контроллеры сами по себе стоят дороже? Впрочем, порог входа в VR они действительно могут немного снизить, предложив решения достаточной производительности за сравнительно малые деньги.

И AMD продвигает свои новые решения во многом именно как производительные и энергоэффективные видеокарты, призванные «демократизировать» довольно дорогую виртуальную реальность, обеспечив желающих достаточной мощью GPU. А еще одной целью новых графических решений компании являются как компактные ПК со сверхнизким потреблением энергии, так и игровые ноутбуки, для которых сейчас можно легко обеспечить мощность, аналогичную или даже превосходящую возможности игровых консолей. К примеру, младший чип Polaris имеет не только низкое энергопотребление, но и специально предназначен для компактных ноутбуков - общая высота упаковки этого GPU составляет всего 1,5 мм по сравнению с 1,9 мм у Bonaire, что поможет AMD выиграть конкурсы на поставку решений для мобильных ПК.

Для четкого попадания в такие требования, в AMD решили спроектировать две модели графических процессоров: Polaris 10 и Polaris 11, соответствующие определенным уровням возможностей и производительности. Старший чип серии Polaris обеспечит ПК-игроков достаточной мощностью для VR-приложений и всех современных игр, а менее производительный младший GPU предназначен для тонких и легких ноутбуков, но предлагает возможности и производительность, превосходящие параметры игровых приставок.

Соответственно, на момент анонса, AMD предлагает следующие решения для настольных компьютеров:
Radeon RX 460 - энергоэффективная видеокарта с низким потреблением энергии для нетребовательных игр и будущих мобильных решений, с мощностью в более чем 2 терафлопа, имеющая 2 ГБ видеопамяти, соединенной по 128-битной шине;
Radeon RX 470 - весьма выгодная видеокарта среднего уровня за приемлемую цену, обладающая достаточной мощностью для игр в Full HD-разрешении, с мощностью более чем 4 терафлопа, 4 ГБ видеопамяти и 256-битной шиной;
Radeon RX 480 - пока что самое производительное решение нового семейства, предназначенное для VR и современных игр с производительностью более чем 5 терафлопа, 4 или 8 гигабайтами памяти с 256-битной шиной, потребляющее менее чем 150 Вт.

Сегодня мы рассмотрим как раз модель Radeon RX 480, которая предлагает премиальные возможности для игроков - Premium HD Gaming. Что это за термин в понимании AMD? Сюда включены как возможности новых графических API, вроде асинхронного исполнения в DirectX 12, так и технологии FreeSync и CrossFire. Но главное - преимущество над аналогичными по цене решениями конкурента, в современных играх с поддержкой DirectX 12:

В большинстве игр текущего года с поддержкой DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War и Forza APEX) даже видеокарты предыдущего поколения AMD Radeon зачастую превосходят аналоги по цене у Nvidia: мы отмечали преимущество Fury X против 980 Ti, R9 390 против GTX 970 и R9 380 против GTX 960, а уж свежая модель на базе Polaris 10 просто обязана выступить еще лучше.

Кроме DirectX 12 можно отметить и еще один API - Vulkan. В соответствующей версии игры Doom компания AMD заявляет прирост до 45% на Radeon RX 480 по сравнению с OpenGL-версией игры, хотя на старых видеокартах разница ожидается несколько меньше - порядка 20-25%.

А что с виртуальной реальностью, действительно ли новинка AMD способна на достаточную производительность для VR-приложений? Благодаря высокой мощности GPU и поддержке таких возможностей как Asynchronos Time Warp, обеспечивается комфортный просмотр соответствующих VR-приложений, да еще при невысоком потреблении энергии. Так, общепринятый тест для оценки производительности SteamVR Performance Test показывает явное превосходство над решениями предыдущего поколения (непонятно, правда, почему сравнивали именно с Radeon R9 380?):

Так как основой модели Radeon RX 480 является графический процессор Polaris 10, имеющий архитектуру GCN четвертого поколения, которая во многих деталях схожа с ранее вышедшими решениями компании AMD, то перед прочтением теоретической части статьи будет полезно ознакомиться и с нашими предыдущими материалами по прошлым видеокартам компании, основанным на архитектуре GCN предыдущих поколений:

  • AMD Radeon R9 Fury X: Новый флагман AMD с поддержкой HBM
  • AMD Radeon R9 285: Tahiti получил шину 256 бит и превратился в Tonga
  • AMD Radeon R9 290X: Дотянись до Гавайев! Получишь новые вершины скорости и функциональности
  • AMD Radeon HD 7970: Новый однопроцессорный лидер 3D-графики

Рассмотрим подробные характеристики видеоплаты Radeon RX 480, основанной на полной версии графического процессора нового поколения Polaris 10.

Графический ускоритель Radeon RX 480
Параметр Значение
Кодовое имя чипа Polaris 10 XT (Ellesmere)
Технология производства 14 нм FinFET
Количество транзисторов 5,7 млрд.
Площадь ядра 232 мм²
Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти 256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора 1120 (1266) МГц
Вычислительные блоки 36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования 144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP) 32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) - 128 отсчетов за такт
Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready

Спецификации референсной видеокарты Radeon RX 480
Параметр Значение
Частота ядра 1120 (1266) МГц
Количество универсальных процессоров 2304
Количество текстурных блоков 144
Количество блоков блендинга 32
Эффективная частота памяти 7000-8000 (4×1750-2000) МГц
Тип памяти GDDR5
Шина памяти 256-бит
Объем памяти 4/8 ГБ
Пропускная способность памяти 224-256 ГБ/с
Вычислительная производительность (FP32) до 5,8 терафлопс
Теоретическая максимальная скорость закраски 41 гигапиксел/с
Теоретическая скорость выборки текстур 182 гигатекселя/с
Шина PCI Express 3.0
Разъемы Один разъем HDMI и три DisplayPort
Энергопотребление до 150 Вт
Дополнительное питание Один 6-контактный разъем
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $199/$229 (для рынка США)

Название выпущенной сегодня модели видеокарты компании AMD вполне соответствует их текущей системе наименований. Ее имя отличается от предшественников измененным символом в первой части индекса и цифрой поколения - RX 480. Если со вторым изменением все понятно, ведь поколение действительно новое, то замена R9 на RX не совсем логична, на наш взгляд, ведь эта цифра раньше показывала уровень видеокарты: R7 были медленнее, чем R9, но все они выпускались в рамках одного поколения. А теперь непонятно, во-первых, почему у RX 480 эта цифра больше, чем у R9 390X, к примеру, и какие цифры после R в имени будут у младших решений, основанных на новых GPU.

Первая модель в новом семействе Radeon 400 становится в текущей линейке компании на место предыдущих решений, аналогичных по позиционированию, замещая их на рынке. Так как выпущенная видеокарта относится скорее к среднему уровню по цене и скорости с учетом нового поколения, то для будущих решений на GPU еще большей мощности решили оставить индекс 490.

Референсный вариант Radeon RX 480 будет предлагаться по рекомендованной цене в $199 в случае 4 ГБ варианта и $229 для 8-гигабайтной модели, и эти цены ну очень привлекательны! По сравнению с топовыми видеокартами предыдущего поколения, это очень хороший ценник, так как Radeon RX 480 по скорости не должна уступать таким моделям, как Radeon R9 390 и GeForce GTX 970. Именно с ними и будет конкурировать новинка, по крайней мере, в начале своего жизненного пути, до выхода планируемой к скорому выпуску GeForce GTX 1060. Но на момент своего выхода, сегодняшняя новинка абсолютно точно становится лучшим предложением по производительности в своем классе.

Референсные видеокарты Radeon RX 480 будут поставляться в версиях с 4 ГБ памяти GDDR5 с эффективной частотой в 7 ГГц, и с 8 ГБ памяти с частотой в 8 ГГц. Но по мере поступления в продажу видеокарт собственного производства партнеров AMD, появятся и другие варианты, но все они будут оснащены GDDR5-памятью с частотой как минимум 7 ГГц - такова воля AMD.

Решение по установке 4 и 8 ГБ памяти очень мудрое. Младший вариант позволит немного сэкономить, ведь 4 ГБ на данный момент можно считать «золотой серединой», а преимущество от 8 ГБ памяти у второго варианта Radeon RX 480 раскроется в перспективе. Хотя и 4-гигабайтный вариант видеокарты обеспечит приемлемую производительность в современных играх, но 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут. В качестве примера, преимущество в котором уже заметно, можно привести игру Rise of the Tomb Raider в DirectX 12-версии, при очень высоких настройках и разрешении 2560x1440 пикселей:

Больший объем видеопамяти у Radeon RX 480 8 ГБ и Radeon R9 390 помогает избежать крайне неприятных падений производительности и рывков FPS, по сравнению с 4-гигабайтными вариантами, включая решения конкурентов GeForce GTX 970 и GTX 960. Именно Radeon RX 480 8 ГБ дает возможность получения плавного игрового процесса с отсутствием притормаживаний, связанных с подгрузкой данных, не помещающихся в локальную видеопамять. И так как игровые консоли нынешнего поколения имеют по 8 ГБ общей памяти, то преимущество от большего объема памяти будет только расти со временем, и 8-гигабайтный вариант Radeon RX 480 отлично подойдет для игр, который будут выходить в следующие несколько лет.

Для дополнительного питания платой используется один 6-контактный разъем, а значение типичного энергопотребления у модели Radeon RX 480 на графическом процессоре Polaris 10 установлено на уровне 150 Вт. В реальности без разгона плата потребляет даже еще меньше, порядка 120 Вт энергии, но небольшой запас по питанию позволит улучшить оверклокерский потенциал. К слову, партнерами AMD планируется скорый выход фабрично разогнанных версий этой видеокарты, отличающихся и системами охлаждения и питания.

Архитектурные особенности

Графический процессор Polaris 10 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному на данный момент. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

В своей основе, архитектура Polaris изменилась не слишком сильно, хотя не основные блоки видеочипа изменились заметнее - были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это очередное поколение известной архитектуры Graphics Core Next (GCN), уже четвертое по счету. Пока что в состав семейства вошли два чипа: Polaris 10 (ранее известный как Ellesmere) и Polaris 11 (ранее известный как Baffin).

И все же некоторые аппаратные изменения в GPU были внесены. В список улучшений и изменений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

В состав полноценного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти нового графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

Заявлено улучшение геометрических движков в Polaris - в частности, появился так называемый ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники (например, с нулевой площадью). Также в новом GPU был введен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

Ускоритель отбрасывания геометрических примитивов помогает увеличить скорость обработки геометрии, особенно в задачах вроде тесселяции с мультисэмплингом. На диаграмме видно, что в разных условиях новый блок позволяет увеличить производительность до трех раз. Впрочем, это синтетические данные заинтересованной стороны, лучше смотреть по игровым результатам независимых тестов.

Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров - введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения.

В очередной раз был улучшен и планировщик заданий hardware scheduler (HWS), использующийся при асинхронных вычислениях. В его задачи входит: разгрузка CPU от задач планирования, приоритезация задач реального времени (виртуальная реальность или обработка звука), параллельное выполнение задач и процессов, менеджмент ресурсов, координация и балансирование загрузки исполнительных блоков. Функциональность этих блоков можно обновить при помощи микрокода.

Кроме того, что объем кэш-памяти второго уровня был увеличен вдвое до 2 МБ, была изменена обработка и кэширование данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, что в случае Polaris означает пропускную способность шины памяти до 256 ГБ/с. Но и на этом в AMD не остановились, дополнительно улучшив алгоритмы сжатия данных без потерь (Delta Color Compression - DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1.

Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и до 35-40%.

Если сравнивать Radeon RX 480 с Radeon R9 290, то новое решение потребляет заметно меньше энергии для обеспечения той же эффективной пропускной способности, по сравнению с видеокартой предыдущего поколения. В результате, у новинки заметно выше и производительность в пересчете на бит - хотя у Radeon R9 290 выше пиковая ПСП, но она куда энергоэффективнее используется в Polaris 10 - общее потребление энергии интерфейсом памяти составляет 58% от потребления старого GPU.

В целом, изменения четвертого поколения GCN в графическом процессоре Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и техник управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. Если брать самый низкий уровень, то вычислительные блоки CU в Polaris 10 (Radeon RX 480) примерно на 15% производительнее блоков чипа Hawaii (Radeon R9 290).

Сложно судить, насколько велик вклад той или иной оптимизации в общий прирост скорости, но если брать все оптимизации в комплексе, то разница в энергоэффективности между Radeon RX 470 и Radeon R9 270X, по оценке специалистов компании AMD, достигает 2,8-кратной. Причем, они оценивают вклад FinFET-техпроцесса меньше вклада своих оптимизаций. Вероятно, было выбрано самое выгодное сравнение, а для других моделей прирост по энергоэффективности несколько меньше. Например, если сравнить показатели RX 480 и R9 290, то разница по энергоэффективности будет ближе к двукратной. В любом случае, такие огромные приросты бывают раз в несколько лет, и уже поэтому у нас нет никаких сомнений в том, что продажи Radeon RX 480 будут успешными.

Технологический процесс и его оптимизация

Как мы уже говорили, главное в Polaris - это не изменения в аппаратных блоках, а большой шаг вперед из-за применения в производстве этого GPU нового техпроцесса 14 нм с использованием транзисторов с вертикально расположенным затвором (FinFET - Fin Field Effect Transistor), также известных как транзисторы с трехмерной структурой затвора или 3D-транзисторы.

Динамическое энергопотребление растет линейно с ростом количества вычислительных блоков, и кубически при повышении частоты при помощи повышения напряжения (так, прирост частоты и напряжения на 15% увеличивает потребление более чем наполовину!), и в результате графические процессоры зачастую работают на более низких тактовых частотах, зато используют чипы большей плотности, чтобы поместить в них большее количество вычислительных устройств, которые работают параллельно.

Последние пять лет графические процессоры выпускались при помощи 28 нм техпроцессов, а промежуточный 20 нм не дал требуемых параметров. Освоения еще более совершенных техпроцессов пришлось ждать довольно долго, и вот, для производства графических процессоров семейства Polaris, компания AMD выбрала производства компаний Samsung Electronics и GlobalFoundries с их 14 нм FinFET-техпроцессом, который обеспечивает производство одних из самых плотных микропроцессоров. Применение FinFET-транзисторов имеет решающее значение для снижения энергопотребления и снижения напряжения GPU примерно на 150 мВ, по сравнению с предыдущим поколением, сокращая мощность на треть.

На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведенного с применением различных техпроцессов. Компании Samsung Electronics и GlobalFoundries разделяют заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство несложно, разделяя между ними заказы исходя из выхода годных чипов и других параметров, что должно позволить решить потенциальные проблемы с недостаточными объемами производства.

Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности. Если описывать вкратце, то FinFET-транзистор - это транзистор с каналом, окруженным затвором через прослойку в виде изолятора с трех сторон - по сравнению с планарным, где поверхность сопряжения - это одна плоскость. FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно, для освоения соответствующих техпроцессов потребовалось пять лет.

Зато новая форма транзисторов обеспечивает больший выход годных, меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники. Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведенными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведенных чипов одной модели) - сравните разброс параметров для FinFET-техпроцесса 14 нм и привычного 28 нм у TSMC:

На этой диаграмме видны как большая средняя производительность для FinFET-продуктов, так и меньшие утечки в среднем, и меньший разброс в показателях производительности и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

В итоге графические процессоры, произведенные при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных.

Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и легких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъемов питания.

Но для того, чтобы добиться большей энергоэффективности, недостаточно просто перевести чип на более «тонкий» техпроцесс, требуются многочисленные изменения в его дизайн. К примеру, в Polaris применяется адаптивное тактирование GPU. Графические процессоры работают при низком напряжении и высокой силе тока, и поставлять качественное напряжение от схем питания довольно сложно. Разброс в напряжении может достигать 10-15% от номинального значения, и среднее напряжение приходится повышать для того, чтобы перекрыть эту разницу, и на это тратится впустую куча энергии.

Адаптивное тактирование в решениях AMD восстанавливает эти потери со снижением энергозатрат на четверть. Для этого, в дополнение к уже существующим сенсорам энергопотребления и температуры добавляется еще и сенсор частоты. В результате работы алгоритма достигается максимальная энергоэффективность для всего чипа.

Также производится калибровка блока питания при загрузке системы. При испытаниях процессора запускается специальный код для анализа напряжения, и интегрированными мониторами питания записывается значение напряжение. Затем при загрузке ПК запускается тот же код и замеряется полученное напряжение, и регуляторы напряжения на плате устанавливают такое же напряжение, какое было при тестировании. Это исключает затраты энергии, которая расходуется из-за разницы в системах.

Есть в Polaris и адаптивная компенсация старения транзисторов - обычно графические процессоры требуют запаса тактовой частоты порядка 2-3% для приспособления к старению транзисторов чипа, да и другие компоненты также демонстрируют старение (например, GPU получает более низкое напряжение от системы). Современные решения AMD умеют делать самостоятельную калибровку и адаптироваться к изменяющимся условиям со временем, что обеспечивает надежную работу видеокарты в течение продолжительного времени и немного повышенную производительность.

Radeon WattMan - новые возможности разгона и мониторинга

Важной составляющей любого современного видеодрайвера являются настройки для разгона, позволяющие выжать из GPU все его возможности. Ранее этим заведовал раздел AMD Overdrive в драйверах решений этой компании, а вместе с выходом новых решений в AMD решили кардинально обновить и этот раздел драйвера, назвав его Radeon WattMan.

Radeon WattMan - это новая утилита AMD для разгона, позволяющая изменять напряжение GPU, частоту графического процессора и видеопамяти, скорость вращения вентилятора системы охлаждения и целевую температуру. Radeon WattMan основан на возможностях, виденных ранее в Radeon Software, но предлагает несколько новых функций по тонкому разгону - с иными возможностями по управлению напряжением и частотой GPU. Также в WattMan появился удобный мониторинг активности GPU, тактовых частот, температур и скорости вентилятора.

Удобно сделано то, что как и в других настройках Radeon Software Crimson Edition, можно задать собственный профиль разгона для каждого приложения или игры, который будет применен при их запуске. А после завершения работы приложения, настройки вернутся к глобальным по умолчанию. Radeon WattMan можно найти в Radeon Settings, он заместил текущую панель AMD OverDrive, и совместим с серией AMD Radeon RX 400.

Возможно как простое управление частотой GPU, так и тонкая настройка кривой частот. Простая настройка частоты работает по умолчанию и позволяет изменять заданные инженерами AMD значения, оптимальные для каждого состояния GPU. Изменение кривой частоты возможно с точностью в 0,5%. Есть и динамическое изменение кривой частоты, когда тактовая частота ядра GPU и видеопамяти может изменяться для каждого состояния вместе с изменением напряжения для каждого из них. Напряжения для GPU и памяти устанавливаются независимо друг от друга.

Есть в WattMan и продвинутое управление скоростью вращения вентилятора в системе охлаждения, когда устанавливается минимальная скорость, целевая скорость и минимальный акустический предел. При этом целевая скорость вращения - это максимум, при котором будет вращаться вентилятор при температуре не выше целевой. Улучшенное управление температурой позволяет выставить максимальное и целевое значения температуры. Вместе с пределом потребления энергии, это позволяет выставить более тонкие настройки.

Максимальная температура - это абсолютный максимум, при котором частота графического чипа не снижается, но после ее достижения, частота начнет снижаться. А целевая температура - значение, по достижению которого будет расти скорость вращения вентилятора. Предельное значение питания для GPU можно повысить или понизить в пределах до 50% (в случае модели Radeon RX 480).

Кажется, мы где-то уже видели возможность тонкого изменения кривой частот и напряжений, причем совсем недавно, правда? Но чего мы еще точно не видели, так это удобного интерфейса мониторинга и настроек в самих драйверах, а не сторонних утилитах, и AMD можно лишь похвалить за такую заботу о пользователях.

Новый интерфейс мониторинга позволяет записывать и просматривать активность графического процессора, его температуру, скорость вентилятора и частоты. Причем, есть как глобальный мониторинг (Global WattMan), так и отдельный мониторинг для пользовательских профилей, который мониторит пиковые и средние данные только когда приложение открыто. Данные собираются и в фоновом режиме, утилите Radeon Settings не обязательно быть запущенной, данные собираются максимум до 20 минут работы приложения.

В целом, AMD есть еще над чем работать для улучшения удобства интерфейса WattMan, так как он не предназначен для управления с клавиатуры, например, но саму по себе инициативу можно лишь приветствовать - удобные инструменты настройки и мониторинга прямо в драйверах могут стать дополнительным плюсом новых решений семейства Radeon RX 400.

Новые возможности по выводу изображения

Мы уже рассказывали ранее о том, что новые решения компании AMD будут отличаться поддержкой самых последних стандартов DisplayPort и HDMI. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR. Новые версии этого стандарта используют существующие кабели и разъемы, но могут накладываться дополнительные ограничения на их длину.

Главным преимуществом стандарта DisplayPort 1.3 HBR3 является увеличение пропускной способности до 32,4 Гбит/с (на 80% больше, чем у HDMI 2.0b), что отодвигает предел по пропускной способности, имеющийся в предыдущем поколении DisplayPort 1.2. Новый стандарт позволяет подключать 5K-мониторы в RGB-формате при 60 Гц, используя единственный кабель (сейчас приходится подключать пару разъемов и кабелей), а также UHDTV-телевизоры с разрешением 8K (7680×4320), используя цветовую субдискретизацию 4:2:0 при 60 Гц. Также по DisplayPort 1.3 можно подключать и стереодисплеи с 120 Гц и 4K-разрешением. Появление 5K-дисплеев, рассчитанных на один кабель, и 4K-дисплеев с поддержкой HDR, ожидается ближе к концу этого года.

Также Polaris готов к внедрению стандарта DisplayPort 1.4-HDR, поддерживающего вывод изображения с глубиной цвета до 10-bit в разрешении 4K и с частотой обновления до 96 Гц. Новинкой компании поддерживаются Рекомендации ITU Rec.2020 по цветовому пространству для UHDTV, а также стандарты CTA-861.3 и SMPTE 2084 EOTF для передачи HDR-данных.

Новый стандарт DisplayPort 1.3 будет полезен и для продвижения технологии FreeSync для 4K-мониторов. Компания AMD ожидает появления первых таких устройств с поддержкой технологии динамического обновления до 120 Гц к концу 2016 года. Такие мониторы будут способны работать в 4K-разрешении с применением технологий FreeSync при 30-120 FPS и будут поддерживать компенсацию низкой частоты кадров Low Framerate Compensation.

Вот список характеристик для мониторов нового поколения, которые становятся возможными при использовании новой версии стандарта DisplayPort 1.3 с расширенной пропускной способностью: мониторы с разрешением 1920×1080 пикселей: 240 Гц SDR и 240 Гц HDR, мониторы с разрешением 2560×1440: 240 Гц SDR и 170 Гц HDR, 4K-мониторы: 120 Гц SDR и 60 Гц HDR, 5K-мониторы: 60 Гц SDR.

Если уж мы начали говорить про FreeSync, то нужно упомянуть, что в решениях архитектуры Polaris эта технология будет работать и с мониторами, имеющими разъемы HDMI 2.0b. На данный момент компания работает со своими партнерами, в числе которых Acer, LG, Mstar, Novatek, Realtek и Samsung, для обеспечения работы технологии динамического частоты обновления, в том числе и при помощи HDMI. Список планируемых к выпуску мониторов включает изделия с размерами экрана от 20 до 34 дюймов и различным разрешением.

Одной из самых интересных и перспективных возможностей Polaris по выводу информации является поддержка HDR-дисплеев с расширенным динамическим диапазоном. Для получения качественной картинки нужен вывод изображений в широком цветовом охвате с увеличенной контрастностью и максимальной яркостью, а на нынешних дисплеях человек видит лишь малую часть того, что может наблюдать своими глазами в окружающем мире. Диапазон воспринимаемых нами яркостей и цветов куда больше того, что могут дать нам текущие устройства вывода.

Внедрения High Dynamic Range во все стадии конвейера обработки изображения ждут многие энтузиасты качественного изображения. Для того чтобы хоть приблизиться к возможностям человеческого зрения, был введен новый индустриальный стандарт для телевизоров - HDR UHDTV, обеспечивающий диапазон яркости от 0.005 до 10000 нт. Первые HDR-устройства имеют яркость до 600-1200 кд/м 2 , а ЖК-мониторы с поддержкой High Dynamic Range (HDR) и локальной подсветкой в будущем смогут обеспечить до 2000 нт, а OLED-дисплеи - до 1000 нт, но при идеальном черном цвете и большей контрастности.

При использовании HDR пользователям будет демонстрироваться и расширенный цветовой диапазон, так как распространенное сейчас цветовое пространство sRGB сильно отстает от возможностей зрения человека. Нынешний контент почти весь создан в рамках стандартов BT.709, sRGB, SMPTE 1886 (Gamma 2.4), а новый стандарт HDR-10, Rec.2020 (BT.2020), SMPTE 2084 способен обеспечить отображение более миллиарда цветов при 10-бит на компонент, что приближает качество цветопередачи к естественному для человека.

Не нужно путать тему устройств отображения с HDR-возможностями с тем, что давно появилось в играх и называется HDR-рендерингом. Действительно, многие современные игровые движки используют рендеринг с расширенным динамическим диапазоном, чтобы сохранить данные в тенях и светах, но делается это исключительно до вывода информации на дисплей. А далее изображение все равно приводится к обычному динамическому диапазону, чтобы вывести его на SDR-монитор.

Для этого используются специальные алгоритмы тонального отображения (tone mapping ) - преобразования тональных значений из широкого диапазона в узкий. С учетом появления HDR-устройств нужны как улучшенные алгоритмы tone mapping, так и ориентация их уже на HDR-дисплеи. Аппаратный движок обработки цветовых данных в Polaris имеет программируемые возможности по управлению гаммой и преобразования цветового охвата (gamut remapping), все расчеты идут с высокой точностью, и результат будет полностью соответствовать возможностям дисплея.

Хотя даже нынешние видеокарты Radeon в определенной мере готовы для работы с HDR-мониторами, вышедшие новые модели обеспечивают заметно более высокую частоту обновления и глубину цвета. Графические процессоры Polaris готовы к HDR-мониторам с глубиной цвета в 10-бит и 12-бит на компоненту, хотя первые такие дисплеи будут поддерживать только 10-бит, но затем последуют и более продвинутые, которые превзойдут возможности человеческого зрения.

Для того, чтобы получить качественное HDR-изображение в игровых приложениях, необходимо переделывать не только графическую часть игрового движка, но и часть контента: те же текстуры должны также храниться в форматах, позволяющих использовать широкий цветовой и яркостный охват. Компания AMD работает с игровыми разработчиками для того, чтобы будущие игры уже могли полноценно использовать возможности HDR-дисплеев, и для этого они выпустили специальный Radeon Photon SDK.

И тут есть над чем поработать. Тональное отображение (tone mapping) в играх должно делаться графическим движком, так как этот процесс, производимый дисплеем добавляет значительные задержки. AMD предлагает делать так: монитор опрашивается на предмет его возможностей по цвету, контрасту и яркости, затем с учетом этой информации игровой движок делает tone mapping и выводит его на дисплей в готовом виде. Так как игровые движки уже делают tone mapping в SDR, им просто нужно добавить возможность вывода в HDR.

Photon SDK уже доступен для разработчиков, поддержка HDR для видеоданных и рендеринга в DirectX 11-приложениях в драйвере уже готова, а поддержка DirectX 12 планируется с будущим его обновлением. Остается добавить, что Polaris поддерживает HDR-дисплеи, соединенные при помощи разъема HDMI 2.0b (с HDCP 2.2) в разрешении 1920×1080 при 192 Гц, в разрешении 2560×1440 при 96 Гц и 3840×2160 при 60 Гц и кодировании цвета 4:2:2. В случае присоединения по DisplayPort 1.4-HDR (также с HDCP 2.2) возможности шире: 1920×1080 при 240 Гц, 2560×1440 при 192 Гц и 3840×2160 при 96 Гц. Осталось дождаться таких мониторов с ценой ниже, чем у чугунного моста.

Улучшенное кодирование и декодирование видеоданных

Как часто бывает, в новых поколениях графических процессоров заодно улучшают и блоки аппаратной обработки видеоданных. Ведь время не стоит на месте, появляются все новые форматы и условия их использования (частота кадров, глубина цвета и т.п.) Поэтому неудивительно, что в Polaris были проведены кое-какие улучшения по декодированию и кодированию видеоданных.

Если кодировать видеоряд в формат H.264 вплоть до 4K-разрешения при 30 или даже 60 FPS умели и предыдущие решения, то кодирование видео в формат HEVC (H.265) Polaris научился впервые. Аппаратным блоком кодирования видео в новом GPU поддерживаются следующие разрешения и частоты кадров: 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS.

Мало того, на видеокартах серии Radeon RX была добавлена поддержка и высококачественного кодирования потокового видео из игр. Ведь качество кодирования всегда было слабым местом потокового видео, и при быстро меняющемся изображении его качество серьезно страдало. Высокого же качества картинки можно добиться при двухпроходном кодировании с анализом картинки в первом проходе, которое и было внедрено в Polaris. Аппаратное двухпроходное кодирование работает как с H.264, так и с форматом HEVC, и подобный подход дает заметно более высокое качество видеопотока.

Чтобы раскрыть аппаратные возможности архитектуры Polaris, нужна поддержка и со стороны программного обеспечения. Качественный аппаратный кодер для игр поддерживается следующими утилитами: Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

Также Polaris оснащен и самым продвинутым аппаратным блоком, декодирующий видеоданные. Видеодекодер компании AMD умеет работать с форматом HEVC и профилем кодирования Main-10 в разрешениях до 4K с частотой кадров в 60 FPS, MJPEG в 4K-разрешении с 30 FPS, H.264 в разрешении 4K до 120 FPS, MP4-P2 до 1080p при 60 FPS и VC1 до 1080p при 60 FPS.

Поддержка систем виртуальной реальности

За несколько последних лет текущая реинкарнация шлемов виртуальной реальности прошла немалую дорогу, постоянно улучшая свои потребительские характеристики (хотя до идеала все равно еще очень далеко). Если начиналось все с менее чем Full HD-разрешения на оба глаза в 2014 году при не более чем 30 FPS, то теперь дело дошло до разрешения 1080×1200 пикселей на каждый глаз при 90 FPS и 10 мс задержками. И сейчас ощущения от VR куда комфортнее и реалистичнее.

Компания AMD также со своей стороны занимается улучшением характеристик, связанных с VR. Так, технология LiquidVR предполагает реализацию некоторых возможностей, улучшающих VR на решениях компании. В числе последних изменений поддержка аудиотехнологии TrueAudio Next, резервирование вычислительных блоков под конкретные задачи, технология асинхронных вычислений Quick Response Queue, переменное разрешение и качество рендеринга для VR, поддержка DirectX 12 и Vulkan.

Так, технология продвинутой обработки звука TrueAudio Next включает всю работу со звуками на GPU в реальном времени - с соблюдением физических законов распространения звуковых волн и применением просчета лучей (рейтрейсинг) для множества источников звука. Это позволяет получить качественный звук с низкими задержками и при помощи настроек (количество обрабатываемых источников и количество отражений звуковых волн) получить хорошо масштабируемое решение.

Еще одной возможностью по работе с VR, которая недавно появилась, стало выделение нескольких вычислительных устройств Compute Unit под различные задачи, вроде обработки звука - в таком случае, эти CU будут заниматься исключительно этими задачами, чтобы избежать проблем, связанных с одновременным исполнением различных задач на GPU в реальном времени - это решение обеспечивает немедленное исполнение критичного кода и работает с любыми типами шейдеров, вычислительными или графическими.

А архитектуре Polaris был улучшен командный процессор - появилась новая техника качества обслуживания (QoS - quality of service) под названием Quick Response Queue. Эта техника позволяет разработчикам через API назначать высокоприоритетными некоторые вычислительные задачи. Оба типа задач (обычные и приоритетные) разделяют те же ресурсы GPU, но высший приоритет позволяет удостовериться, что такие задачи будут использовать большее количество ресурсов и завершатся первыми, без переключения командного процессора на низкоприоритетные задачи.

Конкретно в LiquidVR эта техника используется при асинхронном искажении времени (Asynchronous Time Warp), используемом в системах виртуальной реальности для того, чтобы избежать отброшенных кадров, ухудшающих плавность процесса - в VR это очень требовательная к задержкам задача, и приоритезация задач поможет удостовериться, что искажение времени происходит ровно тогда, когда нужно. Техника Quick Response Queue (QRQ) дает четкое управление над таймингами, минимизируя их.

Без использования техники асинхронного искажения времени в системах виртуальной реальности получается так, что графический процессор при работе отбрасывает около 5% кадров, а с Asynchronous Time Warp эти кадры не отбрасываются, что снижает «дрожание» (разное время рендеринга соседних кадров) в десятки раз. На данный момент возможность уже входит в состав библиотеки, доступной на сайте GPUOpen.

Мы уже знаем еще об одной оптимизации, связанной с VR - использование нескольких проекций при рендеринге сцены виртуальной реальности с разным разрешением. Мы уже не один раз рассказывали об этой возможности, которая оптимизирует VR-рендеринг, используя независимые настройки разрешения и качества разрешения для нескольких проекциях, которыми имитируется воронкообразный тип рендеринга, используемый в VR-шлемах. В этом случае для центра кадра применяется рендеринг в высоком разрешении, а на периферии оно снижается для оптимизации производительности.

В составе LiquidVR есть поддержка DirectX 12 - идеального графического API для виртуальной среды, так как он позволяет повысить количество функций вызовов отрисовки в сцене, помогает снизить нагрузку на CPU, имеет родную поддержку для асинхронного исполнения вычислений и многочипового рендеринга, а также дает некоторые возможности для низкоуровневого доступа к GPU. Примеры использования DirectX 12 в составе LiquidVR, а также соответствующая документация доступны на сайте GPUOpen.com.

Программные технологии Radeon Software

В компании AMD продолжают улучшать не только аппаратную составляющую своих продуктов, но и программные компоненты. В очередной раз они решили оптимизировать частоту выпуска новых версий видеодрайверов, так как некоторые пользователи оставались недовольны тем, что было в прошлом году. Долгие годы они ежемесячно выпускали обновленные WHQL-драйверы, но некоторым пользователям казалось, что это слишком часто. После того, как они снизили частоту выпуска релизов драйверов, другие пользователи оказались недовольны уже редкими выходами.

Так, в 2015 году было выпущено три WHQL драйвера и 9 бета-версий, а план на 2016 такой: шесть полноценных драйверов с WHQL-сертификацией за год + такое количество специальных версий с оптимизациями для игр, какое понадобится (в идеале - также WHQL). Пока что у них получается почти всегда, с момента выхода игр были доступны драйверы Radeon Software Crimson Edition для игр The Division, Far Cry Primal, Hitman, Quantum Break и других. С игрой Doom и видеокартами на чипах предыдущих поколений GCN вышла небольшая заминка, правда, но с кем не бывает?

Продолжают в AMD обращать внимание на оптимизацию драйверов, предназначенную для плавной смены кадров, особенно в многочиповых конфигурациях. Так, CrossFire API для DirectX 11 был включен в состав GPUOpen, а для некоторых DirectX 12-приложений планируется поддержка многочипового рендеринга с плавной сменой кадров и малой разницей во времени рендеринга соседних кадров, а не только с высоким FPS.

В будущих драйверах Radeon Software для DX12–игр планируется специальная поддержка AFR frame pacing - технология, которая специальным образом добавляет задержки перед тем, как вывести изображение на экран, что улучшает плавность и устраняет рывки при многочиповом рендеринге.

Очень важно, что все большее внимание уделяется операционным системам, отличным от Windows. Так, представлена поддержка Polaris для дистрибутивов Linux на основе открытого кода - в этих драйверах уже есть поддержка Vulkan-версии игры Dota 2, например.

Из любопытного отметим специальную программу для бета-тестирования Radeon Software Beta Program. Эта программа работает под управлением отдела обеспечения качества (Quality Assurance - QA), и в нее может вступить любой пользователь, написав по адресу [email protected] для получения дополнительной информации.

Самые важные изменения произошли с настройками Radeon Settings, включенными в состав нового драйвера. Там появилась глобальная поддержка Crossfire и энергоэффективности, масштабирование HDMI и масштабирование в зависимости от конкретного приложения, изменение цветовой температуры, выбор языка пользовательского интерфейса и многое другое - о возможностях разгона и мониторинга мы уже рассказали выше.

Все это касается конечных пользователей, но постоянно происходят и изменения в программной поддержке, предназначенные для разработчиков. Открытая инициатива GPUOpen давно известна как удобный метод для обеспечения разработчиков SDK, библиотеками и примерами с открытым кодом. Только за последний месяц на портале появилось 14 больших обновлений, за четыре месяца разработчиками было написано 41 блогов, а всего с момента запуска инициативы в конце января было размещено более 60 примеров кода, SDK, библиотек и утилит.

Из последних примеров отметим ShadowFX с поддержкой DirectX 12, улучшения GeometryFX для DirectX 11, обновленный TressFX 3.1 (DirectX 11). Появились новые библиотеки, SDK и примеры для многочипового рендеринга в DirectX 12, пример out of order растеризации для Vulkan, FireRays для Vulkan и OpenCL, поддержка CrossFire API для DirectX 11. Также AMD стала первым производителем аппаратного обеспечения, выпустившим расширение для SPIR-V - шейдерного языка в графическом API Vulkan с поддержкой инструкций GCN). Также появилась поддержка Radeon для OpenVX - открытого кроссплатформенного стандарта для ускорения приложений машинного зрения.

А недавно AMD представила расширение Shader Intrinsic Functions для библиотеки GPUOpen, которое облегчит оптимизацию ПК-версий игр, облегчив разработку многоплатформенных приложений и портирование игр с консолей. При использовании Shader Intrinsic Functions разработчик может получить прямой доступ к низкоуровневым инструкциям, как на консолях - при помощи вставок низкоуровневого кода в исходники высокого уровня. Эту возможность можно использовать в приложениях с поддержкой DirectX 11, DirectX 12 и Vulkan.

Выводы по теоретической части

Видеокарта модели Radeon RX 480 стала первенцем семейства Polaris, первой вышедшей на рынок моделью в новой линейке компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями, это позволило серьезно повысить энергоэффективность нового решения, и в результате по этому показателю новинка вдвое-втрое лучше предыдущих видеокарт компании AMD.

Хотя графический процессор Polaris 10 архитектурно весьма схож с предыдущими чипами и во многом повторяет их решения, и графические архитектуры разных поколений GCN не слишком сильно отличаются друг от друга, в новом графическом процессоре было сделано множество улучшений для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были серьезно улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео.

Polaris 10 - лучшее графическое ядро компании AMD, которое принесло новые функциональные возможности, но главное - стало значительно более эффективным. Так, улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений, по сравнению с архитектурой GCN предыдущих поколений. Вместе с применением нового техпроцесса 14 нм FinFET и другими оптимизациями, это позволило заметно улучшить энергоэффективность - вплоть до 2,8 раз, по оценке компании. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

В списке функциональных изменений и улучшений - поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, запись игрового процесса на лету без участия мощностей CPU, качественный режим кодирования видео с двумя проходами, и т.д. Также можно отметить появление поддержки стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

Но главное в представленном сегодня продукте Radeon RX 480 - его цена. Пусть некоторым покажется, что функциональных нововведений и оптимизаций в Polaris не так уж много, зато этот новый продукт, использующий современный технологический процесс, позволил серьезно снизить цену видеокарты, вполне достаточной как для последних игр с высокими настройками качества, так и для применения в составе систем виртуальной реальности, довольно требовательной к мощности GPU.

Сочетание сравнительно низкой цены и достаточно высокой производительности делает Radeon RX 480 одной из самых удачных по соотношению цены и производительности видеокарт на момент ее выпуска, если не самой выгодной. Важно, что она ориентирована на средний ценовой сегмент, привлекающий куда большее количество потенциальных покупателей, чем топовые решения, и выпуск именно такой модели в первую очередь может положительно сказаться на рыночной доле компании AMD в сегменте игровых видеокарт.

В следующих частях нашей статьи мы оценим производительность новой видеокарты AMD Radeon RX 480 на практике, сравнив ее скорость с показателями близких по цене ускорителей компаний Nvidia и AMD. Сначала мы рассмотрим данные, полученные в нашем наборе синтетических тестов, а затем перейдем и к самому интересному - игровым тестам.

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Очень сложно писать вступление, когда результаты уже знаешь, а делиться ими еще рано. Поэтому начну издалека. Начиная с момента появления архитектуры GCN, компания AMD задала высокую планку для конкурента.

реклама

К сожалению, со временем решения на базе GCN хоть и получали новые ревизии, но начали отставать. В это время Nvidia удалось излечиться от двух болезней: она совершила рывок в уменьшении энергопотребления видеокарт и существенно нарастила частоты, внедрив умные алгоритмы управления GPU Boost.

Компания AMD ждала подходящий случай, и сейчас он настал. Одним махом производитель выпустил предлагаемую по доступной цене видеокарту, графический процессор которой достиг частоты 1.25 ГГц (прежние референсные частоты были около 1.0 ГГц), оснастил ее 8 Гбайтами видеопамяти, работающей на частоте 8 ГГц, и опустил планку энергопотребления с 200-250 до 150 Вт.

реклама

Новые возможности

При разработке нового графического решения AMD уделила внимание сразу нескольким направлениям. В их числе:

  • Стандарт multiGPU (Crossfire) стал открытым (GPUopen);
  • Внедрение поддержки XConnect для подключения видеокарт во внешнем боксе;
  • Стандарт API AMD LiquidVR для рендера мультиразрешения для VR;
  • Увеличенные буферы и оптимизация предвыборки шейдерных инструкций;
  • Асинхронные вычисления (назначение приоритетов и предварительное расписание выполнения);
  • Аппаратная поддержка 4К60 HEVC кодека и декодирование H.265 Main 10;
  • Поддержка HDR мониторов.

В архитектуре изменений меньше. Основная проблема масштабируемости прежних версий GCN заключалась в низкой удельной загрузке исполнительных юнитов. Из-за этого страдала эффективность, когда часть графического процессора простаивала без работы.

Версия GCN 1.4 должна лишиться почти всех узких мест. Для этого в ней обновили ряд важных деталей:

  • Кэширование инструкций стало лучше;
  • Улучшилась предвыборка шейдерных инструкций;
  • Улучшилась производительность в однопоточных задачах;
  • Появилась возможность группировать запросы в L2 кэше;
  • Уменьшилось время отклика кэша;
  • Совокупная производительность на один CU блок выросла до 15% по сравнению с GCN 1.0;
  • Обновленный контроллер памяти;
  • Более эффективные методы компрессии текстур;
  • В два раза увеличился объем L2 кэш-памяти;
  • Аппаратный планировщик для асинхронных вычислений.

В GPU появились новые датчики и схемы управления частотами и CU. Они учитывают энергопотребление и температуру отдельных блоков видеоядра и на основе этих данных управляют частотой всего графического процессора.

По заявлениям AMD, благодаря этому методу удается на 15-20% поднять эффективную частоту в рамках определенного энергопотребления. В совокупности 14 нм техпроцесса и изначальной ориентированности при разработке GPU на уменьшение энергопотребления удалось почти в три раза улучшить показатель скорости/энергопотребления по сравнению с GCN 1.0.

Технические характеристики

Наименование Radeon R9 380X Radeon R9 390 Radeon RX 480 GeForce GTX 960
Кодовое имя Tonga Hawaii Polaris GM206
Версия GCN 1.2 GCN 1.1 GCN 1.4 Maxwell 2.x
Техпроцесс, нм 28 28 14 28
Размер ядра/ядер, мм 2 366 438 232 227
Количество транзисторов, млн 5000 6200 ??? 2940
Частота ядра, МГц 1220 1126
Частота ядра (Turbo), МГц 970 1000 1266 1178
Число шейдеров (PS), шт. 2048 2560 2304 1024
Число текстурных блоков (TMU), шт. 128 160 144 64
Число блоков растеризации (ROP), шт. 32 64 32 32
Максимальная скорость закраски, Гпикс/с 31 64 40.5 36
Максимальная скорость выборки текстур, Гтекс/с 124 160 182 72.1
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Эффективная частота памяти, МГц 1425 1500 2000 1750
Объем памяти, Гбайт 4 8 8 2
Шина памяти, бит 256 512 256 128
Пропускная способность памяти, Гбайт/с 182 384 256 112.2
Питание, разъемы Pin 6 + 6 6 + 8 6 6
Потребляемая мощность (2D / 3D), Ватт -/190 -/275 -/150 -/120
CrossFire/Sli V V V V
Цена при анонсе, $ 229 329 229 200
Заменяемая модель Radeon R9 280X Radeon R9 290 Radeon R9 380(Х) GeForce GTX 760

Самыми близкими по цене конкурирующими решениями для AMD Radeon RX 480 станут видеокарты

В ассортименте компании Sapphire имеется несколько неэталонных моделей, созданных на графическом процессоре AMD Polaris 10. Построенные на базе серии Nitro они совмещают в себе использование качественной элементной базы и нереференсной системы охлаждения, что обеспечивает видеокартам высокие показательные характеристики, к которым можно отнести производительность, низкий уровень шума и богатые функциональные возможности.

Видеокарта поставляется в вытянутой черной упаковке с темной полиграфией. На лицевой стороне отмечено изображение фирменного киборга, что дает понимание технологичности используемого продукта. Из информации на коробке мы можем подчеркнуть наименования производителя и модели, объем видеопамяти равный 8 Гбайт, неэталонный дизайн и заводской разгон.

Описание на обратной стороне носит поверхностный характер. Разработчики рассказывают о новой серии Sapphire Nitro, которая была разработана и оптимизирована под запросы архитектуры AMD Polaris, и что новая линейка позволит раскрыть весь потенциал графического процессора. Отдельным перечнем приведены поддерживаемые функции и технологии.

Внутри темной упаковки скрывается коробка из плотного картона, уберегающая содержимое во время транспортировки.

Для дополнительной сохранности Sapphire Radeon RX 480 Nitro+ 8Gb помещена в антистатический пакет с воздушной прослойкой.

Для комплекта поставки имеется отдельная ниша. В него вошли руководство пользователя, диск с драйверами, брошюра компании и гарантийная памятка.

Внешний вид

Разработчики разработали монолитный черный дизайн для всей линейки Sapphire Nitro+, который сведен к двум вентиляторам диаметром 100 мм и декоративному кожуху с характерным рисунком в виде многочисленных точек.

Размеры видеокарты достаточно демократичны. Длина модели составляет 240 мм, ширина – 121 мм, в ПК будут перекрыты два слота расширения.

Система охлаждения практически закрывает видеокарту боковыми вставками. Только верхняя панель щеголяет выступающими тепловыми трубками. На нижней же разместилась красочная подсветка Nitro Glow с RGB светодиодами.

Отличительной особенностью видеокарты компании Sapphire среди прочих моделей является металлический бэкплейт. Помимо красочного оформления и прорезей для выходя горячего воздуха, пластина отводит тепло от зоны подсистемы питания через черную термопрокладку, что сказывается на снижении температуры VRM.

На задней панели размещены пять эталонных видеовыходов - DVI-D, два HDMI 2.0b и два DisplayPort 1.4.

На видеокарте Sapphire Radeon RX 480 Nitro+ 8Gb установлен один восьмиконтактный разъем дополнительного питания, что поднимает планку TDP с 150 до максимальных 225 Вт. Стоит отметить, что энергопотребление модели в среднем составляет 140-150 Вт, что оставляет определенный запас для разгона.

А изюминкой новинки является совмещенные переключатель микропрограммного обеспечения и кнопка смены режима подсветки, расположенные друг над другом. Двойной BIOS позволяет в случае неудачной прошивки без особых проблем исправить недочет, а также использовать две версии BIOS: в одном задействовать, к примеру, рекомендуемые настройки, а во втором – для разгона с повышенными частотами.

Система охлаждения

Система охлаждения линейки Sapphire Nitro+ заслуживает отдельного внимания. В качестве СО на модели установлена усовершенствованный кулер Dual-X с интересной технологией Quick Connect. Данная функция подразумевает возможность простого снятия вентиляторов для их чистки и в крайнем случае замены. Любопытно и следующее нововведение – Nitro FanSafe. Она позволить контролировать состояние вентиляторов, которое можно провести с помощью утилиты Sapphire TriXX. Если же «здоровье» вертушек пошатнулось, то согласно заявлению разработчиков, при связи с техподдержкой и выяснению деталей, вам вышлют замену.

Сами вентиляторы изготовлены компанией Champion, модель CF1015H12D. Их диаметр составляет 100 мм, а самой крыльчатки – 95 мм. Они способны работать в диапазоне 0 – 3500 об/мин.

Охладитель представляет собой односекционный радиатор, набранный из 36 алюминиевых никелированных пластин. Они пронизаны тремя тепловыми трубками, две из которых имеют диаметр 8 мм, и одна – 6 мм. Все соединения тщательно пропаяны.

С графическим процессором контактирует медная вставка, а большое основание накрывает все микросхемы видеопамяти. Подобная ситуация и с подсистемой питания, где для каждой группы силовых транзисторов разработчики выделили свою термопрокладку.

Печатная плата

Sapphire Radeon RX 480 Nitro+ 8Gb построена на оригинальной печатной плате черного цвета. Разработчики прибегнули к интересной форме PCB, которая позволяет использовать часть текстолита для крепления кожуха системы охлаждения. Стоит подчеркнуть, что данная печатная плата используется не только на тестируемой новинке, но и также ее модификациях и версии Radeon RX 470.

Используется качественная элементная база, в том числе долговечные твердотельные конденсаторы, Direct-FET транзисторы и фирменные дроссели с пониженным энергопотреблением Black Diamond.

Подсистема питания отлична тем, что построена по формуле «5+1», где пять фаз отводятся на графический процессор и одна – на видеопамять.Одна фаза для GPU так и осталась не распаянной, что возможно означает ее появление на более производительной и разогнанной модели Sapphire Radeon RX 480 Nitro+ 8Gb.

Графический процессор представлен компаний AMD c кодовым названием Polaris 10. Он получил 2304 потоковых процессов, 144 текстурных блоков и 32 ROP.

За управление отвечает известный и хорошо задокументированный ШИМ-контроллер IR 3568B.

На видеокарте распаяно восемь микросхем видеопамяти производства SKhynix общим объемом 8 Гбайт. Чипы работают на номинальной частоте 2000 МГц.

Тестовый стенд

  • Процессор: Intel Core i7-4770K (4000 МГц);
  • Материнская плата: MSI Z97 Gaming 5, версия БИОС 1.11;
  • Кулер: Noctua NH-D15S;
  • Память: 2 x 4 Гбайт DDR3 2133, Kingston HyperX Genesis (KHX18C10/4);
  • Видеокарта: Sapphire Radeon RX 480 Nitro+ 8Gb;
  • Накопитель SSD: SanDisk X110 256 Гбайт;
  • Блок питания: Chieftec APS-1000C 1000W;
  • Корпус: Zalman Z9 Neo;
  • Монитор: BenQ GW2460HM;
  • Операционная система: Windows 7 64-bit Service Pack 1;
  • Драйвера: AMD Crimson 16.11.2 HotFix.

Тестирование

Sapphire Radeon RX 480 Nitro+ 8Gb получила незначительный заводской разгон, однако, на фоне конкурентов это уже заметный шаг вперед. Частота ядра была повышена с 1120 МГц до 1160 МГц, в режиме Boost – с 1266 МГц до 1306 МГц. В ассортименте компании есть и более производительная модель. Графический процессор работает при 1.150 В. В режиме простоя частоты понижаются до 300/300 МГц, а система охлаждения останавливает вентиляторы, что стало признаком хорошего тона современных видеокарт. Температура держится на отметке 42-45°С.

В качестве нагрузочного теста для оценки эффективности системы охлаждения был использован 3DMark Fire Strike в режиме теста устойчивости, 15 прогонов. Это создает высокую нагрузку на графические ускорители, но Sapphire Radeon RX 480 Nitro+ 8Gb показывает себя неплохо. Частота ядра составляет 1252-1286 МГц при напряжении 1.089 В, а вентиляторы работают при 39% от максимальной мощности, что составляет 1650 об/мин. Видеокарта работает тихо, а прогревается до 77-78°С.

Синтетические тесты

Игровые тесты

У новинки есть определенный потенциал, который мы постараемся реализовать. Sapphire Radeon RX 480 Nitro+ 8Gb удалось разогнать по частоте ядра до 1360 МГц, по памяти – 2150 МГц. Результаты отнюдь не рекордные, однако, система охлаждения работала в автоматическом режиме при максимальной скорости вращения 1900 об/мин, а температура едва достигала 80°С. Это опциональный параметр прошит в самом BIOS, значение которого кулер старается удерживать.

Производительность возросла по среднему показателю на 5%.

Заключение

На сегодняшний момент видеокарта Radeon RX 480 8Gb является высшим представителем графического решения от компании AMD, занявший свое место в среднем ценовом сегменте, где соперничает с не менее удачным соперником в лице GeForce GTX 1060. На стороне «красных» хороший уровень производительности в разрешении Full HD, возможность правки микропрограммного обеспечения благодаря утилитам, которые позволяют настроить видеокарту под свои нужны, и выход актуальных версий драйверов под новые игры. На примере Sapphire Radeon RX 480 Nitro+ 8Gb мы смогли в этом убедится.

Разработчики смогли выпустить сбалансированное решение, которое отметилось достаточно компактными размерами, оптимальной системой охлаждения, которая отметилась низким уровнем шума, и демонстрирует приемлемый нагрев. Конечно от компании Sapphire, которая за последние несколько лет производит одни из лучших нереференсов марки AMD, пользователи ждали большего, однако, видеокарта получилась достаточно оптимально настроенной и вписывается в концепцию «установили и забыли», что позволяет наслаждаться высокой производительностью и невысоким уровнем шума.

Достоинства:

  • Производительность в разрешении Full HD;
  • Заводской разгон;
  • Две микросхемы BIOS;
  • Восьмиконтаткный разъем дополнительного питания;
  • Эффективная система охлаждения Dual-X;
  • 8 Гбайт видеопамяти.

Недостатки:

  • Шумная система охлаждения при достижении 2100 об/мин и выше;
  • Невысокий разгонный потенциал.
  • Анализ среднегеометрических результатов и привлекательности покупки
  • реклама

    Вступление

    В данном обзоре будет изучена производительность новой видеокарты AMD – Radeon RX 480 8192 Мбайт. Ее соперниками стали следующие модели:

    • Radeon R9 Fury 4096 Мбайт;
    • Radeon R9 390X 8192 Мбайт;
    • Radeon R9 390 8192 Мбайт;
    • Radeon R9 380X 4096 Мбайт;

    • GeForce GTX 980 Ti 6144 Mбайт;
    • GeForce GTX 980 4096 Mбайт;
    • GeForce GTX 970 4096 Mбайт;
    • GeForce GTX 960 2098 Mбайт.

    реклама

    Тестовая конфигурация

    Тесты проводились на следующем стенде:

    • Процессор: Intel Core i7-6700K (Skylake, L3 8 Мбайт), 4000 @ 4600 МГц;
    • Материнская плата: Gigabyte GA-Z170X-Gaming 3, LGA 1151;
    • Система охлаждения CPU: Corsair Hydro Series H105 (~1300 об/мин);
    • Оперативная память: 2 x 4096 Мбайт DDR4 Corsair Vengeance LPX CMK8GX4M1A2400C14 (Spec: 2400 МГц / 14-16-16-31-1t / 1.2 В) , X.M.P. - on;
    • Дисковая подсистема №1: 64 Гбайт, SSD ADATA SX900;
    • Дисковая подсистема №2: 1 Тбайт, HDD Western Digital Caviar Green (WD10EZRX);
    • Блок питания: Corsair HX850 850 Ватт (штатный вентилятор: 140 мм на вдув);
    • Корпус: открытый тестовый стенд;
    • Монитор: 27" ASUS PB278Q BK (Wide LCD, 2560x1440 / 60 Гц).

    Видеокарты:

    • Radeon RX 480 8192 Мбайт - 1266/8000 @ 1320/8700 МГц (Sapphire);

    • Radeon R9 Fury 4096 Мбайт - 1000/500 @ 1100/500 МГц (Sapphire);
    • Radeon R9 390X 8192 Мбайт - 1050/6000 @ 1160/6500 МГц (Sapphire);
    • Radeon R9 390 8192 Мбайт - 1000/6000 @ 1140/6500 МГц (ASUS);
    • Radeon R9 380X 4096 Мбайт - 970/5700 @ 1150/6500 МГц (Gigabyte);

    • GeForce GTX 980 Ti 6144 Mбайт - 1076/7012 @ 1420/8100 МГц (Zotac);
    • GeForce GTX 980 4096 Mбайт - 1216/7012 @ 1440/8000 МГц (Palit);
    • GeForce GTX 970 4096 Mбайт - 1178/7012 @ 1430/8000 МГц (Zotac);
    • GeForce GTX 960 2098 Mбайт - 1178/7012 @ 1450/8000 МГц (Gigabyte).

    Программное обеспечение:

    • Операционная система: Windows 7 x64 SP1;
    • Драйверы видеокарты: Nvidia GeForce 372.70 WHQL и AMD Radeon Software Crimson 16.9.1.
    • Утилиты: Fraps 3.5.99 Build 15618, D3DGear 4.99.2017, AutoHotkey v1.0.48.05, MSI Afterburner 4.3.0 Beta 14.

    Инструментарий и методика тестирования

    Для более наглядного сравнения видеокарт все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1920 х 1080 и 2560 х 1440.

    В качестве средств измерения быстродействия применялись встроенные бенчмарки, утилиты Fraps 3.5.9 Build 15586 и AutoHotkey v1.0.48.05. Список игровых приложений:

    • Assassins Creed Syndicate (Пригород Лондона).
    • Doom (Поверхность Марса).
    • Dying Light: The Following (Ферма).
    • Fallout 4 (Перед ядерным взрывом).
    • Homefront: The Revolution (Рискованное предприятие).
    • Lords of the Fallen (Цитадель Замкового Камня).
    • Overwatch (Тренировочная база).
    • The Witcher 3: Wild Hunt - Blood and Wine (Туссент).
    • Tom Clancy"s The Division (Манхэттен).
    • Total War: Warhammer (Рейкландский руноклык).

    Во всех играх замерялись минимальные и средние значения FPS. В тестах, в которых отсутствовала возможность замера минимального FPS , это значение измерялось утилитой Fraps. VSync при проведении тестов был отключен.

    Перейдем непосредственно к тестам.

    Результаты тестов: сравнение производительности

    Assassins Creed Syndicate (Пригород Лондона)

    • Версия 1.5.0.
    • DirectX 11.
      • Сглаживание - FXAA.
      • Качество окружения - максимальное.
      • Качество текстур - высокое.
      • Качество теней - максимальное (PCSS).
      • Объемный свет – HBAO + Ultra.

    1920х1080

    Номинал
    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS

    реклама

    Doom (Поверхность Марса)

    реклама

    • Версия 1.0 Update 2.
    • id Tech 6.
      • Сглаживание - FXAA.
      • Хроматическая аберрация - включена.
      • Поле зрения - 90.
      • Масштабирование разрешения - 100%.
      • Качество освещения - ультра высокое.
      • Качество теней - ультра высокое.
      • Тень игрока - включена.
      • Качество направленного затемнения - высокое.
      • Качество декалей - ультра высокое.
      • Фильтрация декалей - анизотропная, х16.
      • Размер страницы при виртуальном текстурировании - ультра высокий.
      • Качество отражений - ультра высокое.
      • Качество частиц - ультра высокое.
      • Процедурные шейдеры - включены.
      • Качество размытия в движении - ультра высокое.
      • Глубина поля зрения - включена.
      • Сглаживание глубины поля зрения - включено.
      • HDR Bloom - включен.
      • Эффект бликов - включен.
      • Грязь на объективе - включена.
      • Режим рендеринга - кинематографический.
      • Степень увеличения резкости - 2.0.
      • Зернистость - 1.0.

    1920х1080

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS
    Статьи по теме: