amdgputhread

Путеводитель по видимокартам AMD

Nov 28th, 2020 (edited)
1,105
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. Путеводитель по видимокартам AMD, версия 2.0
  2.  
  3. Для каждой карты указаны краткие характеристики: число потоковых процессоров [ALU], разгонная частота [МГц], объём памяти [ГБ], пропускная способность памяти [ГБ/с], теплопакет [Вт].
  4.  
  5. BigNavi (RDNA 2 поколения, улучшенные 7 нм)
  6. ===========================================
  7.  
  8. Впервые со времён GTX 900 баба Лиза смогла потягаться с Nvidia в верхнем ценовом сегменте. И если раньше AMD шла по пути дорогих технологий вроде HBM2-памяти и большого тепловыделения, выжимая из GCN последние капли, то теперь новая линейка использует узкую шину с обычной GDDR6-памятью при умеренном энергопотреблении, а Хуанг ударился в более дорогую GDDR6X-память и TDP за 300 ватт. Имидж AMD как производителя обогревателей уходит в прошлое.
  9.  
  10. Особенности:
  11. * Технология прямого доступа к видеопамяти SAM даёт бесплатный прирост производительности, пока что работает только с Ryzen 5000, но обещают завезти и на других процессорах.
  12. * Огромный кеш в 128 МБ (Infinity cache) с узкой шиной памяти в 256 бит. Идея в том, чтобы обрезать контроллер памяти и пустить транзисторный бюджет на необычно большой кеш для компенсации более узкой и дешёвой шины, как это принято в CPU. Было много сомнений, но по факту задумка работает как надо.
  13. * Своя реализация трассировки лучей. Пока что уступает по производительности аналогу от Nvidia, вдобавок сказывается отсутствие DLSS.
  14.  
  15. RX 6900 XT (5120 ALU, 2250 МГц, 16 ГБ, до 512 ГБ/с, 300 Вт, 80 RT-ядер) - на данный момент самая быстрая видеокарта AMD. В традиционной растеризации сравнима с RTX 3090 при меньшем энергопотреблении, более простой памяти и более низкой цене. Уступает в рабочих задачах, где нужно много памяти, а также в трассировке лучшей при отсутствии аналога DLSS, что даёт огромную разницу в некоторых тестах.
  16.  
  17. RX 6800 XT (4608 ALU, 2250 МГц, 16 ГБ, до 512 ГБ/с, 300 Вт, 72 RT-ядра) - конкурент RTX 3080 с меньшим жором. Стоит дешевле топа, но в играх показывает себя на сравнимом уровне, что делает её выгодной покупкой (но не с дикими ценами на старте!)
  18.  
  19. RX 6800 (3840 ALU, 2105 МГц, 16 ГБ, до 512 ГБ/с, 250 Вт, 60 RT-ядер) - по сравнению с RTX 3070 несколько дороже, но и мощнее в традиционной растеризации. Вдвое больше памяти, что пригодится уже сейчас.
  20.  
  21. Если нужна хорошая производительность в традиционной растеризации, теперь у AMD едва ли не лучшее предложение. Если нужны лучи, лучше взять Nvidia.
  22.  
  23. Navi (RDNA 1 поколения, 7 нм)
  24. =============================
  25.  
  26. Свежая архитектура, оптимизированная под игры. По сравнению с GCN снизились задержки и улучшилось использование потоковых процессоров. Благодаря этому Navi выдают ту же производительность при значительно меньшем числе ALU и более низком энергопотреблении. Если бюджет позволяет и хочется AMD, имеет смысл брать именно их.
  27.  
  28. RX 5700 XT (2560 ALU, 1905 МГц, 8 ГБ, 448 ГБ/с, 225 Вт) - тягается с RTX 2070 Super, а где-то даже с RTX 2080. Про производительности как Radeon VII при меньшем энергопотреблении и куда более дешёвой памяти.
  29.  
  30. RX 5700 (2304 ALU, 1725 МГц, 8 ГБ, 448 ГБ/с, 180 Вт) - конкурент RTX 2060 Super и 2070. Чип несколько слабее XT-версии, память аналогичная - 8 ГБ быстрой и горячей GDDR6.
  31.  
  32. RX 5600 XT (2304 ALU, 1560 МГц, 6 ГБ, 336 ГБ/с, 150 Вт) - конкурент RTX 2060. Чип аналогичен RX 5700, но с порезанными частотами и энергопотреблением, а также с 6 ГБ памяти при более узкой шине. По производительности как Vega 56, но с меньшими аппетитами.
  33.  
  34. RX 5500 XT (1408 ALU, 1845 МГц, 4 или 8 ГБ, 224 ГБ/с, 130 Вт) - конкурент GTX 1650 Super, где-то несколько хуже, где-то дотягивается до GTX 1660. Существует в версиях на 4 и 8 ГБ памяти. По производительности как RX 580, но с куда меньшим энергопотреблением. Карту часто критикуют за обрезанный PCIe (8 линий вместо 16), но это сказывается лишь при нехватке видеопамяти. Поставьте адекватные текстуры и не сношайте себе мозги.
  35.  
  36. Видеокарты RX 5300, RX 5300 XT, RX 5500, RX 5600 и выпускаются только для OEM, ничего интересного в них нет.
  37.  
  38. Vega (GCN 5 поколения, 7 нм и 14 нм)
  39. ====================================
  40.  
  41. В линейке Polaris не было видеокарт верхнего сегмента. Чтобы занять эту нишу, AMD выпустила видеокарты Vega. Хотя в вычислительных задачах они тягались с GTX 1080 Ti, в играх едва смогли конкурировать с GTX 1080. И это при 4 тысячах ALU, GCN 5 поколения, очень дорогой памяти HBM2 и теплопакете под 300 ватт. Производительность упёрлась в архитектуру, а Веги стали лебединой песней GCN.
  42.  
  43. Radeon VII (3840 ALU, 1750 МГц, 16 ГБ, 1024 ГБ/с, 300 Вт) - улучшенная Vega на 7 нм. Полные чипы идут на серверные Instinсt, а в потребительских 4 CU отключены. Доступно 16 ГБ видеопамяти с огромной пропускной способностью. Лучшая потребительская видеокарта для вычислений общего назначения. В играх конкурирует с RTX 2070 Super, а иногда и с 2080.
  44.  
  45. Vega 64 (4096 ALU, 1546 МГц, 8 ГБ, 483.8 ГБ/с, 295 Вт) - самая мощная видеокарта AMD на 14 нм. По числу потоковых процессоров это как две RX 570. При тепловыделении под 300 ватт отлично греет зимними вечерами. Конкурирует с GTX 1080.
  46.  
  47. Vega 56 (3584 ALU, 1471 МГц, 8 ГБ, 410 ГБ/с, 210 Вт) - порезанная Vega 64. Работают 56 из 64 CU, урезаны частоты и пропускная способность памяти, зато уменьшено энергопотребление. Уверенно тягается с GTX 1070 Ti.
  48.  
  49. Polaris (GCN 4 поколения, 12 нм и 14 нм)
  50. ========================================
  51.  
  52. Благодаря 14-нм техпроцессу четвёртое поколение GCN оказалось довольно холодным и энергоэффективным (например, 120 ватт у RX 470 vs 120 ватт у GTX 1060). AMD решила исправить этот досадный недостаток, разогнав видеокарты в линейке RX 500. Однако и после этого они с трудом конкурировали с GeForce 10xx. С новыми API производительность Полярисов улучшилась, поэтому они всё ещё популярны.
  53.  
  54. RX 590 (2304 ALU, 1545 МГц, 8 ГБ, 256 ГБ/с, 225 Вт) - самый мощный Polaris. Представляет собой разогнанную RX 580 на 12 нм (маркетинговое название улучшенного 14 нм техпроцесса). Несмотря на аппетиты во многих играх уступает GTX 1070.
  55.  
  56. RX 580 (2304 ALU, 1340 МГц, 4 или 8 ГБ, 256 ГБ/с, 185 Вт) - старший Polaris в двух версиях с 4 и 8 ГБ памяти. Раньше умудрялся уступать GTX 1066, но с приходом новых API уверенно её обходит. По сути разогнанный RX 480 с большим тепловыделением.
  57.  
  58. RX 570 (2048 ALU, 1244 МГц, 4 или 8 ГБ, 224 ГБ/с, 185 Вт) - порезанный старший Polaris. Отключили 4 CU, снизили частоты, пропускную способность памяти и потребление энергии. Раньше едва соперничала с GTX 1063, теперь в новых играх на уровне GTX 1066. По сути разогнанная RX 470 с большим тепловыделением.
  59.  
  60. RX 560 (1024 ALU, 1275 МГц, 2 или 4 ГБ, 112 ГБ/с, 60-80 Вт) - средний Polaris в двух версиях с 2 и 4 ГБ памяти. Раньше в играх еле конкурировал с GTX 1050, теперь дотягивается до GTX 1050 Ti. Чип бывает полный (1024 ALU и порезанный (896 ALU). По сути разогнанная RX 460 с разблокированным полным чипом.
  61.  
  62. RX 550 (512 ALU, 1183 МГц, 2 или 4 ГБ, 112 ГБ/с, 50 Вт) - самый младший чип всего лишь с 512 ALU - половинка RX 560, четверть RX 570 и, страшно сказать, одна восьмая Vega 64. Также есть в разных версиях, с 2 и 4 ГБ памяти и с полным чипом на 640 ALU. По производительности обходит GT 1030, но отстаёт от GTX 1050. Аналогов в линейке RX 400 нет.
  63.  
  64. GCN 1-3 поколений, 28 нм
  65. ========================
  66.  
  67. GCN пришёл на смену Terascale в далёком 2012 году. Архитектура стала более гибкой и универсальной, и хотя в играх GCN всё ещё хронически недогружался, в вычислениях общего назначения он проявил себя очень хорошо. До появления Pascal (GeForce 10xx) GCN успешно конкурировал с архитектурами Nvidia, а легендарная HD 7970 была самой быстрой видеокартой на рынке с рекордной для бренда Radeon ценой. Сегодня 28-нм GCN уже неактуальны, поскольку рынок б/у видеокарт завален 14-нм Полярисами.
  68.  
  69. Начиная с Polaris (GCN 4 поколения) AMD выпускала довольно ясные линейки видеокарт. Все Navi выполнены по одному техпроцессу и на одной архитектуре, это относится и к Polaris за исключением OEM-сегмента, о котором всё равно никто не помнит. Однако предыдущие линейки - это запредельная каша из разных архитектур и техпроцессов. Например, в линейке RX 200 мы находим чипы на трёх поколениях GCN и даже на втором поколении предыдущей архитектуры TeraScale! Мало того, линейки были очень раздуты, а первые видеокарты обозначались по старообрядческой системе. Поэтому мы не рассматриваем линейки целиком и рекомендуем оценивать каждую видеокарту отдельно, а не по её формальному названию.
  70.  
  71. HD 7970 (2048 ALU, 925 МГц, 3 ГБ, 264 ГБ/с, 230 Вт) - легендарная и несравненная аш ди семьдесяць девяць семьдесяць. Самая известная видеокарта из старых GCN и самая быстрая видеокарта на момент выхода. Подумать только, можно было купить видеокарту в 2012 году и пользоваться ей до сих пор, производительность на уровне GTX 1050 Ti вполне позволяет поиграть.
  72.  
  73. TeraScale (три поколения, 80-28 нм)
  74. ===================================
  75.  
  76. Первая архитектура потребительских видеокарт тогда ещё бренда ATI с унифицированной шейдерной моделью из далёкого 2007 года. В отличие от GCN и RDNA, TeraScale 1 и 2 поколений использовал VLIW5-инструкции (very long instruction word), то есть в одной длинной инструкции содержалось сразу пять команд для пяти потоковых процессоров. Из-за того, что потоковые процессоры собирались по пять в блоки, которые по 16 группировались в SIMD, число потоковых процессоров было кратно 80: 1600, 1440, 800 и так далее. У GCN и RDNA же число потоковых процессоров всегда кратно 64.
  77.  
  78. Проблема в том, что VLIW5-инструкции не удавалось целиком забить командами для рационального использования. В среднем было задействовано 3,4 процессора из 5, то есть 68%. В линейке HD 6900 реализовали третье поколение TeraScale с VLIW4 и 4 потоковыми процессорами в блоке, на этом развитие архитектуры было завершено в пользу более удачной и универсальной GCN.
  79.  
  80. При всех недостатках TeraScale позволяла разместить на чипе наибольшее число потоковых процессоров с высокой вычислительной мощностью (хотя и с трудом реализуемой). Линейка HD 5000 на TeraScale второго поколения была очень удачной, есть мнение, что RX 5000 назвали именно в честь неё.
  81.  
  82. Мемные видеокарты:
  83.  
  84. HD 5450 (80 ALU, 650 МГц, 512 или 1025 МБ, 12.8 ГБ/с, 19 Вт) - самая слабая в мире видеокарта с поддержкой Dx11. 64-битная шина с памятью GDDR3, пассивное охлаждение и всего лишь 2 SIMD-блока с 80 ALU.
  85.  
  86. HD 6990 (3072 ALU, 880 МГц, 4 ГБ, 160 ГБ/с, до 450 Вт) - двухчиповый монстр на последней версии TeraScale с VLIW4. Дикий жор, турбина и ценник в 700 баксов.
  87.  
  88. На данный момент TeraScale имеет разве что музейную ценность, её программная поддержка уже завершена. Если вы бомж с тягой к компьютерным играм, лучше купите какой-нибудь старый GCN 1-3 поколений за шапку сухарей.
RAW Paste Data