Видео карти. Видеокарти Заключения по синтетични тестове

Методика на тестване

Настройки на AMD Catalyst Control Center
Антиалиасинг Използвайте настройките на приложението
Анизотропно филтриране Използвайте настройките на приложението
Теселация Използвайте настройките на приложението
Catalyst A.I., качество на филтриране на текстури Качество, активиране на оптимизиране на формат на повърхността
Ниво на детайлност на Mipmap качество
Изчакайте V-Sync Изключено, освен ако приложението не посочи
Режим на антиалиасинг АА с множество проби
Настройки на Direct3D, активиране на Geomery Instancing На
Троен буфер Изкл
Настройки на контролния панел на NVIDIA
Оклузия на околната среда Изкл
Анизотропно филтриране Контролирано от приложението
Antialiasing - Гама корекция На
Antialiasing - Режим Контролирано от приложението
Antialiasing - Настройки Контролирано от приложението
Antialiasing - Прозрачност Изкл
CUDA - графични процесори всичко
Максимален брой предварително изобразени кадри 3
Мултидисплейно/смесено GPU ускорение Режим на производителност на множество дисплеи
Режим на управление на мощността Адаптивна
Филтриране на текстури — Оптимизиране на анизотропна проба Изкл
Филтриране на текстури - Отрицателно отклонение на LOD Позволява
Филтриране на текстури - Качество качество
Филтриране на текстури - Трилинейна оптимизация На
Нишкова оптимизация Автоматичен
Тройно буфериране Изкл
Вертикална синхронизация Използвайте настройките на 3D приложението
Набор от бенчмаркове
програма API Настройки Тестов режим разрешение
3DMark 2011 DirectX 11 Производителност, Екстремни профили

Unigine Heaven 2 DirectX 11 Макс. качество, DirectX 11, теселация в екстремен режим AF 16x, MSAA 4x 1920x1080 / 2560x1440
Crysis Warhead + Framebuffer Инструмент за сравнителен анализ на Crysis Warhead DirectX 10 Frost flythrough. Макс. настройки, DirectX 10. AF 16x, MSAA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Макс. настройки, DirectX 11, DOF, теселация, NVIDIA PhysX изключен. AF 16x, MSAA 4x 1920x1080 / 2560x1440
DiRT 3 + инструмент за сравнение на адреналинови състезания DirectX 11 Аспен, 8 коли. Макс. качество, DirectX 11 AF, AA 4x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Инструмент за сравнение на Crysis 2 DirectX 11 Централен парк. Макс. качество, DirectX 11, текстури с висока резолюция AF 16x, Post MSAA + Edge AA 1920x1080 / 2560x1440
Battlefield 3 + FRAPS DirectX 11 Начало на мисията Going Hunting. Макс. качество AF 16x, MSAA 4x 1920x1080 / 2560x1440
Batman: Arkham City. Вграден бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920x1080 / 2560x1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Град Уайтрън. Макс. качество AF 16x, MSAA 4x 1920x1080 / 2560x1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Мисия Връщане на подателя. Макс. качество AF, MSAA 4x 1920x1080 / 2560x1440

Следните видеокарти взеха участие в тестовете като конкуренти на Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

За да могат и двамата участници в днешната интрига Radeon HD 7970 GHz Edition и GeForce GTX 680 да работят в пълно въоръжение, при тестването бяха използвани най-новите бета версии на драйвери от NVIDIA (304.48 Beta) и AMD (Catalyst 12.7 Beta). Освен това за GTX 680 беше активиран режим PCI-E 3.0, който не се поддържа официално на платформата Intel X79.

⇡ Овърклок, температура, консумация на енергия

Тъй като PowerTune не се проявява в наблюдаваните тактови честоти, отправната точка за овърклок беше честотата на Boost Clock от 1050 MHz. С захранващото напрежение на GPU всичко не е толкова просто. Работата е там, че регулирането на напрежението в MSI Afterburner (възможно е същото да се случи и с други помощни програми, не сме опитвали) вече няма ефект върху наблюдаваното напрежение. За да го увеличите, трябва да опитате да го зададете по-високо постояненнапрежение, като използвате подходящата опция. Но, колкото и странно да изглежда, това не спира колебанията на напрежението; наблюдаваните стойности просто се изместват нагоре. По този начин не можем да фиксираме напрежението, но можем да изместим диапазона, в който то варира. В резултат на това, ако ръчно зададете напрежението на 1,3 V, обхватът на трептене ще бъде около 1,227 - 1,252 V.

Трябва да се отбележи, че в някои случаи, когато се играе с различни помощни програми за овърклок и мониторинг, напрежението все още беше фиксирано на 1,3 V, но след това, очевидно, Power Tune се побърка и силни артефакти се появиха на екрана в 3D, независимо от GPU честота. Изглежда, че няма смисъл да се опитвате да победите Power Tune, особено след като върши работата си достатъчно добре.

Ако приемем Boost Clock на новия адаптер като стандартна GPU честота в други Radeon (и от гледна точка на принципите на работа на Power Tune, това е така), HD 7970 GHz Edition се овърклокна дори по-добре от обикновения HD 7970: до 1240 MHz за процесора и 7320 (1830) MHz за паметта. Ако извадим диапазона на Power Tune Boost от 50 MHz от 1240 MHz, получаваме честотата, която достигат много копия на стандартния HD 7970. Очевидно по-дългата честотна таблица позволява на овърклокнатия GPU да достигне по-високи пикови стойности, като същевременно се върне обратно към предишен долен праг при тежки задачи. Не е факт обаче, че картата изобщо достига тези 1240 MHz, а не е постоянно дроселвана. Докато помощните програми за мониторинг нямат достъп до вътрешностите на Power Tune, това ще остане загадка.

Но фантастичният овърклок на паметта е просто заслугата на отличните контролери и чипове с памет на чипа Tahiti, очевидно малко по-добри от тези в стандартния HD 7970.

HD 7970 GHz Edition се нагрява малко повече от стандартната версия - приблизително същото като GeForce GTX 680. Охладителната система, включена на пълна скорост, ви позволява да поддържате същите температури по време на силен овърклок, както в нормален режим, но само с цената на колосален шум. Признаваме, че дори с автоматичен контрол на вентилатора, HD 7970 GHz Edition е забележимо по-силен от GeForce GTX 680.

Максималната записана консумация на енергия на картата, както се очакваше, все пак леко се увеличи в сравнение с тази на обикновената HD 7970. Не смятаме, че AMD лъже, когато твърди, че TDP и на двете версии на HD 7970 е еднакъв. Очевидно HD 7970 GHz Edition просто го овладява по-активно. Когато овърклокваме, знаем, че консумацията на енергия стреля през тавана. Едно мощно захранване не би навредило.

⇡ Radeon HD 7970 GHz Edition срещу GeForce GTX 680

Това са резултатите, заради които започна всичко. И така, успя ли AMD да си върне загубеното лидерство?

Неовърклокната GeForce GTX 680 все още дава по-добри резултати от HD 7970, но е по-бърза сред овърклокнати Radeon карти.

Игритестове+ Unigine Heaven

С резолюция от 1920x1080 в три от деветте теста за игри (Crysis Warhead, DiRT 3, Metro 2033), Radeon HD 7970 GHz Edition е напред. GeForce GTX 680 печели в останалите три (Unigine Heaven 2, Battlefield 3, Skyrim). В останалите игри няма съществени разлики между противниците. Перфектно равенство. В режим 2560x1440 ситуацията натежава в полза на HD 7970. Само в CoD 3 и Unigine Heaven GTX 680 запазва превъзходството си.

Овърклокването е по-добро за AMD картата, отколкото за GTX 680: увеличението на производителността е забележимо по-високо и в резултат на това HD 7970 GHz Edition си отмъщава дори при 1920x1080.

⇡ Radeon HD 7970 GHz Edition срещу всички

  • Жалко за AMD, но в 3DMark 2011 Radeon HD 7970 GHz Edition отстъпва не само на GeForce GTX 680, но и на GTX 670.
  • Осезаемо е предимството на GHz Edition пред стандартната версия.

Unigine Heaven 2

  • GHz Edition добави няколко FPS в сравнение с обикновения HD 7970.
  • В режим 2560x1440 GeForce GTX 670 и GTX 680 имат минимално предимство, но в 1920x1080 HD 7970 GHz Edition вече забележимо изостава.
  • Овърклокнатата GHz Edition побеждава Radeon HD 6990 и се сравнява с GTX 670 и GTZ 680.

Crysis Warhead (DirectX 10)

  • В този тест дори обикновената HD 7970 лесно бие GeForce GTX 680 поради по-високата честотна лента на паметта.
  • HD 7970 GHz Edition е дори малко по-лош от GeForce GTX 590, а овърклокната GHz Edition е наравно с Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Предимството на HD 7970 GHz Edition пред обикновената версия е малко.
  • HD 7970 GHz Edition е забележимо по-бърз от GeForce GTX 680.
  • При овърклок GHz Edition достига нивото на GeForce GTX 590 и Radeon HD 6990.

DiRT 3 (DirectX 11)

  • HD 7970 GHz Edition значително превъзхожда стандартната версия.
  • GHz Edition също е забележимо по-бърз от GTX 680, с производителност, сравнима с Radeon HD 6990 и GeForce GTX 590.

Crysis 2 (DirectX 11)

  • В режим 2560x1440 има забележимо увеличение на производителността в сравнение с обикновения HD 7970.
  • При 2560x1440 HD 7970 GHz Edition също изпреварва GeForce GTX 680, а овърклокната карта изостави GTX 590 и се изравни с Radeon HD 6990.
  • В режим 1920x1080 участниците в теста достигнаха ограничението от 100 FPS, зададено в Crysis 2.

Battlefield 3 (DirectX 11)

  • И отново, HD 7970 GHz Edition забележимо увеличи FPS в сравнение със стандартния HD 7970.
  • Новият продукт е наравно с GTX 670 и GTX 680.
  • Овърклокната HD 7970 GHz Edition е твърде трудна дори за GTX 590.

Batman: Arkham City (DirectX 11)

  • Магическата фраза GHz Edition отново дава на HD 7970 добро увеличение на FPS.
  • При 1920x1080 картата е наравно с GTX 680, а при 2560x1440 я превъзхожда.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Няма съществена разлика между HD 7970, HD 7970 GHz Edition и GeForce GTX 680 в тази игра: след определено ограничение двигателят на Skyrim вече не може да използва допълнителна изчислителна мощност.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • В сравнение със стандартната версия на HD 7970, GHz Edition има голямо увеличение на кадровата честота.
  • Въпреки това, единственият равностоен конкурент на новия продукт е GeForce GTX 670, а не GTX 680.

⇡ Изводи

За първи път след отдавнашните дни на Radeon X1950 XTX, настъпи моментът за AMD, когато видео карта от най-висок клас е поне толкова мощна, колкото флагмана на NVIDIA от същото поколение. HD 7970 GHz Edition като цяло е дори малко по-бърз от GeForce GTX 680 в тежки графични режими (като 2560x1440) - благодарение на 384-битовата шина на паметта. Освен това, след фабричен овърклок все още има значителен честотен резерв. Актуализираната технология Power Tune имаше благоприятен ефект върху потенциала за овърклок на графичния процесор и паметта започна да се овърклоква много по-добре. В бъдещите карти от NVIDIA и AMD вероятно ще видим бърз разцвет на технологиите за динамичен контрол на честотата и напрежението, както вече се случи с процесорите.

Всъщност дори в оригиналната версия HD 7970 е много мощна карта и повечето копия лесно достигат честоти, при които можете да настигнете и изпреварите GeForce GTX 680. GHz Edition е предимно моден продукт както за собственика, така и за производителят. AMD овърклокна HD 7970 точно толкова, колкото да постигне равенство с GTX 680, като същевременно остава в рамките на същия TDP. Нашите тестове за консумация на енергия ясно показват какво би се случило, ако разработчиците си бяха поставили за цел безусловна победа над флагмана на NVIDIA.

Уви, AMD вече загуби едно особено предимство пред картите на NVIDIA в High-End сегмента, на което се радваше през последните години - консумацията на енергия. Ако по-рано най-добрите Radeon не можеха да победят GeForce GTX 480 и GTX 580 по отношение на производителността, но консумираха и загряваха много по-малко, сега има равенство в бенчмарковете, но TDP на Radeon HD 7970 GHz Edition е колкото с цели 55 W по-висока от тази на GTX 680.

И още един въпрос. Съществуването на две физически идентични карти с различен софтуер в линията Radeon вече изглежда грозно. Какво плащат купувачите на HD 7970 GHz Edition, ако почти същото може да се постигне чрез лесно овърклокване на стандартния HD 7970 и защо собствениците на последния не са получили новия фърмуер? Тъй като BIOS на видеокартите не може да се актуализира толкова лесно, колкото драйверите, би било по-добре, ако HD 7970 GHz Edition напълно замени своя предшественик. Е, чисто от гледна точка на световната хармония.

Методика на тестване
Настройки на драйвера AMD Catalyst - по подразбиране
Антиалиасинг Настройки на приложението
Анизотропно филтриране Настройки на приложението
Теселация AMD оптимизиран
Катализатор A.I. Качество на текстурния филтър Качество, активиране на оптимизиране на формат на повърхността
Изчакайте V-Sync Деактивирайте, освен ако приложението не посочи
AA режим Мултипроба
Троен буфер Деактивиране
Настройки на драйвера на NVIDIA
CUDA графични процесори всичко
Анизотропно филтриране Управление на приложения
Вертикална синхронизация Използване на настройката за 3D приложение
Засенчване на фоновото осветление Изкл
Максимален брой предварително подготвени рамки 3
Оптимизация на потока Автоматичен
Режим на управление на мощността Адаптивна
Antialiasing - гама корекция Изкл
Antialiasing - режим Контрол на приложението
Тройно буфериране Изкл
Ускорете множество дисплеи Multi-Display Performance Mode
Филтриране на текстури - анизотропна оптимизация Изкл
Филтриране на текстури - качество качество
Филтриране на текстури - отрицателно LOD отклонение Позволява
Филтриране на текстури - трилинейна оптимизация На
програмаAPIНастройкиТестови режимиразрешение
3DMark Vantage DirectX 10 Профили за производителност, висок, екстремен
3DMark 11 DirectX 11 Производителност, Екстремни профили
Unigine Heaven 2 DirectX 11 Максимална детайлност, DirectX 11, Екстремна теселация Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
Crysis 2 + Adrenaline Инструмент за сравнение на Crysis 2 DirectX 11 Карта на центъра/Адреналин. Макс. детайл, текстури с висока разделителна способност, DirectX 11 Edge AA 1920x1080 / 2560x1440
Far Cry 2 + инструмент за сравнение на Far Cry 2 DirectX 10 Малка карта на ранчото. Макс. детайлизиране Без AA / AA 4x 1920x1080 / 2560x1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Максимална детайлност, DirectX 11, DOF, теселация, NVIDIA PhysX изключен. Аналитичен AA, AF 4x / MSAA 4x, AF 16x 1920x1080 / 2560x1440
Aliens срещу Predator + Alien vs Predator Benchmark Tool DirectX 11 Максимална детайлност, DirectX 11 Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
DiRT 3 DirectX 11 Максимална детайлност Без AA и AF / AA 4x, AF 16x 1920x1080 / 2560x1440
Мафия 2 DirectX 11 Максимална детайлност, NVIDIA PhysX изключен. Без AA, AF 1x / AA включен, AF 16x 1920x1080 / 2560x1440
Just Cause 2 DirectX 10 Максимална детайлност, филтърът за боке е изключен, подобрените детайли на водата са изключени. Без AA, AF 2x / AA 4x, AF 16x 1920x1080 / 2560x1440

Следните видеокарти взеха участие в тестовете като конкуренти на Radeon HD 7970:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Овърклок, температура, консумация на енергия

AMD обещаха, че процесорът HD 7970 лесно ще се овърклокне до 1 GHz и повече, което е лесно за вярване, тъй като 75 MHz с новата технология на процеса не е толкова голямо постижение. Но нашият тестов образец лесно увеличи 200 MHz (!) над стандартната честота на GPU, а паметта се овърклокна от 5500 на 6300 ефективни MHz и всичко това без увеличаване на напрежението. По-нататъшното овърклокване се натъкна на ограниченията на функцията Overdrive и не беше възможно да се преодолеят с помощта на добре познати трикове с ключове в регистъра и помощни програми за овърклок на трети страни. HD 7970 дори не ви позволява да четете BIOS с помощта на съществуващ софтуер, така че истинските рекорди тепърва предстоят.

Изглежда, че Radeon HD 7970 наистина не се различава от HD 6970 по отношение на TDP. Системната консумация на енергия при натоварване е абсолютно същата, а в 2D HD режим 6970 е още по-гладен за енергия. Овърклокът добави малко към консумацията на енергия, но резултатът все още е много по-малък от този на други конкуренти - „двуглавите“ HD 6990 и GeForce ускорители.

В допълнение, HD 7970 се оказа най-студената карта от всички участници в теста. Дори при максимален овърклок, той се нагрява по-малко от HD 6970. И тъй като консумацията на енергия на картите е една и съща, заслужава да се каже благодарение на новата система за охлаждане. Ефектът е особено изразен, ако намалите честотата на процесора HD 7970 до нивото на HD 6970.

Производителност, синтетични тестове

  • Radeon HD 7970 е далеч пред HD 6970 и GeForce GTX 580 във всички режими. Само "двуглавите" видео карти работят по-бързо.
  • Овърклокната HD 7970 е сравнима по производителност с GeForce GTX 590, въпреки че HD 6990 все още е напред. Последният като цяло е с изключително високи резултати, което още веднъж повдига въпроса за коректността на алгоритмите, с които 3DMark Vantage изчислява точки. Това не е първият път, когато срещаме необясними артефакти в този тест.

  • HD 7970 е пред всички конкуренти освен HD 6990, дори и без овърклок.
  • При овърклок разликата между HD 7970 и стария двучипов флагман опасно намалява.

Тестове за производителност, игри

Unigine Heaven 2

  • HD 7970 има огромно, почти двойно предимство пред HD 6970. Вижда се, че AMD са свършили страхотна работа с теселацията.
  • GeForce GTX 580 има сравнима производителност.
  • Благодарение на овърклок HD 7970 достига нивото на HD 6990, но изостава от GTX 590.

Crysis 2

  • Разликата между резултатите на HD 7970 и HD 6970 е почти двойна.
  • HD 7970 значително изпреварва GeForce GTX 580.
  • Без овърклок, HD 7970 е сравнима по производителност с HD 6990, а с овърклок може да настигне GeForce GTX 590.

Извънземни срещу Хищник

  • HD 7970 има предимство пред HD 6970 с около 25%.
  • GeForce GTX 580 в режими AA и AF изостава малко дори от Radeon HD 6970.
  • Видеокартите с два чипа са забележимо по-бързи от новия продукт и дори овърклокът не им позволява да ги наваксат.

  • HD 6970 се представя добре в този бенчмарк, поради което предимството на HD 7970 пред него е голямо, но не смазващо.
  • GeForce GTX 580 може лесно да се конкурира с HD 7970 при резолюция 1920x1080, но изостава при 2560x1440.
  • Графичните карти с двоен GPU са недостъпни за HD 7970 дори когато са овърклокнати.

Метро 2033

  • HD 7970 е поне една трета по-бърз от HD 6970.
  • GeForce GTX 580 все още показва високи резултати и не изостава много от новия продукт.
  • SLI и CrossFire работят перфектно, така че дори и с овърклок HD 7970 не може да ги изпревари, въпреки че се доближава до HD 6990.

Far Cry 2

  • HD 7970 е с 20-25% по-бърз от HD 6970.
  • HD 7970 е значително по-напред от GeForce GTX 580.
  • GTX 590 и HD 6990 са наравно с HD 7970, дори след овърклок.

VLIW4 срещу GCN

И накрая, ние проведохме Radeon HD 7970 през тестове за игри при еднакви честоти с Radeon HD 6970. Диаграмата ясно показва какво предимство предоставя новата GCN архитектура сама по себе си в сравнение с VLIW4.

заключения

AMD създаде чист лист от графични процесори, които са коренно различни от всичко, пуснато под марката Radeon през последните няколко години. По отношение на мащаба на промените събитието е сравнимо с въвеждането на унифицираната шейдърна архитектура VLIW5 в чипа R600 (Radeon HD 2900). Но ако си спомняте през какъв труден път трябваше да премине VLIW5, преди да бъдат разкрити присъщите му възможности, тогава става забележимо, че този път всичко е напълно различно.

Архитектурата на GCN, представена от чипа Tahiti, вече е зрял и изключително ефективен продукт. Radeon HD 7970 е с 20-50% по-бърз в сравнение с предишното поколение едночипов флагман на AMD и лесно се справя с основния си конкурент, GeForce GTX 580. Освен това, въпреки факта, че Tahiti е огромен GPU с безпрецедентна сложност, картата консумира не повече енергия от тази на HD 6970 и има висок таван за овърклок. А при овърклок производителността вече се доближава до нивото на двупроцесорните Radeon HD 6990 и GeForce GTX 590 адаптери.

Обърнете внимание, че позицията на архитектурата Fermi все още е силна в задачи, които активно използват възможностите на DirectX 11. В някои игри GTX 580 е само малко по-нисък от новия продукт на AMD, така че NVIDIA все още има всички шансове да си отмъсти следващия година. Ще бъде също толкова интересно да видим как AMD стъпка по стъпка доближава графичните процесори до процесорите с общо предназначение. CUDA на NVIDIA има голяма преднина през годините, но AMD сега има също толкова мощна графична архитектура, както и процесори Fusion, които рано или късно също ще имат интегрирани GCN ядра.

  • Част 2 - Практическо запознаване
  • Част 3 - Резултати от теста на играта (производителност)

В тази част, както обикновено, ще проучим самата видеокарта, а също така ще се запознаем с резултатите от синтетичните тестове.

Плащане

  • GPU: Radeon HD 7970 (Таити)
  • Интерфейс: PCI Express x16
  • Работна честота на GPU (ROP): 925 MHz (номинално 925 MHz)
  • Работна честота на паметта (физическа (ефективна)): 1375 (5500) MHz (номинална - 1375 (5500) MHz)
  • Ширина на шината на паметта: 384 бита
  • Брой изчислителни единици в работната честота на графичния процесор/блок: 32/925 MHz (номинална - 32/925 MHz)
  • Брой операции (ALU) в блок: 64
  • Общ брой операции (ALU): 2048
  • Брой текстуриращи единици: 128 (BLF/TLF/ANIS)
  • Брой единици за растеризация (ROP): 32
  • Размери: 285×100×33 mm (последната стойност е максималната дебелина на видеокартата)
  • PCB цвят:червен
  • Консумация на енергия (пиково 3D/2D/сън): 215/70/3 W
  • Изходни жакове: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Мултипроцесорна поддръжка: CrossFire X (хардуер)

AMD Radeon HD 7970 3072 MB 384-bit GDDR5 PCI-E

Картата разполага с 3072 MB GDDR5 SDRAM памет, разположена в 12 чипа на лицевата страна на PCB.

При липсата на нашите собствени синтетични DirectX 11 тестове, ние отново използвахме примери от SDK на Microsoft и AMD и демонстрационната програма на Nvidia. Първо, има HDRToneMappingCS11.exe и NBodyGravityCS11.exe от DirectX SDK (февруари 2010 г.).

Взехме и приложения от двата производителя: Nvidia и AMD. Примерите DetailTessellation11 и PNTriangles11 са взети от ATI Radeon SDK (те също са в DirectX SDK). Освен това е използвана демонстрационна програма от Nvidia - Realistic Water Terrain, известна още като Island11 (автор - Тимофей Чеблоков, известен специалист по 3D графики).

Проведени са синтетични тестове на следните видеокарти:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990със стандартни параметри (по-нататък HD 6990)
  • Radeon HD 6970със стандартни параметри (по-нататък HD 6970)
  • Radeon HD 5870със стандартни параметри (по-нататък HD 5870)
  • GeForce GTX 590със стандартни параметри (по-нататък GTX 590)
  • GeForce GTX 580със стандартни параметри (по-нататък GTX 580)

За да сравним резултатите на най-новата видеокарта Radeon HD 7970, тези конкретни модели бяха избрани по различни причини. Radeon HD 6970 беше взет като пряк предшественик на горния сегмент, HD 6990 беше взет като най-силното (макар и с два чипа) GPU решение от предишната архитектура, добавихме HD 5870, за да оценим увеличението между две различни актуализации на архитектурата и като GPU с точно половината от сложността на Tahiti.

Избраните решения на Nvidia са взети, защото Geforce GTX 580 е най-бързият едночипов модел на тази компания, базиран на последно поколение GPU. Въпреки че не е конкурент на представената видеокарта на AMD като цена, резултатите й са интересни, тъй като са максимални за текущите едночипови решения на Nvidia. А двучиповият GTX 590 е екстремният вариант на компанията с по-висока цена. В тестовете на DirectX 11 използвахме и Geforce GTX 560 Ti, която беше необходима, за да оценим повишената геометрична производителност на новия GPU на AMD.

Direct3D 9: Тестове за запълване на пиксели

Този тест определя пиковата производителност на вземане на проби от текстури (скорост на тексел) в режим FFP за различен брой текстури, приложени към един пиксел:

В нашия остарял тест за 32-битово филтриране на текстури от RightMark повечето видеокарти показват числа, които са далеч от теоретично възможните. Резултатите от синтетичните текстури в случая на видеокартата Radeon HD 7970 не достигнаха пиковата стойност, така че отново ще разгледаме скоростта на текстуриране въз основа на числата от теста 3DMark Vantage, който винаги дава по-реалистични числа.

Това, което открихме е, че HD 7970 избира само до 80 тексела на такт от 32-битови текстури по време на билинейно филтриране, което е значително по-ниско от теоретичната цифра от 128 филтрирани тексела. В противен случай всичко се оказа предвидимо - всички платки на AMD показаха по-висока производителност и изпревариха видеокартите на Nvidia. В края на краищата дори най-добрият едночипов GeForce GTX 580 има само 64 TMU и следователно е много по-нисък от модела, базиран на чипа Tahiti, който има 128 TMU, работещи на по-висока честота. Следователно разликата е повече от двойна. Е, двучиповият GTX 590 показва явно неадекватен резултат в този тест.

Версията на платката с две видеокарти на AMD също явно не работи коректно в нашия тест, защото HD 7970 почти винаги превъзхожда дори нея. Е, новият модел изпревари своя предшественик с около 30%, което е малко по-лошо от теоретично възможните стойности. Но в случаите с малък брой текстури, когато честотната лента на паметта оказва най-голямо влияние, резултатът е още по-нисък – около 25%.

Нека да разгледаме същите резултати в теста за скорост на запълване:

Числата показват скоростта на запълване и в тях виждаме всичко същото, освен може би като вземем предвид броя на пикселите, записани в буфера на кадрите. Максималният резултат почти винаги отива при новата видеокарта от най-висок клас от семейството Radeon HD 7900. Тя има рекорден брой TMU, работещи на по-висока честота и по-ефективна в нашия синтетичен тест. Нека да преминем към текстовете на простите пикселни шейдъри.

Direct3D 9: Тестове на Pixel Shaders

Първата група пикселни шейдъри, които разглеждаме, е много проста за съвременни видео чипове, включва различни версии на пикселни програми с относително ниска сложност: 1.1, 1.4 и 2.0, открити в по-старите игри.

Тези тестове са твърде прости за съвременните графични процесори и са ограничени най-вече от производителността на текстурите и понякога скоростта на запълване. Следователно те не показват всички възможности на съвременните видео чипове, но са интересни от гледна точка на остарелите приложения за игри. В двата най-прости теста новият Radeon HD 7970 почти настигна дори двучиповия HD 6990, но в по-сложните тестове зае позиция между HD 6990 и HD 6970. Интересно е как поведението на тестовете върху GPU на различните архитектури се различава. И тук Tahiti е малко по-близо до GF110, отколкото до своя предшественик. Естествено, не в абсолютни числа, разликата в тях е доста голяма - от един и половина до два пъти.

Производителността в други тестове е ограничена най-вече от скоростта на текстурните единици и скоростта на запълване, така че новата Radeon HD 7970 е по-бърза от предишната HD 6970 с около 30-40%, което е в съответствие с теорията. Всички платки на AMD са пред двата топ модела GeForce, с изключение на това, че при сравняване на HD 5870 и GTX 590 всичко не е толкова ясно. Липсата на скорост на текстуриране очевидно е виновна за неуспехите на Nvidia в тези тестове. Но дори шейдърът за пикселно осветление с три източника според Phong, който е по-зависим от математическата производителност на графичния процесор, когато се изпълнява на GF110, е много по-нисък от Cayman и още повече от Tahiti.

Нека да разгледаме резултатите от по-сложни междинни пикселни програми:

Този път се случи същото, HD 7970 се намира приблизително между едночиповите и двучиповите модели на Cayman от серията HD 6900, което изисква повече изчисления и разликата в него е приблизително същата до разликата в броя на ALU и тяхната честота. Следователно този тест е по-подходящ за архитектурата на AMD, чиито чипове имат по-голям брой математически единици и Tahiti не е изключение.

Интересно е, че HD 5870 превъзхожда HD 6970 в този тест и изглежда това се дължи на по-лошата ефективност на изпълнение на този шейдър на по-новия чип с VLIW4 архитектура. Така че, въпреки че новата Radeon HD 7970 победи HD 6970, тя беше само 20% по-бърза от HD 5870 в този тест.

Вторият, по-зависим от скоростта на текстуриране, тест за процедурна визуализация на водата „Вода“ използва зависима извадка от текстури с големи нива на влагане, а видеокартите в него се класират по скорост на текстуриране, коригирана за различна ефективност на използване на TMU. В този тест решенията на AMD винаги се справят страхотно и HD 7970 осигурява много добър резултат, макар и по-лош от двучиповия HD 6990, но много по-добър от своя предшественик на Cayman. Топ едночиповата платка на Nvidia изостана с повече от 2,5 пъти!

Direct3D 9: пикселен шейдър тества Pixel Shaders 2.0

Тези тестове за пикселни шейдъри DirectX 9 са по-сложни от предишните, те са близки до това, което сега виждаме в мултиплатформените игри, и са разделени в две категории. Нека започнем с по-простата версия 2.0 шейдъри:

  • Картографиране на паралакса- метод за картографиране на текстури, познат на повечето съвременни игри, описан подробно в статията.
  • Замръзнало стъкло- сложна процедурна текстура от замръзнало стъкло с контролируеми параметри.

Има два варианта на тези шейдъри: тези с фокус върху математическите изчисления и тези с предпочитание за вземане на проби от текстури. Нека разгледаме математически интензивни опции, които са по-обещаващи от гледна точка на бъдещи приложения:

Това са универсални тестове, които зависят както от скоростта на ALU единиците, така и от скоростта на текстуриране; в тях е важен общият баланс на чипа, както и ефективността на изпълнение на сложни програми. А представянето на новата видеокарта на AMD в теста „Frozen Glass“ се оказа не просто добро, а отлично! Ето какво означава повишената ефективност на новия GPU. В първия тест Radeon HD 7970 се оказа забележимо по-бърз дори от двучиповия HD 6990. И дори двучиповата платка на Nvidia остана далеч назад, да не говорим за Geforce GTX 580.

Във втория тест “Parallax Mapping” решенията на Nvidia се чувстват малко по-добре и GTX 580 е почти пред HD 6970. Но представеният днес HD 7970 е много далеч - новият продукт на AMD е с 80% пред най-добрия Платка на Nvidia, която ясно показва влиянието и математическите изчисления и скоростта на текстуриране. Интересното е, че много старата HD 5870 отново е по-бърза от HD 6970. А новата HD 7970 е с 60% по-бърза от своя предшественик, което очевидно не може да бъде оправдано със сухи теоретични цифри. Това се отразява в значително по-голямата ефективност на скаларната архитектура в сравнение с VLIW.

При видеокартите на AMD обаче всичко е много сложно заради PowerTune. В края на краищата синтетичните тестове силно натоварват графичния процесор с изчисления и консумацията на енергия на платките с поддръжка на PowerTune в синтетика може доста да надвиши зададения лимит. Следователно, тактовата честота на GPU също може да намалее и заедно с това резултатите ще бъдат по-ниски от очакваните. Нека разгледаме същите тези тестове в модификация с предпочитание към проби от текстури пред математически изчисления:

И за двете видеокарти на Nvidia ситуацията стана още по-тъжна, тъй като всички съвременни чипове на AMD имат много по-добри скорости на текстуриране и в тези тестове те само увеличават неоспоримото си предимство. Дори двучиповият GTX 590 не може да се конкурира с едночиповия HD 6970 и в двата теста, фокусирани върху текстурирането, да не говорим за GTX 580. Е, представената днес платка от семейството Radeon HD 7900 се оказа най-бързата сред единичните -чип карти, на второ място след HD 6990. Разликата между HD 7970 и HD 6970 се оказа равна на 26-28%, което е добре обяснено теоретично, тъй като разликата в скоростта на текстуриране за новия продукт е малко по-голяма .

Но това бяха наследени задачи, фокусирани най-вече върху текстурирането и понякога скоростта на запълване. След това ще разгледаме резултатите от още два теста за пикселни шейдъри - но този път версия 3.0, най-сложният от нашите тестове за пикселни шейдъри за Direct3D 9 API. Те са най-показателни от гледна точка на съвременните компютърни игри, много от които са мултиплатформени. Тестовете се различават по това, че натоварват силно ALU и текстурните модули, и двете шейдърни програми са сложни и дълги и включват голям брой разклонения:

  • Картографиране на стръмен паралакс- много по-„тежък“ тип техника за картографиране на паралакс, също описана в статията Съвременна терминология на 3D графиката.
  • кожа— процедурен шейдър, който изобразява козината.

В най-трудните DX9 тестове от RightMark видеокартите на Nvidia винаги се представят много силно, за разлика от всички предишни тестове в нашия преглед. Тези тестове не са ограничени от производителността на извличане на текстура, а по-скоро зависят от ефективността на изпълнение на кода на шейдъра. Преди това Radeon HD 6970 ясно подобри позицията на AMD в този тест, повишавайки ефективността при преминаване от VLIW5 към VLIW4 архитектура.

Е, днес видяхме още един скок в производителността на решенията на компанията, Radeon HD 7970 ги издигна до недостижимо ниво - новата едночипова видеокарта дори надмина двучиповата HD 6990 и в двата теста! Тези проблеми са отличен пример за подобряване на производителността в реалния свят за сложни изчисления при преминаване от VLIW към скаларно изпълнение.

И така, при тестове на сложни пикселни шейдъри версия 3.0, новата видеокарта на AMD от най-висок клас успя не само да настигне своите конкуренти, но и да изпревари със значителна разлика, което не е било така от много дълго време време. Скоростта и в двата теста на PS 3.0 е леко зависима от честотната лента на паметта и текстурирането, но кодът е сложен, с който както архитектурата на Nvidia, така и най-новата скаларна архитектура на AMD се справят много добре. Тези тестове са сред първите, при които отбелязваме ясно подобрение на ефективността и най-голямата положителна разлика между предишните и най-новите архитектури на AMD по отношение на скоростта.

Но нека посочим числата, за да не бъдем голословни. Представената нова Radeon HD 7970 е повече от два пъти по-бърза от предшественика си и с 60-70% по-бърза от GeForce GTX 580, за която доскоро не смеехме дори да си помислим. В крайна сметка решенията на Nvidia винаги са били безспорни лидери в тази двойка тестови задачи, но видеокартите на Cayman успяха да се доближат до тях и най-бързият от Tahiti най-накрая изпревари своя конкурент.

Direct3D 10: PS 4.0 тестове за пикселни шейдъри (текстуриране, цикли)

Втората версия на RightMark3D включваше два познати PS 3.0 теста за Direct3D 9, които бяха пренаписани за DirectX 10, както и още два нови теста. Първата двойка добави възможност за активиране на самозасенчване и суперсемплиране на шейдъри, което допълнително увеличава натоварването на видеочиповете.

Тези тестове измерват производителността на пикселни шейдъри, работещи в цикли с голям брой проби от текстури (в най-тежкия режим, до няколкостотин проби на пиксел) и сравнително малко ALU натоварване. С други думи, те измерват скоростта на текстурните проби и ефективността на разклоненията в пикселния шейдър.

Първият тест на пикселните шейдъри ще бъде Fur. При най-ниските настройки той използва 15 до 30 текстурни проби от картата на височината и две проби от основната текстура. Режимът на детайлност на ефекта - "High" увеличава броя на пробите до 40-80, включването на "shader" supersampling - до 60-120 проби, а режимът "High" заедно със SSAA се характеризира с максимална "тежест" - от 160 до 320 проби от височинната карта.

Нека първо проверим режимите без активирано суперсемплиране; те са сравнително прости и съотношението на резултатите в режимите „Нисък“ и „Висок“ трябва да бъде приблизително еднакво.

Изпълнението в този тест зависи от броя и ефективността на TMU и от ефективността на изпълнение на сложни програми. При опцията без суперсемплиране, ефективната скорост на запълване (производителност на ROP) и честотната лента на паметта имат допълнително влияние върху производителността. Резултатите на ниво на детайлност „Високо“ са приблизително един и половина пъти по-ниски, отколкото на ниво „Ниско“, както трябва да бъде според теорията, но за най-бързите решения разликата е малко по-малка.

Преди това решенията на Nvidia бяха забележимо по-силни в тестовете за процедурно рендиране на кожа с голям брой проби от текстури, но започвайки с предишното поколение на AMD, разликата започна да намалява. Какво се случи с Radeon HD 7970? Отличен резултат - новият продукт на AMD отново беше по-бърз от двучиповата платка от предишното поколение, а едночиповият HD 6970 беше два пъти по-бавен, което ясно показва повишаване на ефективността на новата архитектура на Южните острови. И решенията на Nvidia са изостанали, дори двучиповият GTX 590 е по-нисък от най-добрия модел Radeon HD 7970, представен днес.

Нека да разгледаме резултата от същия тест, но с активирана свръхизвадка на шейдъра, което увеличава работата четири пъти: може би в тази ситуация нещо ще се промени и честотната лента на паметта със скорост на запълване ще има по-малък ефект:

Активирането на суперсемплиране увеличава теоретичното натоварване четири пъти, а резултатите на решенията на Nvidia винаги падат в сравнение с производителността на видеокартите на AMD. Сега разликата в ефективността на изпълнение на тази задача е още по-очевидна, а новият модел HD 7970 е 2,5 пъти по-бърз от HD 6970! GeForce GTX 580 загуби горе-долу същата сума от новия продукт Съвсем естествено е, че дори HD 6990 остана далеч назад и новата платка затвърди лидерството си, но какво...

Вторият тест за шейдъри DX10 измерва производителността на сложни пикселни шейдъри с цикли с голям брой проби от текстури и се нарича Steep Parallax Mapping. При ниски настройки той използва 10 до 50 проби на текстури от картата на височината и три проби от основните текстури. Активирането на тежък режим със самозасенчване удвоява броя на пробите, а суперсемплирането учетворява този брой. Най-сложният тестов режим със суперсемплиране и самозасенчване избира от 80 до 400 текстурни стойности, тоест осем пъти повече от простия режим. Нека първо проверим простите опции без суперизвадка:

Вторият тест за пикселен шейдър Direct3D 10 е малко по-интересен от практическа гледна точка, тъй като разновидностите на картографиране на паралакс се използват широко в игрите, а тежките опции, като нашето стръмно картографиране на паралакс, се използват в много проекти, например в игри от сериите Crysis и Lost Planet. Освен това, в нашия тест, в допълнение към суперсемплирането, можете да активирате самозасенчване, което приблизително удвоява натоварването на видеочипа, този режим се нарича „High“.

Тази диаграма е подобна на предишната без активиран SSAA, но позицията на Nvidia е отслабнала още малко и Radeon HD 6990 почти е настигнал представения днес модел. В обновената D3D10 версия на теста без суперсемплиране, HD 7970 показва отличен резултат, значително изпреварвайки HD 6970 и GTX 580 и дори GTX 590. Лидерството се споделя от HD 7970 и HD 6990 и две стари AMD видеокартите показват подобни резултати и силно (два и повече пъти по-бавни от новия модел) изостават. Нека да видим каква ще бъде разликата при разрешаване на суперсемплиране; това може да причини значителен спад в скоростта на платките на Nvidia.

Когато суперсемплирането и самозасенчването са активирани, задачата става още по-трудна, активирането на двете опции заедно увеличава натоварването на картите почти осем пъти, което води до голям спад в производителността. Разликата между скоростните показатели на тестваните видеокарти се промени, включването на суперсемплиране оказва влияние, както в предишния случай - картите на AMD подобриха производителността си в сравнение с решенията на Nvidia.

И сега Radeon HD 7970 отново става едноличен лидер в сравнението, показвайки резултати, по-високи от тези на HD 6990. По-старите едночипови платки на компанията са далеч назад, заедно с GeForce GTX 580. И само по-скъпите двучипови платки опциите за чипове от AMD и Nvidia са способни по някакъв начин да се доближат до нова видеокарта. Като цяло, на базата на два шейдър теста D3D10, можем да заключим, че новата архитектура на AMD и нейният представител на чипа Tahiti се справят отлично с шейдърните задачи, дори по-добре от традиционно силните си конкуренти от Nvidia.

Direct3D 10: PS 4.0 Pixel Shader тестове (Compute)

Следващите няколко теста на пикселен шейдър съдържат минимален брой извличания на текстури, за да се намали въздействието върху производителността на TMU единиците. Те използват голям брой аритметични операции и измерват прецизно математическата производителност на видеочиповете, скоростта на изпълнение на аритметични инструкции в пикселен шейдър.

Първият тест по математика е Минерал. Това е сложен процедурен тест за текстуриране, който използва само две проби от текстурни данни и 65 sin и cos инструкции.

Резултатите от екстремните математически тестове обикновено съответстват на разликата в честотите и броя на изпълнителните единици, но с известно влияние на различната ефективност на тяхното използване. Всички най-нови архитектури на AMD имат огромно предимство пред конкурентните графични карти на Nvidia в такива случаи и това обяснява резултатите от тестовете, при които решенията на AMD отново се оказват значително по-производителни.

Решенията варираха приблизително според теорията, но с някои изключения. На практика се появиха някои нюанси, свързани с различната ефективност. Теоретично GeForce GTX 580 трябва да е повече от два пъти (2,4 пъти) по-бавна от новия модел Radeon HD 7970, но на практика разликата е само 80%, което е значително по-малко. И когато се сравнява с HD 6970, възникват въпроси относно оптимизирането на новата архитектура и драйверите за нея за този тест. С теоретично превъзходство в изчисленията от 40%, новата платка на AMD е само с 28% по-бърза от предишната HD 6970, а разстоянието между нея и много старата HD 5870, базирана на архитектурата VLIW5, е още по-малко. Или тестът наистина е по-подходящ за VLIW (особено за VLIW5), или необработените драйвери са виновни.

Има и друго обяснение - може би резултатите от платките HD 7970 HD 6970 в този тест са повлияни от технологията PowerTune, която намалява честотите при достигане на лимита на консумация на енергия. Всичко това обаче се променя малко в сравнение с неговия конкурент, защото дори скъпият двучипов Geforce GTX 590 достигна само нивото на HD 6970 и HD 5870. А едночиповият GTX 580 все още е далеч назад.

Нека разгледаме втория тест за изчисление на шейдъра, който се нарича Fire. Той е по-тежък за ALU и има само едно извличане на текстура, а броят на инструкциите sin и cos е удвоен до 130. Нека да видим какво се е променило с увеличаване на натоварването:

Виждаме почти идентична диаграма с предишната, с изключение на абсолютните числа. Този път всички графични процесори останаха на приблизително същите позиции, с изключение на това, че видеокартите, базирани на Cayman и Cypress, размениха местата си - сега по-новият модел е малко по-бърз, но не много. Въпреки че все още няма стриктно съответствие с теоретичните цифри за пикова производителност, техните резултати все още са близки до сухата теория. Разликата между HD 7990 и HD 6970 се е увеличила леко.

Иначе не открихме нищо ново в графиката. Скоростта на изобразяване в този тест е ограничена единствено от производителността на шейдърните модули и тяхната ефективност, така че двойният GPU HD 6990 отново стана ясен лидер, следван плътно от днешния нов продукт на AMD. И двете платки GeForce са по-ниски дори от остарелия модел от семейството Radeon HD 5800, но този път предимството на решенията на AMD остава малко по-малко, отколкото при сравняване на теоретичните цифри, което отново показва по-лоша оптимизация или влиянието на PowerTune.

Direct3D 10: тестове за геометричен шейдър

Пакетът RightMark3D 2.0 има два теста за скорост на геометричен шейдър, първата опция се нарича „Galaxy“, техника, подобна на „точковите спрайтове“ от предишните версии на Direct3D. Той анимира система от частици на GPU, геометричен шейдър от всяка точка създава четири върха, които образуват частица. Подобни алгоритми трябва да се използват широко в бъдещите DirectX 10 игри.

Промяната на балансирането в тестовете на геометричния шейдър не влияе на крайния резултат от рендиране, крайното изображение винаги е абсолютно същото, променят се само методите за обработка на сцената. Параметърът "GS load" определя в кой шейдър се извършват изчисленията - връх или геометрия. Броят на изчисленията е винаги един и същ.

Нека да разгледаме първата версия на теста Galaxy, с изчисления във вертексния шейдър, за три нива на геометрична сложност:

Съотношението на скоростите за различна геометрична сложност на сцените е приблизително еднакво за всички решения, производителността съответства на броя точки, с всяка стъпка FPS пада около два пъти. Задачата за съвременните видеокарти не е твърде трудна и производителността е ограничена главно от скоростта на обработка на геометрията, но също и от честотната лента на паметта/честотата на запълване (в рамките на решения от един производител).

Този тест трябваше да покаже подобрените възможности за обработка на геометрията на Южните острови и това се случи. Новата видеокарта на AMD всъщност извършва геометрични изчисления много по-бързо в сравнение с всички предишни решения на компанията. Въпреки че AMD даде цифри за растеж до 4 пъти, в този тест геометричната производителност се увеличи с приблизително 1,5-2 пъти. В резултат на това едночиповата видеокарта се оказа приблизително на същото ниво като двучиповия модел Radeon HD 6990 на GPU от предишното поколение.

Такова значително подобрение доведе до факта, че Tahiti почти настигна видеокартата от най-висок клас на Nvidia, въпреки че внедряването на геометрични шейдъри в тази карта трябва да бъде дори по-ефективно при някои условия. Преди това видеокартите на Nvidia работеха приблизително два пъти по-бързо от подобни конкурентни видеокарти, но сега няма никаква разлика. Нека видим как се променя ситуацията, когато прехвърлим част от изчисленията към геометричния шейдър:

При промяна на натоварването в този тест числата останаха почти непроменени за решенията на Nvidia и повечето платки на AMD. Само новата видеокарта от семейството HD 7900 в този тест реагира слабо на промените в параметъра за натоварване GS, който отговаря за прехвърлянето на част от изчисленията към геометричния шейдър. Следователно дъската показа резултат малко по-висок от този в предишната диаграма. Нека да видим какво се променя в следващия тест, който включва голямо натоварване на геометричните шейдъри.

„Hyperlight“ е вторият тест на геометрични шейдъри, демонстриращ използването на няколко техники наведнъж: инстанциране, поточно извеждане, натоварване на буфера. Той използва създаване на динамична геометрия с помощта на двойно буферно изобразяване, както и нова функция на Direct3D 10 - поточен изход. Първият шейдър генерира посоката на лъчите, скоростта и посоката на растежа им, тези данни се поставят в буфер, който се използва от втория шейдър за рисуване. За всяка точка от лъча се изграждат 14 върха в кръг, общо до един милион изходни точки.

Нов тип програми за шейдъри се използват за генериране на „лъчи“, а с параметъра „GS load“, зададен на „Heavy“, също и за рисуването им. Тоест, в режим „Балансиран“ геометричните шейдъри се използват само за създаване и „отглеждане“ на лъчи, изходът се извършва чрез „инстанциране“, а в режим „Тежък“ геометричният шейдър също участва в изхода. Първо разглеждаме лесния режим:

Относителните резултати в различните режими отново приблизително съответстват на промяната в натоварването: във всички случаи производителността се мащабира добре и е близка до теоретичните параметри, според които всяко следващо ниво на „Брой полигони“ трябва да бъде по-малко от два пъти по-бавно.

В този тест скоростта на рендиране трябва да бъде ограничена от геометричната производителност, а новата архитектура от AMD се представя отлично, дори малко по-напред от своя конкурент Geforce GTX 580! И двете дъски с двоен чип показаха неправилни резултати тук, така че сравненията с тях няма да работят. Но HD 7970 е с 40-50% по-бърз от своя предшественик, моделът HD 6970, което ясно се обяснява с архитектурни промени в GPU. Отличните резултати на картата на Tahiti ясно показват оптимизациите, извършени в модулите за обработка на геометрични данни в новия чип.

Цифрите трябва да се променят много в следващата графика, при тест с по-активно използване на геометрични шейдъри. Също така ще бъде интересно да се сравнят резултатите, получени в режимите „Балансиран“ и „Тежък“ един с друг.

Но тук Radeon HD 7970 не постигна рекорд, въпреки това разликата между чиповете на AMD с традиционен графичен конвейер (включително Cayman и Tahiti с два растеризатора) и чиповете с архитектура Fermi, която има паралелна обработка на геометрията, е ясно забележима. А резултатите на Geforce GTX 580, която е базирана на чипа GF110, са толкова добри, че превъзхождат най-добрите решения на AMD (а това е обявеният днес модел) с 35-40%.

Въпреки че възможностите на новия топ чип на AMD за обработка на геометрия и скоростта на изпълнение на геометричните шейдъри са се увеличили значително в сравнение с предишните видеокарти на компанията, а първото решение на чипа Tahiti показва резултати в тези тестове, които са с 22-28% по-високи отколкото решения, базирани на Cayman. Вероятно инженерите на AMD са решили, че подобна оптимизация на блоковете за обработка на триъгълник и геометрия ще бъде напълно достатъчна.

Direct3D 10: скорост на извличане на текстура от вертекс шейдъри

Тестовете за извличане на текстура на Vertex измерват скоростта на голям брой извличания на текстури от върховия шейдър. Тестовете са по същество сходни, така че съотношението между резултатите на картите в тестовете Земя и вълни трябва да бъде приблизително еднакво. И двата теста използват картографиране на изместване, базирано на данни за примерни текстури, единствената съществена разлика е, че тестът „Вълни“ използва условни разклонения, докато тестът „Земя“ не.

Нека да разгледаме първия тест "Земя", първо в режим "Нисък детайл на ефекта":

Предишни проучвания показват, че резултатите от този тест се влияят от много неща: скорост на текстуриране и честотна лента на паметта. И резултатите от видеокартите често са ограничени от някаква бариера - просто погледнете сравнението на двучиповия GTX 590 и едночиповия аналог - почти няма разлика между тях. Въпреки че HD 6990 е два пъти по-бърз от HD 6970.

И новата платка на AMD от семейството Radeon HD 7970 показа много добри резултати, почти настигайки водещия HD 6990. Що се отнася до конкурентите с един чип, тя е най-добрата и в трите режима. Предимството пред HD 6970 варира от 25% до 75% в зависимост от режима. Нека да разгледаме производителността в същия тест с увеличен брой проби от текстури:

Но този път относителната позиция на картите на диаграмата се промени значително и това важи особено за твърдия режим. С малък брой полигони, скоростта на изобразяване в този тест е ограничена от честотната лента на паметта, поради което платките на AMD бяха толкова силни в предишната диаграма.

Но в тежките режими разликата между едночиповата карта на Nvidia и новия продукт на AMD е стеснена и те се конкурират помежду си в доста близка битка. По-старата двучипова видеокарта от фамилията Radeon HD 6900 превъзхожда всички останали решения и е най-добрата в сравнение, въпреки че в тежък режим GeForce GTX 590 е близо до нея. Новата едночипова HD 7970 отново превъзхожда предшественика си до 70%, което може да показва силно влияние на честотната лента на паметта.

Нека да разгледаме резултатите от втория тест за извличане на текстури от вертексни шейдъри. Тестът Waves има по-малък брой проби, но използва условни скокове. Броят на образците на билинейна текстура в този случай е до 14 („Нисък детайл на ефекта“) или до 24 („Висок детайл на ефекта“) на връх. Сложността на геометрията се променя по същия начин като предишния тест.

Резултатите във втория тест за текстуриране на върхове "Waves" са напълно различни от това, което видяхме в предишните графики. В този тест видеокартите на AMD и Nvidia, с изключение на HD 6990 и HD 7970, показват много близки резултати, което отново може да се дължи на ограничението на честотната лента на видеопаметта, тъй като този показател е близък за всички представени видеокарти.

Но новият модел от семейството на Южните острови успя да се открои в трудни условия за сравнение, почти настигайки двучиповия HD 6990, който стана най-добрият сред всички видеокарти. Разликата между картите, базирани на GPU Cayman и Tahiti, отново беше 25-70% в полза на по-новото решение. Нека разгледаме втората версия на същия тест:

И тогава настъпиха промени, подобни на това, което видяхме по-рано - видеокартите на Nvidia „провиснаха“ само в лесен режим, а повечето решения на AMD - във всички режими наведнъж. Това обаче не позволи на платките на калифорнийската компания да наваксат новия продукт от семейството Radeon 7900, който, между другото, изпревари всички в средни и тежки режими, губейки от двучиповия HD 6990 само веднъж.

В режим с малък брой полигони разликата между решенията не е толкова голяма, но в среден и тежък режим старите решения на AMD са по-ниски, след това има платки на Nvidia (двучиповата е само малко по-бърза от едночипов GTX 580), HD 6990 и HD 7970. Платката от семейството HD 7900 обяви днес в тестове за вземане на проби от върхове, че се представи отлично, превъзхождайки конкурентните видео карти на Nvidia и предшествениците от същия производител с разлика.

3DMark Vantage: Тестове на функции

Както винаги, синтетичните бенчмаркове от 3DMark Vantage могат да ни покажат нещо, което преди сме пропуснали. Тестовете за функции на този тестов пакет поддържат DirectX 10 и са интересни с това, че се различават от нашите. Когато анализираме резултатите от новата видеокарта Radeon HD 7970 в този пакет, ще можем да направим някои нови и полезни изводи, които ни убягнаха в семейството от тестове RightMark.

Тест за функция 1: Запълване на текстура

Първият тест е тест за скорост на извличане на текстура. Това включва запълване на правоъгълник със стойности, прочетени от малка текстура, използвайки множество текстурни координати, които променят всеки кадър.

Въпреки че тестът на Futuremark все още не показва теоретично възможното ниво на скорост на извличане на текстури, ефективността на видеокартите на AMD и Nvidia в него все още е забележимо по-висока от нашата от RightMark. Следователно в този тест за текстура получаваме малко по-различно съотношение на резултатите, което е по-близо до истината.

Първата видеокарта от новото семейство на AMD показва резултати, близки до съответния теоретичен параметър, и върши работата по-ефективно от предишното поколение. Radeon HD 7970 е с повече от 50% пред HD 6970, въпреки че според теорията разликата е само 40%. Най-вероятно текстурните модули на Tahiti се използват по-ефективно поради подобренията в паметта и системата за кеширане, което доведе до повишен резултат.

Разбира се, новият едночипов модел не достигна лидера - двучиповия HD 6990, но това не се очакваше. И все пак ясно се вижда, че производителността на текстурите на графичния чип Tahiti се е увеличила значително в сравнение с Cayman. Е, GTX 580 отстъпва на новия продукт по отношение на скоростта на текстуриране с цели 2,3 пъти. Дори двучипова карта на Nvidia може да съвпадне само с HD 6970.

Тест за функции 2: Цветно запълване

Това е тест за степен на запълване. Използва се много прост пикселен шейдър, който не ограничава производителността. Интерполираната цветова стойност се записва в буфер извън екрана (цел за изобразяване), като се използва алфа смесване. Използва се 16-битов буфер извън екрана на формат FP16, който най-често се използва в игри, които използват HDR рендиране, така че този тест е доста навременен.

Ситуацията в теста за производителност на ROP единица е доста различна от теста за текстуриране. Числата за този подтест от 3DMark Vantage показват производителността на ROP единиците, но с влиянието на размера на честотната лента на видео паметта (така наречената „ефективна скорост на запълване“). И тук новият модел HD 7970 показва отличен резултат, като изостава само от двете топ видеокарти на AMD и Nvidia от предишни поколения, които имат по две видеокарти на борда.

Какво ще кажете за ROP ефективността, с която AMD се похвали? Всъщност само 32 ROP единици в новия чип Tahiti изобщо не ограничават скоростта на изобразяване, дори при специализиран тест. И отбелязваме малко по-висока ефективност на ROP единиците и по-висок процент на запълване в новата видеокарта на AMD в сравнение с по-старите модели. Разликата между HD 7970 и HD 6970 е повече от 50%, което ясно показва по-голямо влияние на честотната лента на паметта, отколкото на чистата производителност на ROP устройствата.

Що се отнася до сравнението с Nvidia, тук също разликата в скоростта (35%) съответства на теоретичната разлика в честотната лента (36%), а не на чистата скорост на ROP блоковете. Оказва се, че 32-те такива единици в Cayman са били просто излишни и техните възможности никога не са били използвани напълно.

Тест за функции 3: Картографиране на оклузията на паралакса

Един от най-интересните функционални тестове, тъй като подобна техника вече се използва в игрите. Той рисува един четириъгълник (по-точно два триъгълника) с помощта на специална техника за картографиране на паралакса, която симулира сложна геометрия. Използват се доста ресурсоемки операции за проследяване на лъчи и карта на дълбочината с висока разделителна способност. Тази повърхност също е засенчена с помощта на тежък алгоритъм на Strauss. Това е тест на много сложен и тежък пикселен шейдър за видео чип, съдържащ многобройни проби от текстури по време на проследяване на лъчи, динамично разклоняване и сложни изчисления на осветлението според Strauss.

Този тест се различава от други подобни по това, че резултатите в него зависят не само от скоростта на математическите изчисления, ефективността на изпълнение на разклоненията или скоростта на извличане на текстури, а от всичко по малко. За постигане на висока скорост тук е важен балансът на GPU блоковете; той също има много забележим ефект върху скоростта и ефективността на разклоняването в шейдърите.

Сравнителните резултати на видеокартите на AMD в диаграмата като цяло са подобни на това, което видяхме в теста за производителност на текстури от 3DMark Vantage, с изключение на това, че новата Radeon HD 7970 е очевидно по-ефективна в тази задача, защото отново почти настигна двойната -чип HD 6990 - отличен резултат! Платките на Nvidia в този случай получиха леко увеличение на производителността, което потвърждава заключението, че не само производителността на текстурите влияе върху резултатите от този тест.

И така, новият модел на AMD се представи отлично, губейки доста от двучиповата платка, базирана на два Cayman. Той надмина своя едночипов предшественик с 66%. Тази цифра не съвпада с ускорението от Кайман до Таити по нито един от теоретичните параметри и може да показва подобрение в ефективността на изпълнение на сложни изчисления на клона. Дори резултатът на GeForce GTX 580, който преди беше смятан за доста добър, е двойно по-лош от този на новия продукт на AMD. Всъщност всички видеокарти на този производител се оказаха по-бързи от топ модела в линията Geforce GTX 500, базиран на един чип.

Тест на функция 4: GPU плат

Тестът е интересен, защото изчислява физически взаимодействия (имитация на плат) с помощта на видеочип. Използва се симулация на върхове, като се използва комбинираната работа на шейдъри на върхове и геометрия, с няколко преминавания. Използвайте stream out, за да прехвърлите върхове от един симулационен проход към друг. По този начин се тестват производителността на изпълнение на върховите и геометричните шейдъри и скоростта на изходящия поток.

Скоростта на изобразяване в този тест също зависи от много параметри, но различни. Основните фактори тук са производителността на геометричната обработка и ефективността на изпълнение на геометричния шейдър. Така че е съвсем логично видеокартите на Nvidia да се чувстват страхотно в това приложение, значително изпреварвайки конкуренцията.

И дори представеният днес Radeon HD 7970, въпреки ясното подобрение на производителността в сравнение с HD 6970, не можа да се конкурира с едночиповия GeForce GTX 580 и беше малко по-нисък от него. Това е един от онези геометрични тестове, в които можете да видите предимството на наскоро пуснатите HD 6900 видеокарти пред предишните линии, които увеличиха скоростта на геометрична обработка и изпълнение на геометрични шейдъри. Radeon HD 7970 подобри резултата с още 35%, но това не беше достатъчно - решенията на Nvidia продължават да водят в този тест. Въпреки че отбелязваме, че новият модел все пак значително подобри позицията на AMD в геометричните тестове.

Тест на функция 5: GPU частици

Тест на физическа симулация на ефекти, базирани на системи от частици, изчислени с помощта на видеочип. Използва се и симулация на върхове, като всеки връх представлява отделна частица. Stream out се използва за същата цел, както в предишния тест. Изчисляват се няколкостотин хиляди частици, всички са анимирани поотделно и техните сблъсъци с картата на височината също се изчисляват.

Подобно на един от нашите тестове RightMark3D 2.0, частиците се изобразяват с помощта на геометричен шейдър, който създава четири върха от всяка точка, за да образуват частица. Но тестът зарежда предимно шейдърни единици с изчисления на върхове;

Резултатите от следващия тест от пакета 3DMark Vantage са подобни на тези, които видяхме в предишната диаграма, но скоростта на обработка на геометрията в него стана още по-важна. И затова видеокартите на Nvidia изскочиха още повече, оставяйки зад себе си дори двучиповото чудовище - Radeon HD 6990. Уви, но е факт - дори GTX 580 надмина всички платки на AMD, включително новия модел, базиран на Tahiti GPU .

Уви, въпреки че платката, базирана на новия чип, показа по-добри резултати в сравнение с решенията, базирани на Cayman и Cypress, тя изостана от GeForce. Разликата между HD 7970 и HD 6970 в това сравнение беше малко над 30%, което показва ясно влияние на скоростта на ALU. В тестовете за симулация на синтетични тъкани и частици от тестовия пакет 3DMark Vantage, които активно използват геометрични шейдъри, решенията на AMD продължават да изостават от конкурентните видео карти, които имат много високи скорости на обработка на геометрията.

Тест за функция 6: Шум на Perlin

Последният тест на функцията на пакета Vantage е математически интензивен тест на видео чипа; той изчислява няколко октави на шумовия алгоритъм на Perlin в пикселния шейдър. Всеки цветен канал използва своя собствена шумова функция, за да постави повече напрежение върху видео чипа. Шумът на Perlin е стандартен алгоритъм, често използван в процедурното текстуриране, и използва много математически изчисления.

Интересното е, че в математическия тест от пакета Futuremark, който показва пиковата производителност на видеочиповете при екстремни задачи, видяхме напълно различна картина в сравнение с подобни тестове от нашия тестов пакет. Производителността на решенията, показани на диаграмата, само много грубо съответства на това, което трябва да се получи според теорията, а също така се отклонява от това, което видяхме по-рано в математическите тестове от пакета RightMark 2.0. Например, ясно се вижда, че новата видеокарта в този тест се доближи много по-близо до теоретичната скорост в сравнение с GPU картите с VLIW архитектура.

Нека да разгледаме причините. По това време HD 6970 не подобри върховата математическа производителност спрямо HD 5870, но това само по себе си не обяснява изоставането на Cayman. Причината може да е или по-ниската ефективност на архитектурата VLIW4, или интелигентна система за управление на захранването, която „нарязва“ тактовата честота и производителността на решенията, когато се достигне зададеният праг на консумация на енергия.

Но това не се отрази на HD 7970. Най-вероятно причината е именно скаларната архитектура на новия чип. Тъй като съотношението на показателите за ефективност в теста и теоретичните ясно показва това. Според теорията HD 6970 има 0.7 математическа мощност на новата карта, но в този тест се оказа само 0.56. Приблизително същата разлика беше получена и за други платки на AMD. Но при сравнение на GTX 580 и HD 7970, които имат скаларни архитектури, теоретичното съотношение е 0,42 (Tahiti е повече от два пъти по-бързо), а практическото също е 0,42. Тоест ефективността от използването на наличните ALU на тези чипове от различни производители е абсолютно еднаква! За разлика от Cayman и Cypress, които имат VLIW архитектура.

Във всеки случай, новата платка на AMD побеждава и двамата си конкуренти от Nvidia с огромна разлика и Nvidia очевидно трябва драстично да увеличи математическата си мощ в бъдещи решения. Междувременно се очертава обичайната картина - видеокартите Geforce показват слаби резултати в случаите, когато простата и интензивна математика се извършва много по-бързо на платките Radeon. А освобождаването на Южния остров само влоши ситуацията.

Direct3D 11: Изчислителни шейдъри

За да тестваме новите решения на AMD в задачи, които използват нови функции на DirectX 11, като теселация и изчислителни шейдъри, използвахме примери от SDK и демонстрации от Microsoft, Nvidia и AMD.

Първо, нека да разгледаме тестове, които използват Compute shaders. Появата им е една от най-важните иновации в най-новите версии на DX API, те вече се използват в съвременните игри за изпълнение на различни задачи: пост-обработка, симулации и др. Първият тест показва пример за HDR рендиране с тонално картографиране от DirectX SDK, с последваща обработка, използване на пикселни и изчислителни шейдъри.

Това може да не е най-добрият пример за изчислителни шейдъри, но показва разликата в производителността доста ясно. Няма почти никаква разлика между изчисленията в изчисленията и пикселните шейдъри за видеокарти на AMD, а на Nvidia пикселният шейдър работи малко по-бързо.

AMD Radeon HD 6970 се оказа по-бърз от своя предшественик HD 5870 и се представи на нивото на Geforce GTX 580, но представеният днес модел HD 7970 е значително по-напред от всички тях и става лидер (ние решихме, че не за използване на двучипови видеокарти в този синтетичен). GTX 560 Ti беше взет главно за тестове на геометрията и за да се оцени разликата между решенията от различни ценови сегменти.

И така, обявената платка на новия чип Tahiti изпреварва с 40% своя аналог на Cayman, което напълно съответства на разликата в теоретичната производителност на изчислителните единици. От своя страна предимството пред конкурентната GTX 580 е 30-40% (в зависимост от вида на шейдърната програма), което е очевидно по-ниско от теоретично възможното. GTX 560 Ti изостава много, повече от два пъти.

Вторият изчислителен шейдър тест също е взет от Microsoft DirectX SDK и показва изчислителен проблем с гравитацията на N-тела – симулация на динамична система от частици, която е подложена на физически сили като гравитацията.

Резултатите в този тест са много необичайни, за остарелите решения на AMD те са подобни на числата от математическия тест на 3DMark Vantage - Cypress се оказа по-бърз от Cayman. Въпреки голямото теоретично превъзходство в пиковите стойности, най-бързата видеокарта на AMD – новата Radeon HD 7970, представена днес – е само с 21% пред топ решението на Nvidia. И дори GTX 560 Ti не изостава толкова много. Старите модели от семействата HD 6900 и HD 5800 показват резултати, близки до тези на GeForce GTX 580.

Това, което ни интересува най-много, е разликата между Cayman и Tahiti, като в този случай виждаме 36% предимство за новия модел. Това е малко по-малко от теоретичната разлика между тези модели, но все още е близо до нея. Защо и двете карти не се представиха много добре на фона на много старата HD 5870? Може би виновникът е намалената честота на PowerTune или липсата на оптимизация на драйвера за новата архитектура. Да видим, може би Таити най-накрая ще покаже значително ускорение в тестовете за теселация.

Direct3D 11: Производителност на теселацията

Изчислителните шейдъри са много важни, но основната иновация в Direct3D 11 все още е хардуерната теселация. Разгледахме го много подробно в нашата теоретична статия за Nvidia GF100. Tessellation се използва от доста време в DX11 игри, като STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и други. Някои от тях използват теселация за модели на герои, други я използват за симулиране на реалистични водни повърхности или пейзажи.

Има няколко различни схеми за разделяне на графични примитиви (теселация). Например теселация на фонг, PN триъгълници, подразделяне на Catmull-Clark. По този начин схемата за разделяне на триъгълниците PN се използва в STALKER: Call of Pripyat, а в Metro 2033 - теселация Phong. Тези методи се внедряват относително бързо и лесно в процеса на разработка на игри и съществуващите двигатели, поради което станаха популярни.

Първият тест за теселация ще бъде примерът за детайлна теселация от ATI Radeon SDK. Той прилага не само теселация, но и две различни техники за обработка пиксел по пиксел: просто наслагване на нормална карта и картографиране на оклузия на паралакс. Е, нека сравним решенията на AMD и Nvidia DX11 при различни условия:

Интересното е, че картографирането на оклузия на паралакса (средните ленти в диаграмата) на видеокарти и на двата производителя е много по-малко ефективно от теселацията (долните ленти), а умерената теселация не дава голям спад в производителността - сравнете горната и долната колона. Това означава, че висококачествената имитация на геометрия, използваща изчисления на пиксели, осигурява дори по-ниска производителност от теселираната геометрия с картографиране на изместване.

Що се отнася до производителността на видеокартите една спрямо друга, нека първо да разгледаме техниките на пиксел. В простия тест за картографиране, новата видеокарта на AMD е лидер, тя изпреварва HD 6970 и GTX 580 съответно с 27% и 36%. Но в подтеста на сложните изчисления пиксел по пиксел (помнете тестовете за картографиране на паралакс по-горе) преди пускането на Cayman, видеокартите Geforce бяха по-бързи от решенията на AMD, както и с активирана теселация. С пускането на пазара Radeon HD 6970 се оказа забележимо по-бърз от HD 5870 в подтеста за теселация, а в теста с малък коефициент на разделяне на триъгълник HD 6970 дори надмина GTX 580.

Много по-интересно е това, което видяхме на графиката с надпис Radeon HD 7970. Теселацията тук не е много сложна, така че новата видеокарта не спечели толкова много пред предишния модел - около 30%. Друго нещо е POM тестът. В този подтест новият HD 7970 просто разкъса всички други решения на парчета. Предимството пред HD 6970 и GTX 580 е само малко по-малко от двойно. Още един супер резултат в теста за картографиране на паралакса, показващ високата ефективност на изпълнение на сложни шейдърни програми.

Вторият тест за производителност на теселация ще бъде друг пример за 3D разработчиците от ATI Radeon SDK - PN Triangles. Всъщност и двата примера също са включени в DX SDK, така че сме сигурни, че разработчиците на игри създават своя код въз основа на тях. Тествахме този пример с различни фактори на теселация, за да разберем какво влияние има промяната му върху цялостната производителност.

Но в този пример виждаме пълно сравнение на геометричната мощност на решенията на AMD и Nvidia при различни условия. И се оказа много интересно според нас. Графичната архитектура Fermi се откроява, както и новият чип с архитектура Tahiti от AMD. Разбира се, това е чисто синтетичен тест и е малко вероятно екстремните коефициенти на разделяне да се използват в игрите в близко бъдеще, особено като се има предвид общата мултиплатформена природа. Интересуваме се от архитектурния потенциал, затова се нуждаем от „синтетика“.

Ако в лесни условия новият Radeon HD 7970 успешно се конкурира с GeForce GTX 580, изпреварва го в най-леките режими и е наравно в третия, но в най-трудните условия с много голям брой триъгълници, това е просто невъзможно да се конкурира с видеокартата Nvidia Geforce на чипа GF110 - при задачи с екстремна теселация, той е значително по-бърз дори от многократно подобрените чипове на AMD. Въпреки че новият GPU отново намали изоставането от своя конкурент в задачите за обработка на геометрията, той все още е много далеч от паралелната работа на 16 теселационни единици в GF110. И дори GF114 при максимално съотношение на разделяне се оказа по-бърз от Tahiti.

Въпреки това, въпреки загубата в най-суровите условия с максимално съотношение на разделяне, базираният в Таити HD 7970 иначе се представи добре, особено в сравнение с Cayman и Cypress. Новият модел на AMD показва впечатляващо увеличение на скоростта в режими на леко и средно натоварване, като разликата спрямо и без това бавния HD 6970 достига 2,8 пъти. Но виждаме такова увеличение само в крайни случаи и най-често се оказва от 30 до 70%. Не сме видели обещаната четирикратна разлика, поне не още.

Но максималната разлика между решенията на компаниите се постига в условия на екстремна теселация, която няма да се намери в игри и бенчмаркове, близки до тях. Като такъв очакваме Tahiti значително да подобри класирането на AMD в съществуващите бенчмаркове за теселация като 3DMark11 и Heaven.

Нека да разгледаме друг тест, демонстрацията на Nvidia Realistic Water Terrain, известна още като Island. Тази демонстрация използва теселация и картографиране на изместване, за да изобрази реалистично изглеждащи океански повърхности и терен. Изглежда просто страхотно, ето какво липсва в текущите игри:

Island не е чисто синтетичен тест за измерване на производителността на геометрията; той съдържа сложни пикселни и изчислителни шейдъри и такова натоварване е по-близо до реалните игри, които използват всички GPU блокове наведнъж, а не само геометрични, както в предишния бенчмарк.

Тествахме програмата и при четири различни съотношения на теселация, тази настройка се нарича Dynamic Tessellation LOD. И ако при най-нисък коефициент на разделяне всички видеокарти на AMD са напред, тогава, когато работата става по-сложна, платките, базирани на чипове Nvidia, започват да се изтеглят напред. И тъй като факторът на разделяне и сложността на сцената се увеличават, производителността на абсолютно всички Radeon пада значително, за разлика от конкурентните решения.

Интересно е поведението на Radeon HD 7970 в теста. Веднага става ясно, че не са направени фундаментални промени в геометричния тръбопровод (като цяло това не беше обещано, така че няма оплаквания). Ако в най-лекия режим новата карта е по-бърза от HD 6970 с 35%, а GTX 580 с 64%, тогава дори при настройка на LOD на 25, производителността на новия продукт пада до нивото на скоростта на GTX 560 Ти. Освен това. При максимален LOD коефициент разликата между скоростта на GeForce GTX 580 и Radeon HD 7970 достига 3,5 пъти!

Нека проверим дали сме получили обещаната четирикратна разлика между HD 7970 и HD 6970. Не, максималният лаг на Cayman GPU беше по-малък от два пъти. И най-често само един и половина. Като цяло, не ни е много ясно къде да търсим четирикратно ускорение на теселацията; просто трябва да вярваме, че то съществува някъде. Междувременно отбелязваме още една победа за видеочипове от Nvidia - те са много добри в геометричните тестове.

Заключения от синтетични тестове

Въз основа на резултатите от нашите синтетични тестове на най-новата видеокарта Radeon HD 7970, базирана на графичния процесор Tahiti от семейството на Южните острови, както и резултатите от други модели видеокарти, произведени от двамата производители на дискретни видео чипове, можем заключават, че новият продукт със сигурност ще стане лидер сред предлаганите на пазара едночипови решения. Това е просто отлично продължение на успешните линии Radeon HD 5800 и HD 6900, които трябва сериозно да укрепят позициите на AMD през следващите месеци.

Графичният процесор Tahiti е базиран на нова архитектура, използваща най-новата 28 nm технология и е много различен от всички предишни чипове на компанията. Въпреки че броят на някои изпълнителни единици не се е увеличил значително (ALU и ROP), новият графичен процесор включва важни архитектурни промени, насочени към повишаване на ефективността на GPU изчисленията, както и подобряване на позицията му в производителността на обработката на геометрията. Много от нашите синтетични тестове показаха, че изчислителната ефективност при сложни задачи и скоростта на теселацията и геометричните шейдъри са се увеличили значително, макар и не винаги толкова, колкото очаквахме.

Това, което трябваше да се случи, се случи с видео чиповете на AMD. Същото нещо, през което Nvidia вече премина малко по-рано. С изместването на фокуса от графични изчисления към изчисления с общо предназначение и съответното преминаване от VLIW към скаларни архитектури, както и добавянето на други критични за GPGPU функции като разширено кеширане и добавяне на планировчици във всяка изчислителна единица, увеличаването на сложността на чипа непременно ще надхвърли увеличението на пиковата производителност. Тоест, всъщност се оказва, че предишните решения могат да бъдат по-ефективни - въпреки че са по-малко продуктивни, това се постига с по-малко усилия (под формата на сложност на чипа).

Нека обясним това с пример. Предимството на Radeon HD 7970 пред същия Radeon HD 5870 в някои синтетични тестове беше далеч от разликата в сложността на GPU - в края на краищата Cypress има точно наполовина по-малко транзистори (2,15 срещу 4,3 милиарда), а в тестовете много рядко изостава зад толкова. Оказва се, че старият чип е по-ефективен от новия? Да, но само за остарели чисто графични задачи! В случай на неграфични изчисления и много сложни 3D изчисления, Tahiti се оказа дори повече от два пъти по-мощен от Cypress и това се потвърждава от съответната синтетика. GPGPU е бъдещето и задачите на видеочиповете ще продължат да стават все по-сложни, така че AMD просто нямаше друг избор.

Но благодарение на архитектурните промени и характеристиките си, видеокартата от новата серия стана повече от конкурентна в много синтетични тестове, които преди това бяха „ахилесовата пета“ на решенията на AMD, особено в сравнение с нейния пряк конкурент Geforce GTX 580, дори като се има предвид по-високата цена. Това е ясно видимо в почти всички синтетични тестове на пакетите RightMark и Vantage и в примери от различни SDK.

Но имаше и потенциално... е, не точно слаби, но не достатъчно силни страни на новия GPU. Те включват не много голямо увеличение на производителността в някои математически тестове и възникват въпроси в геометричните тестове (например къде е обещаното четирикратно ускорение?). Въпреки по-голямата сложност и площ на чипа в сравнение със същия Cayman, резултатите на HD 7970 понякога са по-ниски от очакваното, което не винаги е лесно за обяснение. Предполагаме, че липсата на оптимизация на драйверите може да е виновна за това, тъй като тази архитектура е напълно нова за AMD и изисква внимателно и отнемащо време полиране. В някои тестове системата за управление на захранването PowerTune също може да се провали, което може да понижи тактовите честоти при достигане на максимална консумация на енергия в най-взискателните синтетични тестове, предотвратявайки картата да покаже очакваната производителност въз основа на броя на изпълнителните единици и тяхната тактова честота.

Въпреки че като цяло резултатите в синтетиката се оказаха доста добри и е особено приятно, че инженерите на AMD подобриха някои от слабите си места. За съжаление, в настоящите игри ще бъде много по-трудно да се постигнат такива впечатляващи печалби в сравнение с напредналата синтетика. По няколко причини едновременно. Дори просто защото производителността в приложенията за игри рядко се ограничава от някоя характеристика на видеокартата, за разлика от синтетиката, и при такава радикална промяна в графичната архитектура, драйверите все още трябва да бъдат оптимизирани и оптимизирани. Освен това дори съвременните игри рядко използват всички възможности на компютърните графични карти от най-висок клас. Те често се свеждат до скоростта на достъп до текстури и ефективната скорост на запълване (честотна лента на видео паметта) и при такива условия такива сложни чипове не могат да се развият напълно. Ще трябва да изчакаме или мощни PC ексклузиви, или следващото поколение игрови конзоли.

Предполагаме, че резултатите от Radeon HD 7970 в синтетичните тестове ще бъдат потвърдени от съответните цифри в частта „игра“ на нашия материал. В игрите новата HD 7970 трябва да се представи по-силно от всички свои конкуренти и да превъзхожда GeForce GTX 580 с поне 30% или дори повече. Вероятно ще се получи както обикновено - в някои тестове предимството ще е по-голямо, а в други почти няма. Във всеки случай HD 7970 няма как да не стане най-добрият сред всички едночипови модели на AMD и Nvidia, поне открихме всички предпоставки за това. Така че нека да преминем към следващата част от материала - изучаването на скоростта в игрите.

Ново издание AMD Radeon HD 7970 GHz Editionне беше изненада за никого, тъй като от самото обявяване на Radeon HD 7970 (и дори преди него) и представянето на отличния овърклок потенциал на Tahiti GPU, циркулираха слухове за възможността за пускане на още по-бърз видео карта. Точно това се случи, макар и не веднага след появата на основния конкурент - NVIDIA GeForce GTX 680. Очевидно тримесечното забавяне на появата на форсирания Radeon HD 7970 е причинено не само от отстраняването на грешки на новия 28- nm технология, но и от желанието на AMD едновременно да намали цените на новата линия на своите видеокарти. Сега новото Radeon HD 7970 GHz Edition струва $499, което е с $50 по-евтино от Radeon HD 7970, обявен преди повече от шест месеца, който сега се препоръчва за продажба на $429:

Нека да проучим новия продукт, неговите характеристики и да отговорим на въпроса: с пускането на Radeon HD 7970 GHz Edition AMD успя да стане едноличен лидер сред еднопроцесорните видеокарти?

Спецификации

Техническите характеристики на AMD Radeon HD 7970 GHz Edition са показани в таблицата в сравнение с характеристиките на референтните видеокарти AMD Radeon HD 7970 и NVIDIA GeForce GTX 680:

Характеристики на дизайна

Външно, в сравнение с AMD Radeon HD 7970, новата референтна Radeon HD 7970 GHz Edition е напълно неразличима:




Естествено, по отношение на размера на видеокартата не са настъпили промени - дължината й е 278 мм, височината и дебелината са съответно 100 и 38 мм.

Няма промени и по отношение на изходите; видеокартата е оборудвана с един DVI-I с поддръжка на високи резолюции (Dual Link), един HDMI версия 1.4a и два DisplayPort версия 1.2:


Като се има предвид тази тенденция, няма нужда да казваме, че по отношение на захранващите конектори, MIO и двойния BIOS също нищо не се е променило: Radeon HD 7970 GHz Edition е оборудван с осем- и шест-пинови конектори за свързване на допълнително захранване, два MIO конектора за създаване на CrossFireX връзки и малък превключвател за избор на BIOS:


Въпреки увеличените честоти, консумацията на енергия на новата видеокарта се твърди, че е на същото ниво: в 3D режим тя е пикова от 250 W, а в 2D Radeon HD 7970 GHz Edition консумацията може да падне до 3 W ( когато мониторът е изключен). Нека ви напомним и за деактивирането на всички други видеокарти, с изключение на първата, в режим CrossFireX при излизане от 3D режим. Тази със сигурност полезна функция на новия Radeon HD 79xx не е изчезнала никъде.

По отношение на външния вид на печатната платка и разположението на елементите не сме установили никакви промени в сравнение с обикновения Radeon HD 7970:


Подобно на референтната Radeon HD 7970, форсираната версия на видеокартата е оборудвана със схема за захранване "5+1", където пет фази преминават към графичния процесор и една към веригата за захранване на видео паметта:


Те все още се управляват от контролера CHiL Semiconductor CHL8228G, инсталиран в задната част на предната страна на печатната платка:


28nm GPU на нашата видеокарта AMD Radeon HD 7970 GHz Edition изглежда така:


Както вече можете да видите от таблицата с характеристиките, той няма функционални промени: 2048 унифицирани шейдър процесори, 32 растерни единици и 128 текстурни единици. Единственото нещо, което AMD направи, беше да увеличи честотата си от предишните 925 MHz на 1000 MHz, а също така въведе нов т. нар. режим на усилване, при който честотата на GPU при високо натоварване може да се увеличи до 1050 MHz. По този начин можем да кажем, че честотата на графичния процесор AMD Radeon HD 7970 GHz Edition е с 13,5% по-висока от честотата на обикновения Radeon HD 7970. Според данните от мониторинга напрежението на графичния процесор в 3D режим е 1,256 V, а в 2D, когато честотата се намали до 300 MHz, напрежението пада до 0,949 V.

Качеството на ASIC на GPU кристала се оказа много ниско - само 56,3%:


Подобно на обикновения Radeon HD 7970, три гигабайта GDDR5 видео памет са разположени в 12 FCFBGA чипа от предната страна на печатната платка. Чиповете са произведени от Hynix Semiconductor Inc. и са маркирани с H5GQ2H24AFR R0C:


Теоретичната ефективна честота на такива чипове в 3D режим е 6000 MHz, при която работи паметта AMD Radeon HD 7970 GHz Edition, за разлика от 5500 MHz при Radeon HD 7970 (+9,1%). С широчина на шината на паметта на видеокартата от 384 бита, честотната лента на паметта достига рекордните 288 GB/сек. В 2D режим честотата е намалена до 600 ефективни мегахерца.

Референтният AMD Radeon HD 7970 GHz Edition няма повече промени:


Прочетете с помощната програма GPU-Z и запазете BIOS можете да изтеглитеот файлов архив.

Охладителна система и нейната ефективност

Както вече разбирате, всички разлики между AMD Radeon HD 7970 GHz Edition и обикновения Radeon HD 7970 могат да се преброят на два пръста на едната ръка, тъй като те не докоснаха охладителната система на видеокартата, която се състои от радиатор с медна парна камера в основата, медна основа, турбина и пластмасов корпус:


Не открихме нито една промяна при разглобяването на този охладител и премахването на неговия радиален вентилатор:




Според данните от мониторинга скоростта на въртене на тази турбина може да варира в диапазона от 1050 до 5400 об/мин, а максималната консумация на енергия не трябва да надвишава 20 вата.

За да проверим температурните условия на видеокартата като товар, използвахме пет тестови цикъла на много ресурсоемката игра Aliens vs. Predator (2010) с максимално качество на графиката в резолюция 2560x1440 пиксела с анизотропно филтриране на ниво 16x и използване на MSAA anti-aliasing от 4x степен:



Програмата се използва за наблюдение на температури и други параметри MSI Afterburner версия 2.2.2и GPU-Z помощна програма версия 0.6.3. Всички тестове бяха проведени в затворен корпус на системния модул, чиято конфигурация можете да видите в следващия раздел на статията, при стайна температура от 25 градуса по Целзий. Ефективността на системата за охлаждане на видеокартата беше тествана преди разглобяването й с помощта на стандартен термичен интерфейс.

Да видим дали охладителят на референтната AMD Radeon HD 7970 GHz Edition може да се справи с повишените си честоти:


Автоматичен режим Максимална мощност


Да, той го направи, разбира се, но температурният режим на видеокартата при автоматично регулиране на скоростта на вентилатора оставя много да се желае, защото графичният процесор се затопли до почти 90 градуса по Целзий, а радиалният вентилатор се ускори до 3200 оборота в минута, което е много шумно. При максимум 5400 оборота в минута е много трудно да бъдете в една стая с такава ревяща видеокарта, но такива високи скорости ви позволяват веднага да спечелите 18 градуса по Целзий в температурата на графичния процесор в пика на натоварването върху него.

Потенциал за овърклок

Може би поради нискокачествен графичен процесор или може би просто поради лош късмет, потенциалът за овърклок на пробата AMD Radeon HD 7970 GHz Edition, предоставена ни за тестване, се оказа среден. Без увеличаване на напрежението на ядрото, беше възможно само да го овърклокнете до 1180 MHz:


Паметта също беше скромна при овърклок, спирайки само на 6680 MHz. В резултат на това честотите на нашата видеокарта бяха 1180 MHz (+12,4%) за GPU и 6680 MHz (+11,3%) за видеопаметта:


Е, поне работната температура на овърклокната видеокарта при автоматично регулиране на скоростта на вентилатора остана практически непроменена:


Малко разстроени, решихме да изцедим „целия сок“ и, като поставихме тапи за уши и настроихме максимална скорост на вентилатора, проверихме потенциала на GPU при напрежение, увеличено до 1,3 V. Резултатът е 1250 MHz, което не е толкова лошо:




Температурният режим на видеокартата, овърклокнат с нарастващо напрежение, се оказа следният:


Пиковата температура на графичния процесор достигна 77 градуса по Целзий (не забравяйте, че при максимални 5400 оборота в минута на турбината). Надяваме се, че серийните видеокарти "GHz Edition" с оригинални и високоефективни охладители ще могат да ни зарадват не само с по-ниски температури, но и с умерени нива на шум.

Консумация на енергия

Консумацията на енергия на системата с различни видеокарти беше измерена с помощта на многофункционалния панел Zalman ZM-MFC3, който показва консумацията на системата „от контакта“ като цяло (с изключение на монитора). Измерването е извършено в 2D режим, по време на нормална работа в Microsoft Word или сърфиране в Интернет, както и в 3D режим, натоварването в което е създадено с помощта на трикратен тест от играта Metro 2033: The Last Refuge в резолюция от 2560x1440 при максимални настройки качество на графиката.

Нека да разгледаме резултатите:



Очевидно за нашата тестова система с овърклокнат шестядрен процесор и която и да е от тестваните днес видеокарти ще бъде достатъчно висококачествено захранване от 550 вата. Що се отнася до новото AMD Radeon HD 7970 GHz Edition, при номинални честоти система с него консумира 20 вата повече енергия от система с обикновен Radeon HD 7970 и около 80 вата повече от система с неовърклокнат GeForce GTX 680. Имайте предвид, че с При овърклок на видеокарти консумацията на енергия на системите при пиково натоварване се увеличава незначително, дори при увеличаване на напрежението на графичните процесори. В неактивен режим консумацията на енергия е почти същата.

Тестова конфигурация, инструменти и методология за тестване

Тестването на видеокартите беше извършено на система със следната конфигурация:

Дънна платка: Intel Siler DX79SI (Intel X79 Express, LGA 2011, BIOS 0525 от 07/09/2012);
ПРОЦЕСОР: Intel Core i7-3960X Extreme Edition 3.3 GHz(Sandy Bridge-E, C1, 1,2 V, 6x256 KB L2, 15 MB L3);
Система за охлаждане на процесора: Phanteks PH-TC14PE (2x135 mm, 900 rpm);
Термичен интерфейс: ARCTIC MX-4;
RAM: DDR3 4x4 GB Mushkin Redline(2133 MHz, 9-10-10-28, 1.65 V);
Видео карти:

AMD Radeon HD 7970 GHz Edition 3 GB 384 бита GDDR5, 1050/6000 и 1250/6680 MHz при 1,3 V;
Sapphire Radeon HD 7970 OC Dual-X 3 GB 384 бита GDDR5, 925/5500 MHz;
ASUS GeForce GTX 680 DirectCU II TOP 2 GB 256 bit GDDR5, 1006/6008, 1137/6008 и 1217/7168 MHz;

Системен диск: SSD 256 GB Crucial m4 (SATA-III, CT256M4SSD2, BIOS v0009);
Диск за програми и игри: Western Digital VelociRaptor (SATA-II, 300 GB, 10000 rpm, 16 MB, NCQ) в кутия Scythe Quiet Drive 3.5";
Архивен диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 TB, 5400 rpm, 32 MB, NCQ);
Корпус: Antec Twelve Hundred (предна стена - три Noiseblocker NB-Multiframe S-Series MF12-S2при 1020 оборота в минута; гръб – две Noiseblocker NB-BlackSilentPRO PL-1при 1020 оборота в минута; отгоре – стандартен 200 mm вентилатор при 400 rpm);
Панел за управление и мониторинг: Zalman ZM-MFC3;
Мощност: Xigmatek "No Rules Power" NRP-HC1501(1500 W), 140 mm вентилатор;
Монитор: 27" Samsung S27A850D (DVI-I, 2560x1440, 60 Hz).

За сравнение с AMD Radeon HD 7970 GHz Edition включихме видеокартата в тестовете Sapphire Radeon HD 7970 OC Dual-X 3 GB:


Тъй като и двата му BIOS имат повишени честоти, ръчно намалихме честотата на GPU и паметта на видеокартата до номиналната за Radeon HD 7970 -925/5500 MHz, въпреки че GPU-Z упорито ни показваше леко повишени честоти:


От страна на NVIDIA включихме в теста най-добрата GeForce GTX 680, която тествахме в нашата лаборатория. Това е видео карта ASUS GeForce GTX 680 DirectCU II TOP 2 GB:


Нейната производителност е тествана при номиналните честоти за ASUS - 1137/6008 MHz, номиналните честоти за референтната NVIDIA GeForce GTX 680 - 1006/6008 MHz и при максимално възможния овърклок за този екземпляр на видеокартата - 1217/7168 MHz :


За да се намали зависимостта на производителността на видеокартата от скоростта на платформата, 32-nm шестядрен процесор с множител 37, референтна честота 125 MHz и активирана функция Load-Line Calibration беше овърклокнат до 4,625 GHz, докато напрежението в BIOS на дънната платка беше увеличен до 1,47 V:



Технологията Hyper-Threading е активирана. В същото време 16 GB RAM работи на честота 2 GHz с времена 9-10-10-28 при напрежение 1,65 V.

Тестването, започнало на 30 юли 2012 г., се проведе под операционната система Microsoft Windows 7 Ultimate x64 SP1 с всички критични актуализации към посочената дата и с инсталирането на следните драйвери:

чипсет на дънната платка Intel драйвери за чипсет – 9.3.0.1020 WHQL от 26.01.2012 г;
DirectX End-User Runtimes библиотеки, дата на издаване: 30 ноември 2010 г.;
Драйвери за видеокарти за графични процесори AMD – Catalyst 12.x (8.982.0.0 RC1) от 19.07.2012 г.+ Catalyst Application Profiles 12.7 (CAP1);
Драйвери за видеокарти за графични процесори NVIDIA – GeForce 304.79 бета от 03.07.2012 г.

Производителността на видеокартите е тествана в две резолюции: 1920x1080 и 2560x1440 пиксела. За тестовете бяха използвани два режима на качество на графиката: “Quality + AF16x” – качество на текстурата в драйверите по подразбиране с активирано анизотропно филтриране на ниво 16x и “Quality + AF16x + MSAA 4x (8x)” с анизотропно филтриране на ниво 16x и пълно -екранен anti-aliasing активира мощности от 4x или 8x, в случаите, когато средният брой кадри в секунда остава достатъчно висок за удобна игра. Анизотропното филтриране и изглаждането на цял екран бяха активирани директно в настройките на играта. Ако тези настройки липсват в игрите, тогава параметрите са променени в контролните панели на драйверите Catalyst и GeForce. Вертикалната синхронизация също беше деактивирана там. Не са направени допълнителни промени в настройките на драйвера.

Списъкът с тестови приложения се състои от два полусинтетични пакета, едно техно демо и 13 игри, актуализирани до най-новите версии (към началната дата на тестовете):

3DMark Vantage(DirectX 10) – версия 1.0.2.1, профили на настройки „Performance“ и „Extreme“ (тествани са само основни тестове);
3DMark 2011(DirectX 11) – версия 1.0.3.0, профили на настройките „Performance” и „Extreme”;
Демонстрация на Unigine Heaven(DirectX 11) – версия 3.0, максимални настройки за качество, теселация на „екстремно“ ниво, AF16x, резолюция 1280x1024 без MSAA и 1920x1080 с MSAA 8x;
(DirectX 11) – версия 1.6.02, профил на настройките „Подобрено динамично осветление DX11“ с допълнителна ръчна настройка на всички параметри до максимум, тестван собствен демо запис „cop03“ на ниво „Backwater“;
Метро 2033: Последното убежище(DirectX 10/11) – версия 1.2, използван е официален тест, настройки за качество „Много високи“, теселация, активиран DOF, използван е AAA anti-aliasing, двойно последователно преминаване на сцената „Frontline“;
Just Cause 2(DirectX DX10.1) – версия 1.0.0.2, максимални настройки за качество, „Background Blur“ и техники за GPU Water Simulation са деактивирани, двойно последователно преминаване на демонстрацията „Dark Tower“;
Извънземни срещу Хищник (2010)(DirectX 11) – „Качество на текстурата“ в режим „Много високо“, „Качество на сенките“ в режим „Високо“, активирана технология SSAO, два тестови цикъла във всяка резолюция;
Изгубената планета 2(DirectX 11) – игра версия 1.0, максимални настройки за качество на графиката, активирано замъгляване на движението, използван е тест за производителност „B“;
Цивилизацията на Сид Майер V(DirectX 11) – версия на играта 1.0.1.348, максимални настройки за качество на графиката, двойно изпълнение на „дипломатическия“ тест на петте най-трудни сцени;
Total War: Shogun 2(DirectX 11) – версия 2.0, вграден тест (Битката при Секигахара) при максимални настройки за качество на графиката и се използва в един от режимите MSAA 4x;
Crysis 2(DirectX 11) – версия 1.9, използвана Adrenaline Crysis 2 Benchmark Tool v1.0.1.14 BETA, профил на настройките за качество на графиката „Ultra High“, активирани текстури с висока разделителна способност, двоен цикъл на демонстрационен запис на сцената „Times Square“;
Демонстрация за твърдо нулиране(DirectX 9) – тест, вграден в демо версията с Ultra качество на графиката, едно преминаване на тестовата сцена;
Batman: Arkham City(DirectX 11) – версия 1.2, настройки за максимално качество на графиката, дезактивирана физика, двойно последователно преминаване на теста, вграден в играта;
Бойно поле 3(DirectX 11) – версия 1.4, всички настройки за качество на графиката са зададени на „Ultra“, двойно последователно възпроизвеждане на сценария от началото на мисията „На лов“ с продължителност 110 секунди;
DiRT Showdown(DirectX 11) – версия 1.0, вграден тест на магистрала Невада с максимални настройки за качество на графиката (предварителна настройка „Ultra“);
Sniper Elite V2 Бенчмарк(DirectX 11) – версия 1.05, използвана Adrenaline Sniper Elite V2 Benchmark Tool v1.0.0.2 BETAмаксимални настройки за качество на графиката (“Ultra”), Разширени сенки: ВИСОКИ, Оклузия на околната среда: ВКЛ., Стерео 3D: ИЗКЛ., двойно последователно тестово изпълнение;

По-подробно описание на методите за тестване на видеокарти и графични настройки в някои от изброените игри можете да намерите в специално създадения нишка на нашата конференция, както и да участват в обсъждането и подобряването на тези техники.

Ако игрите внедриха възможността за запис на минимален брой кадри в секунда, това също беше отразено в диаграмите. Всеки тест се провежда два пъти; най-добрата от двете получени стойности се взема като краен резултат, но само ако разликата между тях не надвишава 1%. Ако отклоненията на тестовите серии надвишават 1%, тогава тестването се повтаря поне още веднъж, за да се получи надежден резултат.

Резултати от тестове за ефективност и анализ

3DMark Vantage



Първият полусинтетичен тест 3DMark Vantage ни показа доста интересна картина. Ако в режим без anti-aliasing новият AMD Radeon HD 7970 GHz Edition все още е значително по-нисък от GeForce GTX 680, то в по-ресурсоемкия режим на настройките „Extreme“ разликата е сведена до минимум. При овърклок на двете видеокарти картината не се променя; NVIDIA е малко по-бърза от AMD. Като цяло Radeon HD 7970 GHz Edition е с 6,5-10,6% по-добър от своя предшественик.

3DMark 2011



В 3DMark 2011 балансът на силите не се е променил, но GeForce GTX 680 има по-уверена преднина тук. AMD Radeon HD 7970 GHz Edition е с около 9% по-бърз от обикновения HD 7970.

Демонстрация на Unigine Heaven



Картината се повтаря: в "лек" графичен режим GeForce GTX 680 демонстрира по-висока скорост от двете разновидности на Radeon HD 7970, а при разделителна способност 1920x1080 и при активиран anti-aliasing производителността на видеокартите е почти равни. Новият Radeon HD 7970 GHz Edition е с 10,5-12% по-бърз от обикновения HD 7970.

S.T.A.L.K.E.R.: Call of Pripyat


Както можем да видим от резултатите на обикновения Radeon HD 7970, в S.T.A.L.K.E.R.: Call of Pripyat, най-добрите видеокарти на AMD не са губили досега и с пускането на Radeon HD 7970 GHz Edition те започнаха да надминават конкурента GeForce GTX 680 с 7,5-11%. За да бъдем честни, отбелязваме, че при овърклок на тези две видеокарти тяхната производителност е почти еднаква, включително в режими, използващи антиалиасинг.

Метро 2033: Последното убежище


В Metro 2033: The Last Refuge простият Radeon HD 7970 вече беше малко по-бърз от GeForce GTX 680, а новото GHz издание успя да увеличи тази разлика, тъй като поради по-високите честоти е с 4-6% по-напред от обикновен HD 7970. Вярно е, че можете удобно да играете Metro 2033 на тези видеокарти само при резолюция 1920x1080 пиксела и по-ниска.

Just Cause 2


Just Cause 2 ни демонстрира необходимостта от овърклок на Radeon HD 7970 и превръщането му в GHz Edition, за да се конкурира с GeForce GTX 680. Ако предишният флагман на AMD изоставаше от прекия си конкурент, форсираната версия вече е наравно с него в тази игра.

Извънземни срещу Хищник (2010)


В играта Aliens vs. Predator (2010) Radeon HD 7970 преди това изглеждаше за предпочитане пред GeForce GTX 680 и с пускането на версията GHz Edition на тази видеокарта успя да увеличи предимството си до 44% в най-ресурсоемкия режим.

Изгубената планета 2

Но в Lost Planet 2 повишените честоти на AMD Radeon HD 7970 GHz Edition не му помагат в борбата срещу GeForce GTX 680:


Пропастта се затваря, но нищо повече. Видеокартите, базирани на NVIDIA GPU, все още са лидери в тази игра.

Цивилизацията на Сид Майер V


Феновете на серията игри Civilization V на Sid Meier като цяло имат един избор - видеокарти на AMD GPU, които са с до 67% пред конкурента.

Total War: Shogun 2

До последната актуализация за Total War: Shogun 2, която беше инсталирана автоматично от Steam, видеокартите на NVIDIA можеха успешно да се конкурират с видеокартите на AMD, но сега ситуацията се промени сериозно:


Това вече се случи преди няколко месеца и NVIDIA успя да коригира ситуацията в тази игра, като пусна нова версия на драйверите. Дали и този път ще е така – времето ще покаже, но засега GeForce GTX 680 е тук само като наваксващо изоставане.

Crysis 2


Ако по-рано Radeon HD 7970 и GeForce GTX 680 бяха приблизително равни в Crysis 2, то с пускането на Radeon HD 7970 GHz Edition везните се наклониха в полза на AMD. Макар и с леко предимство, новият продукт е лидер в този тест. Когато и двете видеокарти са овърклокнати до максимум, производителността им не се различава.

Демонстрация за твърдо нулиране


Тук новият AMD Radeon HD 7970 GHz Edition е с до 16% пред обикновения Radeon HD 7970 и поради това загубата на GeForce GTX 680 се заменя с победа над него. Въпреки това, последният, когато е овърклокнат, получава по-висока възвръщаемост при Hard Reset от Radeon HD 7970 GHz Edition и лесно възвръща лидерството си.

Batman: Arkham City


AMD Radeon HD 7970 GHz Edition се представя с променлив успех в играта Batman: Arkham City: ако в режими без anti-aliasing GeForce GTX 680 е много бърз, тогава когато е активиран MSAA 8x, дланта отива на новата видеокарта на AMD , което е 7-7 пъти по-бързо от обикновения Radeon HD 7970 9%.

Бойно поле 3


Повишените честоти на новия Radeon също се оказаха подходящи в играта Battlefield 3: където преди това GeForce GTX 680 беше водеща, сега HD 7970 GHz Edition поне не отстъпва, а в режими с антиалиасинг дори леко превъзхожда конкурента.

DiRT Showdown


Е, тук всичко е ясно и без коментар, с енджина DiRT Showdown архитектурата на NVIDIA работи по-малко ефективно и затова търпи пълно фиаско в тази игра на фона на високите резултати на видеокартите на AMD.

Sniper Elite V2 Бенчмарк


Ситуацията е подобна, но все още не толкова ярка, в новия тест Sniper Elite V2. Предимството на AMD Radeon HD 7970 GHz Edition пред GeForce GTX 680 достига впечатляващите 54%.

Традиционно добавяме обобщение към диаграми и графики и преминаваме към обобщени диаграми.

Пивот диаграми

Първата двойка обобщени диаграми ще ни покаже предимството на AMD Radeon HD 7970 GHz Edition с честоти от 1050/6000 MHz пред обикновения Radeon HD 7970 с честоти от 925/5500 MHz:



Средно за всички тестове, увеличението на честотата на GPU с 13,5% и видео паметта с 9,1% донесе на Radeon HD 7970 увеличение на производителността от 9,3-9,6% при резолюция 1920x1080 пиксела и 9,9-10% при резолюция 2560x1440 пиксела . Максималното увеличение е постигнато в игри като Aliens vs. Predator (2010) и Lost Planet 2, и минимален в Metro 2033: The Last Refuge.

Сега нека да разгледаме конфронтацията между AMD Radeon HD 7970 GHz Edition 3 GB и GeForce GTX 680 2 GB при техните номинални честоти:



GeForce GTX 680 все още е по-бърз в полусинтетичните тестове, играта Lost Planet 2, както и отделните режими на Just Cause 2, Hard Reset, Batman: Arkham City и Battlefield 3. В други тестове предимството е на страната на новия AMD Radeon HD 7970 GHz Edition и в игри като Aliens vs. Predator (2010), Sid Meier's Civilization V, Total War: Shogun 2, DiRT Showdown и Sniper Elite V2 е много прилично, но нека не забравяме, че днес много зависи от конкретната игра и нейния двигател, а не само от производителността самата видеокарта.Например, от собствен опит ще кажа, че в изключените по-рано от нашия тестов списък StarCraft II: Wings of Liberty (поради прекомерна зависимост от процесора) и Tom Clancy's H.A.W.X. 2 (поради своята неуместност) GeForce GTX 680 би била водеща, така че всичко е относително.

И накрая, нека сравним производителността на овърклокната AMD Radeon HD 7970 GHz Edition при честоти 1250/6680 MHz и ASUS GeForce GTX 680 TOP при честоти 1217/7168 MHz:



Не може да се каже, че ситуацията се е променила драстично, но GeForce GTX 680, поради по-висок овърклок (в процентно изражение), успя да намали разликата с Radeon HD 7970 GHz Edition, където спечели, и увеличи, където загуби.

Заключение

Да кажем, че новата AMD Radeon HD 7970 GHz Edition вече е най-бързата еднопроцесорна видеокарта, няма да е съвсем правилно, тъй като не разкрихме нейното пълно превъзходство над референтната NVIDIA GeForce GTX 680. Повишените честоти обаче позволиха на това графично решение да надхвърли нивото на производителност на предишната Hi-End AMD видеокарта с 10% и в повечето случаи все още да изпреварва своя конкурент от NVIDIA. Въпреки това, по наше мнение, пускането на AMD Radeon HD 7970 GHz Edition се оказа донякъде „замъглено“, тъй като днес добра дузина фабрични Radeon HD 7970 се предлагат свободно с повишени честоти, а понякога и с честоти над „GHz Edition“. ” ниво. Тоест новият продукт като цяло не изненада никого с представянето си и със сигурност не впечатли никого. Може би най-големи надежди възлагаха на него ентусиастите на овърклок, очаквайки ново стъпало на ядрото Tahiti XT, по-ниското му напрежение и в резултат на това висок потенциал за овърклок. За съжаление, това не беше потвърдено в днешната статия. Надяваме се, че серийните видеокарти ще бъдат по-привлекателни в това отношение. Времето ще покаже.

AMD демонстрира видеокартата Radeon HD 7970 през първата половина на януари. Новият продукт се оказа много успешен и с право оглави списъка на най-производителните едночипови решения на пазара. Сега е моментът да подготвим и пуснем материал за основния конкурент (GTX 680 беше представен вечерта на 22 март), но поради обстоятелства пренебрегнахме лагера на червените през януари. И тази празнина трябва да бъде запълнена. Нека да разгледаме най-доброто решение от AMD, използвайки видеокарта от Gigabyte като пример. Индексът на модела е сложен и не всеки ще го разбере - GV-R797D5-3GD-B - затова ще го пропуснем в нашата статия. Да започнем със спецификациите.

Gigabyte Radeon HD 7970 | Спецификации

Картата е оборудвана с чип с нова архитектура с кодово име Tahiti. Това е първият от серия от архитектури, планирани под кодовото име Южни острови. Вече станахме свидетели на пускането на карти с чипове на Кабо Верде (линия 77xx) след „Tahiti“, а наскоро и на карти от серия 78xx с чипове „Pitcairn“.

Нашите колеги вече казаха много за основните характеристики на новата архитектура, така че не виждаме много смисъл да ги повтаряме. Ние подчертаваме само основните измерими показатели, които могат да представляват интерес за средния потребител, който не навлиза в детайлите на логическата структура на изчислителните единици. Основните характеристики на картите от серията HD 7970, пример за които днес е копието от Gigabyte, са показани в таблицата.

Характеристика Radeon HD 7970 Radeon HD 6970 Nvidia GTX 580
Стандарти за технологични процеси, nm 28 40 40
Площ на кристала, mm² 378 389 530
Очакван брой транзистори, милиона бр. 4300 2640 3000
Честота на ядрото в 2D режим, MHz 150 150 50/100
Честота на ядрото в 3D режим, MHz 925 880 772/1544
Капацитет на паметта, MB 3072 2048
Честота на паметта в 2D, MHz 300 300 67
Честота на паметта в 3D, MHz 5500 5500 4008
Ширина на шината на паметта, битове 384 256 384
Брой шейдъри, бр 2048 1536 512
Брой растерни блокове, бр. 32 32 48
Брой текстурни блокове, бр 128 96 64
Консумирана мощност в 2D, W 3 20 -
Консумирана мощност в 3D (максимална), W 250 250 244
Размери Д x Ш x В, мм 275 x 100 x 37 275 x 100 x 37 270 x 100 x 38

В допълнение към архитектурните промени, които несъмнено са значителни, новият продукт има още едно конкурентно предимство - "фин" технологичен процес. Radeon HD 7970 стана първата видеокарта с чип, произведен в заводите на TSMC по 28 nm стандарти. И това веднага дава възможност за повишаване на ефективността и намаляване на потреблението на енергия на единица производителност. В резултат на това върху чип с площ от 365 mm². успя да гравира повече от четири милиарда транзистора. В Cayman, с площ от 389 mm², той беше малко повече от два и половина, а в случая на сегашния лидер на „зелените“, GTX 580, с гигантски размер на кристала (520 кв. mm) - около 3 милиарда. GTX 680, благодарение на прехода към 28-nm технологичен процес, успя да побере 3,54 милиарда транзистора в много по-малка площ от 294 mm².

Честотата на ядрото се увеличи, но паметта все още работи на същата ефективна честота от 5500 MHz при натоварване. Но ширината на шината на паметта се увеличи до 384 бита, като тази на конкурента GTX 580 (въпреки че за GTX 680 беше решено да се върне към 256-битова шина). Това увеличи честотната лента на паметта до 264 GB в секунда. Капацитетът на паметта също се увеличи с един и половина пъти и достигна три гигабайта.

Ако говорим за изчислителни единици, тогава новият чип е отбелязал количествено увеличение в сравнение с предшественика си. Само дето остават още 32 ROP-а, в таблицата хваща окото интересна цифра - консумация на енергия в 2D режим. Само три вата! Ако е така, Tahiti е най-готиният графичен чип от висок клас, който някога е бил на празен ход.

Radeon HD 7970 стана първото масово произвеждано устройство, което поддържа интерфейса PCI Express 3.0. Много полезно, предвид появата на платформата Intel LGA 2011 и процесорите Sandy Bridge-E. Освен това в края на април ще бъдат пуснати процесори Ivy Bridge, съдържащи контролер PCI Express 3.0. И тогава удвоената честотна лента на интерфейса ще стане по-достъпна. Производителите на дънни платки се подготвят с всички сили, запълвайки пазара с модели с бързи мултиплексори на борда. Естественият въпрос, който възниква е дали HD 7970 ще може да се възползва от PCI Express 3.0? — няма да отговаряме в рамките на тази статия. Но ние обещаваме да допълним материала, след като получим необходимото оборудване на наше разположение.

Gigabyte Radeon HD 7970 | Детайлен оглед

Екземплярите с референтен дизайн не са толкова интересни, колкото видеокартите с охладители и печатни платки по собствен дизайн на производителите. Въпреки това, като проба, отправна точка за прегледи на бъдещи модифицирани ускорители, е необходимо да се „разчлени“ оригиналът. Не се нарича референтна версия за нищо.

Както е обичайно при топ ускорителите, платката е голяма: дължината е 26,5 сантиметра, а охладителната система е двуслотова. Пластмасовият корпус, който прикрива охлаждащите нюанси, е покрит с Gigabyte стикери – принос за разграничаването му от много „клонинги“. Нека обърнем внимание на металната скоба на гърба на платката: тя добавя твърдост към мястото, където охладителят е прикрепен към чипа.

На капака на слота има четири конектора за дисплей: AMD обръща дължимото внимание на конфигурациите с няколко монитора в най-новите поколения видеокарти. Най-често срещаните DVI и HDMI са допълнени с два mini-DP гнезда за щастливите собственици на модерни монитори.

За захранване на видеокартата има два конектора отстрани: шест- и осем-пинови.

На традиционното място има конектори за свързване на видеокарти с мостове в масиви CrossFireX. Вляво, ако се вгледате внимателно, има малък превключвател между два BIOS-а. В картата има два от тях: ако възникнат проблеми с първия по време на експерименти с подмяна на фърмуера или възникнат грешки, можете да преминете към резервния.

Охлаждането се осъществява от вече традиционната медна изпарителна камера, върху която са запоени алуминиеви ребра. И те се издухват от турбинен вентилатор по стандартната схема: въздухът преминава през цялата карта в посока на повишаване на температурата на компонента (от батериите до чипа) и се отстранява през задната стена на кутията. Нашето копие на Gigabyte Radeon HD 7970 вече е било в нечии „грижовни“ ръце: радиаторът под корпуса вече е бил подложен на нечие безмилостно въздействие, видими са натъртвания.

Цялата охладителна система е монтирана в метална рамка и закрепена с болтове в областта на видео чипа. Рамката не само осигурява твърдост, но и премахва топлината от батериите и чиповете памет. Контактът се осъществява чрез термоподложки.

Медната основа на изпарителната камера е грубо обработена.

След отстраняване на излишната термопаста от чипа, платката се появи в следния вид:

В случая на този случай са използвани двугигабитови чипове памет Hynix H5GQ2H24MFR R0C. Номиналната им работна честота е 6 GHz, което е с 500 MHz по-високо от стандартния режим на работа при Radeon HD 7970. Съответно можете да разчитате на овърклок на паметта.

По кристала няма забележки - чиста огледална силиконова повърхност. Но за разлика от флагмана от предишното поколение, в HD 7970 защитната рамка около чипа е станала забележимо по-голяма и го рамкира плътно.

Нека обърнем внимание на подсистемата за захранване. На гърба на картата можете да видите шест фази: пет за самото ядро, една за чиповете памет. В подредения ред от дросели и превключватели има зейнала празнина, където трябваше да присъстват компоненти на още една фаза - в първите инженерни образци всъщност беше, но по някаква причина в продуктите беше решено да се пусне карта с по-малко фази.

Фазовият контрол е поверен на осемканален контролер CHiL CHL8228G, който е познат от предишното поколение видеокарти на AMD.

Отделна фаза захранва логиката на I/O системата; тя се намира по-близо до предната част на платката и се управлява отделно.

Gigabyte Radeon HD 7970 | Тествайте платформа и приложения

Конфигурацията на тестовия стенд е показана в таблицата по-долу. За да вземем показателите, използвахме платформата Sandy Bridge с микропроцесор Intel Core i5 2500K, овърклокнат до 4 GHz.

Ние идентифицирахме конкурентите на Gigabyte Radeon HD 7970 като референтни видеокарти от неговия предшественик от AMD и карта от най-висок клас от Nvidia (включително GTX 680, която все още не беше пусната по време на тестването). Посочената хардуерна конфигурация работи с операционна система Windows 7 Ultimate x64 SP1. Версии на графични драйвери: AMD Catalyst 12.2 и 296.10 за Nvidia карти.

Наборът от тестови приложения и настройки са показани в таблицата по-долу.

Всички игри са заснети с резолюция 1920 x 1080, използвайки изключително DirectX 11 API.

Gigabyte Radeon HD 7970 | Резултати от тестовете

Нека се обърнем към получените резултати. Да започнем със синтетични тестове. В 3DMark 11 Radeon HD 7970 има солидна преднина, пред второто място GTX 580 с една четвърт.

Тестът Unigine Heaven е удобен не само за оценка на цялостната производителност, но и за анализиране на способностите в отделни визуални ефекти, като теселация. Графиката показва разликата в броя на кадрите в режимите на нормална и екстремна теселация.

Както можете да видите, HD 7970 е само малко по-добър от GTX 580. Но предишният лидер в производителността AMD изостава значително. По този начин можете да оцените усилията на инженерите на AMD, които значително подобриха производителността според този показател.

В Crysis 2 новият продукт практически осигури минимален FPS на комфортно ниво. Ако при конкурентните карти са възможни фризове, то при HD7970 те са почти незабележими, картината е гладка и ви позволява да играете удобно.

В Battlefield 3 прогресът на HD 7970 спрямо своя предшественик отново е видим. И GTX изостава.

В Dirt3 резултатите от трите карти са доста плътни и ви позволяват да „шофирате“ удобно. Разпределението на местата е същото: новият продукт е последван от GTX 580 с няколко кадъра назад, а HD6970 все още е малко по-назад.

Meto 2033 все още е буря за видеокарти. Спадовете на FPS се появяват в динамични сцени. Интересното е, че GTX 580 осигурява малко по-висок минимален FPS, но при такива поръчки това не е важно - замръзването все още е повече от осезаемо.

Gigabyte Radeon HD 7970 | температура

AMD внедри технологията ZeroCore Power в новата серия. Това включва значително намаляване на консумацията на енергия в режим на готовност. Максималната консумация на енергия (TDP) е декларирана на нивото на предишното поколение продуктивни решения - 250 W. От една страна, техническият процес е изтънял, а от друга, броят на транзисторите на чипа се е увеличил значително. За загряване на GPU използвахме Unigine Heaven. Резултатите са представени на диаграмата. Температурата на въздуха в помещението, където се проведе тестването, беше 19 градуса по Целзий.

В неактивен режим чипът е с почти десет градуса по-хладен в сравнение с GTX 580. Впечатляващо.

Gigabyte Radeon HD 7970 | Заключение

На примера с Gigabyte Radeon HD 7970 става ясно, че новият продукт на AMD е най-бързото решение на пазара. Съвсем скоро ще разберем дали това лидерство ще продължи повече от два месеца и половина - GTX 680 стартира на 22 март, а скоро ще се появи и в .

Инженерите на AMD свършиха страхотна работа по архитектурата, съдейки по предимството, което чипът Tahiti получи пред Cayman. Технологията ZeroCore също беше впечатляваща. Ще разгледаме възможностите за овърклок на нов, по-тънък чип, след като получим модели със собствен дизайн на производителите. Те са най-интересни в това отношение. Е, съществуващите данни показват, че Tahiti има солиден потенциал за овърклок - повечето чипове могат да работят около марката от 1100 MHz. Но това е тема за отделна статия.

Цената на картата в момента е средно 19 200 рубли (според услугата Yandex.Market). Много или малко, всеки ще реши сам. Но трябва да имате предвид, че същата GTX 580 може да се намери за 12-13 хиляди рубли.