Kartu video. Kartu video Kesimpulan tentang tes sintetis

Teknik pengujian

Pengaturan Pusat Kontrol Katalis AMD
Antialiasing Gunakan pengaturan aplikasi
Penyaringan Anisotropik Gunakan pengaturan aplikasi
Tesselasi Gunakan pengaturan aplikasi
Catalyst A.I., Kualitas Penyaringan Tekstur Kualitas, Aktifkan Pengoptimalan Format Permukaan
Tingkat Detail Mipmap Kualitas
Menunggu vsync Mati, kecuali aplikasi menentukan
Mode Anti-Aliasing AA multi-sampel
Pengaturan Direct3D, Aktifkan Instance Geomery Pada
Tiga penyangga Mati
Pengaturan Panel Kontrol NVIDIA
Oklusi ambien Mati
Penyaringan Anisotropik Aplikasi-dikendalikan
Antialiasing - Koreksi gamma Pada
Antialiasing - Mode Aplikasi-dikendalikan
Antialiasing - Pengaturan Aplikasi-dikendalikan
Antialiasing - Transparansi Mati
CUDA - GPU Semua
Bingkai pra-render maksimum 3
Akselerasi multi-display / GPU campuran Beberapa mode kinerja tampilan
Mode manajemen daya Adaptif
Pemfilteran tekstur - Pengoptimalan sampel anisitropik Mati
Pemfilteran tekstur - Bias LOD negatif Mengizinkan
Penyaringan tekstur - Kualitas Kualitas
Pemfilteran tekstur - Pengoptimalan trilinear Pada
Pengoptimalan berulir Mobil
Buffer tiga kali Mati
Sinkronisasi vertikal Gunakan pengaturan aplikasi 3D
Set tolok ukur
Program API Pengaturan Modus uji Izin
3DMark 2011 DirectX 11 Profil Kinerja, Ekstrim

Unigine surga 2 DirectX 11 Maks. kualitas, DirectX 11, tessellation dalam mode Extreme AF 16x, MSAA 4x 1920х1080 / 2560х1440
Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 Lintasan es. Maks. pengaturan, DirectX 10. AF 16x, MSAA 4x 1920х1080 / 2560х1440
Metro 2033 + Metro 2033 Patokan DirectX 11 Maks. pengaturan, DirectX 11, DOF, tessellation, NVIDIA PhysX mati AF 16x, MSAA 4x 1920х1080 / 2560х1440
DiRT 3 + Alat Patokan Balap Adrenalin DirectX 11 Aspen, 8 mobil. Maks. kualitas, DirectX 11 AF, AA 4x 1920х1080 / 2560х1440
Crysis 2 + Alat Patokan Adrenalin Crysis 2 DirectX 11 Taman Pusat. Maks. kualitas, DirectX 11, tekstur resolusi tinggi AF 16x, Posting MSAA + Edge AA 1920х1080 / 2560х1440
Medan Perang 3 + FRAPS DirectX 11 Awal dari misi Going Hunting. Maks. kualitas AF 16x, MSAA 4x 1920х1080 / 2560х1440
Batman: Kota Arkham. Patokan bawaan DirectX 11 Maks. kualitas AF, MSAA 4x 1920х1080 / 2560х1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 kota Whiterun. Maks. kualitas AF 16x, MSAA 4x 1920х1080 / 2560х1440
Panggilan Tugas: Modern Warfare 3 + FRAPS DirectX 9 Kembali ke Misi Pengirim. Maks. kualitas AF, MSAA 4x 1920х1080 / 2560х1440

Kartu video berikut mengambil bagian dalam pengujian sebagai pesaing Radeon HD 7970 GHz Editon:

  • AMD Radeon HD 7970 (925/5500 MHz, 3 GB)
  • NVIDIA GeForce GTX 680 (1006/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 670 (915/6008 MHz, 2 GB)
  • NVIDIA GeForce GTX 590 (607/3414 MHz, 3 GB)
  • AMD Radeon HD 6990 (880/5000 MHz, 4 GB)

Agar kedua peserta dalam intrik hari ini, Radeon HD 7970 GHz Edition dan GeForce GTX 680, tampil bersenjata lengkap, driver beta terbaru dari NVIDIA (304,48 Beta) dan AMD (Catalyst 12,7 Beta) digunakan dalam pengujian. Selain itu, mode PCI-E 3.0 telah diaktifkan untuk GTX 680, yang tidak didukung secara resmi pada platform Intel X79.

Overclocking, suhu, konsumsi daya

Karena PowerTune tidak menunjukkan dirinya pada frekuensi clock yang diamati, titik awal untuk overclocking adalah Boost Clock - 1050 MHz. Tegangan GPU tidak begitu sederhana. Faktanya adalah bahwa menyesuaikan tegangan di MSI Afterburner (mungkin hal yang sama terjadi dengan utilitas lain, kami belum mencobanya) tidak lagi berpengaruh pada tegangan yang diamati. Untuk meningkatkannya, Anda perlu mencoba mengatur yang lebih tinggi permanen tegangan menggunakan opsi yang sesuai. Tapi, betapapun anehnya tampilannya, tegangan tidak berhenti berfluktuasi dari ini, hanya nilai yang diamati yang bergeser ke atas. Dengan demikian, kita tidak dapat memperbaiki tegangan, tetapi kita dapat menggeser rentang perubahannya. Akibatnya, jika Anda mengatur tegangan secara manual ke 1,3 V, maka rentang osilasi akan menjadi sekitar 1,227 - 1,252 V.

Perlu dicatat bahwa dalam beberapa kasus, ketika bermain dengan utilitas overclocking dan pemantauan yang berbeda, tegangan tetap pada 1,3 V, tetapi kemudian, tampaknya, Power Tune menjadi gila, dan artefak yang kuat muncul di layar dalam 3D terlepas dari GPU frekuensi. Tampaknya Anda tidak boleh mencoba mengatasi Power Tune, terutama karena ia melakukan tugasnya dengan cukup baik.

Jika kita menganggap Boost Clock dari adaptor baru sebagai frekuensi GPU standar di "Radeon" lainnya (dan dari sudut pandang prinsip operasi Power Tune, memang demikian), Edisi HD 7970 GHz di-overclock bahkan lebih baik daripada biasa HD 7970: hingga 1240 MHz untuk prosesor dan 7320 (1830) MHz dari memori. Jika kita mengurangkan rentang Power Tune Boost 50 MHz dari 1240 MHz, kita mendapatkan frekuensi yang dapat dijangkau oleh banyak sampel tugas standar HD 7970. Namun, bukan fakta bahwa kartu tersebut benar-benar pernah mencapai 1240 MHz ini, dan tidak terus-menerus dibatasi. Sampai utilitas pemantauan mendapatkan akses ke nyali Power Tune, ini akan tetap menjadi misteri.

Overclocking memori yang fantastis hanya karena pengontrol yang sangat baik dari chip Tahiti dan chip memori, tampaknya sedikit lebih unggul daripada yang dilengkapi dengan HD 7970 standar.

Edisi HD 7970 GHz memanas sedikit lebih banyak daripada versi standar - hampir sama dengan GeForce GTX 680. Sistem pendingin, dihidupkan dengan kecepatan penuh, memungkinkan mempertahankan suhu yang sama selama overclocking yang kuat seperti dalam mode normal, tetapi hanya dengan biaya kebisingan yang sangat besar. Kami akui bahwa bahkan dengan kontrol kipas otomatis, Edisi HD 7970 GHz jauh lebih berisik daripada GeForce GTX 680.

Konsumsi daya maksimum yang tercatat dari kartu, seperti yang diharapkan, masih sedikit meningkat dibandingkan dengan HD 7970 biasa. Kami tidak berpikir AMD menipu, mengklaim bahwa TDP kedua versi HD 7970 tidak berbeda. Rupanya, Edisi HD 7970 GHz hanya menguasainya lebih aktif. Saat di-overclock, jelas, konsumsi daya melonjak ke langit-langit. Catu daya yang kuat tidak akan mengganggu.

Radeon HD 7970 GHz Edition vs GeForce GTX 680

Ini adalah hasil yang semuanya dimulai. Jadi, apakah AMD berhasil merebut kembali kepemimpinannya yang sulit dipahami?

GeForce GTX 680 masih berkinerja lebih baik daripada HD 7970 tanpa overclock, tetapi lebih cepat di antara kartu Radeon yang di-overclock.

bermain gametes+ Unigine Surga

Pada resolusi 1920 × 1080, Radeon HD 7970 GHz Edition unggul dalam tiga dari sembilan benchmark game (Crysis Warhead, DiRT 3, Metro 2033). Di tiga lainnya, GeForce GTX 680 menang (Unigine Heaven 2, Battlefield 3, Skyrim). Di sisa pertandingan, tidak ada perbedaan signifikan antara rival. Hasil imbang yang sempurna. Dalam mode 2560x1440, situasinya melebihi HD 7970. Hanya di CoD 3 dan Unigine Heaven, GTX 680 mempertahankan keunggulannya.

Overclocking diberikan ke kartu AMD lebih baik daripada GTX 680: peningkatan kinerja terasa lebih tinggi, dan sebagai hasilnya, Edisi HD 7970 GHz membalas bahkan pada 1920x1080.

Radeon HD 7970 GHz Edition versus semua

  • Sangat disayangkan untuk AMD, tetapi pada 3DMark 2011 Radeon HD 7970 GHz Edition tidak hanya kalah dengan GeForce GTX 680, tetapi juga dengan GTX 670.
  • Keuntungan dari Edisi GHz dibandingkan versi standar terlihat.

Unigine surga 2

  • Edisi GHz menambahkan beberapa FPS pada HD 7970 biasa.
  • Pada 2560x1440 GeForce GTX 670 dan GTX 680 memiliki keunggulan minimal, tetapi pada 1920 × 1080 HD 7970 GHz Edition sudah terasa tertinggal.
  • Edisi GHz yang di-overclock mengalahkan Radeon HD 6990 dan dibandingkan dengan GTX 670 dan GTZ 680.

Crysis Warhead (DirectX 10)

  • Dalam pengujian ini, bahkan HD 7970 biasa dengan mudah mengalahkan GeForce GTX 680 karena bandwidth memori yang lebih tinggi.
  • Edisi HD 7970 GHz bahkan sedikit lebih buruk daripada GeForce GTX 590, dan Edisi GHz yang di-overclock setara dengan Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Keunggulan Edisi HD 7970 GHz dibandingkan versi biasa adalah kecil.
  • Edisi HD 7970 GHz terasa lebih cepat daripada GeForce GTX 680.
  • Dalam overclocking, GHz Edition mencapai level GeForce GTX 590 dan Radeon HD 6990.

DiRT 3 (DirectX 11)

  • Edisi HD 7970 GHz jauh lebih unggul daripada versi standar.
  • Edisi GHz juga terasa lebih cepat daripada GTX 680, dengan kinerja yang sebanding dengan Radeon HD 6990 dan GeForce GTX 590.

Crysis 2 (DirectX 11)

  • Dalam mode 2560x1440, ada peningkatan kinerja yang nyata dibandingkan dengan HD 7970 biasa.
  • Pada 2560x1440, Edisi HD 7970 GHz juga mengungguli GeForce GTX 680, dan kartu yang di-overclock meninggalkan GTX 590 dan menyamai Radeon HD 6990.
  • Dalam mode 1920x1080, peserta tes mencapai batas 100 FPS yang ditetapkan di Crysis 2.

Medan Perang 3 (DirectX 11)

  • Dan sekali lagi, Edisi HD 7970 GHz telah meningkatkan FPS secara nyata dibandingkan dengan HD 7970 standar.
  • Kebaruan ini setara dengan GTX 670 dan GTX 680.
  • Edisi HD 7970 GHz yang di-overclock terlalu tangguh bahkan untuk GTX 590.

Batman: Arkham City (DirectX 11)

  • Frase ajaib GHz Edition sekali lagi memberikan HD 7970 dorongan FPS yang baik.
  • Dalam mode 1920x1080, kartu ini setara dengan GTX 680, dan pada 2560x1440 kartu ini melampauinya.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • Tidak perlu membicarakan perbedaan signifikan antara HD 7970, HD 7970 GHz Edition dan GeForce GTX 680 dalam game ini: setelah batas tertentu, mesin Skyrim tidak dapat lagi menggunakan daya komputasi tambahan.

Panggilan Tugas: Modern Warfare 3 (DirectX 9)

  • Dibandingkan dengan versi standar HD 7970, Edisi GHz memiliki peningkatan besar dalam kecepatan bingkai.
  • Namun demikian, hanya GeForce GTX 670 yang merupakan saingan setara untuk produk baru, bukan GTX 680.

Kesimpulan

Untuk AMD, untuk pertama kalinya sejak masa lalu Radeon X1950 XTX, saatnya telah tiba ketika kartu video kelas atas setidaknya sebagus flagship NVIDIA dari generasi yang sama. Edisi HD 7970 GHz umumnya bahkan sedikit lebih cepat daripada GeForce GTX 680 dalam mode grafis berat (seperti 2560x1440) - berkat bus memori 384-bit. Selain itu, setelah overclocking pabrik, masih memiliki cadangan frekuensi yang signifikan. Teknologi Power Tune yang diperbarui memiliki efek menguntungkan pada potensi overclocking GPU, dan memori telah di-overclock menjadi jauh lebih baik. Di kartu masa depan dari NVIDIA dan AMD, kita pasti akan melihat perkembangan pesat dari teknologi kontrol frekuensi dan tegangan dinamis, seperti yang telah terjadi dengan CPU.

Faktanya, dalam versi aslinya, HD 7970 adalah kartu yang sangat kuat, dan sebagian besar sampel dapat dengan mudah mencapai frekuensi seperti itu di mana Anda dapat mengejar dan menyalip GeForce GTX 680. Edisi GHz sebagian besar merupakan produk fashion untuk keduanya. pemilik dan produsen ... ... AMD meng-overclock HD 7970 cukup untuk menyamai GTX 680 dan tetap dalam TDP yang sama. Tes konsumsi daya kami dengan jelas menunjukkan apa yang akan terjadi jika pengembang menetapkan sendiri tujuan kemenangan tanpa syarat atas unggulan NVIDIA.

Sayangnya, AMD telah kehilangan keunggulan khusus dibandingkan kartu NVIDIA di segmen High-End, yang telah digunakan dalam beberapa tahun terakhir - konsumsi daya. Jika sebelumnya Radeon top-end tidak dapat mengalahkan kinerja GeForce GTX 480 dan GTX 580, tetapi mereka mengkonsumsi lebih sedikit dan memanas, sekarang ada undian dalam tolok ukur, tetapi TDP Radeon HD 7970 GHz Edition adalah sebagai sebanyak 55 W lebih tinggi dari GTX 680.

Dan satu pertanyaan lagi. Keberadaan dua kartu yang identik secara fisik dengan perangkat lunak berbeda di jajaran Radeon sudah terlihat jelek. Apa yang dibayar oleh pembeli HD 7970 GHz Edition, jika hampir hal yang sama dapat dicapai dengan overclocking ringan pada HD 7970 standar, dan mengapa pemilik yang terakhir tidak mendapatkan firmware baru? Karena BIOS kartu video tidak dapat diperbarui semudah driver, akan lebih baik jika Edisi HD 7970 GHz sepenuhnya menggantikan pendahulunya. Yah, murni dari sudut pandang harmoni dunia.

Teknik pengujian
Pengaturan Driver AMD Catalyst - Default
Antialiasing Pengaturan aplikasi
Penyaringan Anisotropik Pengaturan aplikasi
Tesselasi AMD Dioptimalkan
Katalis A.I. Kualitas filter tekstur Kualitas, Aktifkan Pengoptimalan Format Permukaan
Menunggu vsync Nonaktifkan, kecuali aplikasi Menentukan
Modus AA banyak sampel
Tiga penyangga Cacat
Pengaturan driver NVIDIA
GPU CUDA Semuanya
Penyaringan anisotropik Manajemen aplikasi
Sinkronisasi vertikal Gunakan pengaturan aplikasi 3D
Pencahayaan latar belakang bayangan Mati
Jumlah maksimum personel pra-terlatih 3
Pengoptimalan aliran Mobil
Mode manajemen daya Adaptif
Anti-aliasing - koreksi gamma Mati
Anti-aliasing - mode Kontrol aplikasi
Buffer tiga kali Mati
Akselerasi beberapa tampilan Mode kinerja multi-tampilan
Pemfilteran tekstur - pengoptimalan anisotropik Mati
Penyaringan tekstur - kualitas Kualitas
Pemfilteran tekstur - deviasi UD negatif Mengizinkan
Pemfilteran tekstur - optimasi trilinear termasuk
ProgramAPIPengaturanMode ujiIzin
3DMark Vantage DirectX 10 Profil Performa, Tinggi, Ekstrim
3DMark 11 DirectX 11 Profil Kinerja, Ekstrim
Unigine surga 2 DirectX 11 Detail maksimum, DirectX 11, tessellation dalam mode Extreme Tanpa AA dan AF / AA 4x, AF 16x 1920х1080 / 2560х1440
Crysis 2 + Alat Patokan Adrenalin Crysis 2 DirectX 11 Peta Pusat Kota / Adrenalin. Maks. detail, tekstur resolusi tinggi, DirectX 11 Tepi AA 1920х1080 / 2560х1440
Far Cry 2 + Alat Tolok Ukur Far Cry 2 DirectX 10 Peternakan Peta Kecil. Maks. merinci Tanpa AA / AA 4x 1920х1080 / 2560х1440
Metro 2033 + Metro 2033 Patokan DirectX 11 Detail maksimum, DirectX 11, DOF, tessellation, NVIDIA PhysX off AA analitis, AF 4x / MSAA 4x, AF 16x 1920х1080 / 2560х1440
Alien versus Predator + Alat Tolok Ukur Alien vs Predator DirectX 11 Detail maksimal, DirectX 11 Tanpa AA dan AF / AA 4x, AF 16x 1920х1080 / 2560х1440
DiRT 3 DirectX 11 Detail maksimal Tanpa AA dan AF / AA 4x, AF 16x 1920х1080 / 2560х1440
mafia 2 DirectX 11 Detail maksimal, NVIDIA PhysX mati Tanpa AA, AF 1x / AA aktif, AF 16x 1920х1080 / 2560х1440
Hanya Sebab 2 DirectX 10 Detail maksimum, Filter Bokeh mati, Detail Air yang Disempurnakan mati. Tanpa AA, AF 2x / AA 4x, AF 16x 1920х1080 / 2560х1440

Kartu video berikut mengambil bagian dalam pengujian sebagai saingan Radeon HD 7970:

  • AMD Radeon HD 6970 (880/5500)
  • Radeon HD 6990 (880/5000)
  • NVIDIA GeForce GTX 580
  • NVIDIA GeForce GTX 590

Overclocking, suhu, konsumsi daya

AMD telah berjanji bahwa prosesor HD 7970 akan melakukan overclock hingga 1 GHz dan lebih tinggi tanpa masalah, yang dapat dengan mudah dipercaya, karena 75 MHz dengan proses teknis baru bukanlah pencapaian yang luar biasa. Tetapi sampel pengujian kami dengan mudah menambahkan 200 MHz (!) Di atas frekuensi GPU nominal, dan memori di-overclock dari 5500 hingga 6300 MHz efektif, semuanya tanpa menaikkan voltase. Overclocking lebih lanjut mengalami keterbatasan fungsi Overdrive, dan tidak mungkin untuk mengatasinya menggunakan trik terkenal dengan kunci registri dan utilitas overclocking pihak ketiga. HD 7970 bahkan tidak mengizinkan BIOS untuk dibaca menggunakan perangkat lunak yang ada, jadi catatan sebenarnya masih ada di depan.

Sepertinya Radeon HD 7970 tidak terlalu berbeda dari HD 6970 dalam hal TDP. Konsumsi daya sistem di bawah beban persis sama, dan dalam mode 2D, HD 6970 bahkan lebih haus daya. Overclocking sedikit menambah konsumsi daya, tetapi hasilnya masih jauh lebih rendah daripada pesaing lainnya - HD 6990 dan akselerator GeForce "berkepala dua".

Selain itu, HD 7970 ternyata menjadi kartu terdingin dari semua peserta tes. Bahkan pada overclocking maksimum, panasnya kurang dari HD 6970. Dan karena konsumsi daya kartunya sama, kami harus berterima kasih kepada sistem pendingin yang baru. Efeknya sangat terasa jika Anda menurunkan frekuensi prosesor HD 7970 ke level HD 6970.

Performa, tes sintetis

  • Radeon HD 7970 mengungguli HD 6970 dan GeForce GTX 580 dengan selisih yang besar di semua mode. Hanya kartu video "berkepala dua" yang bekerja lebih cepat.
  • HD 7970 yang di-overclock sebanding dalam kinerjanya dengan GeForce GTX 590, meskipun HD 6990 masih unggul. Yang terakhir umumnya memiliki hasil yang sangat tinggi, yang sekali lagi menimbulkan pertanyaan tentang kebenaran algoritme yang digunakan 3DMark Vantage untuk menghitung poin. Ini bukan pertama kalinya kami menemukan artefak yang tidak dapat dijelaskan dalam tes ini.

  • HD 7970 mengungguli semua pesaing selain HD 6990, bahkan tanpa overclocking.
  • Saat di-overclock, perbedaan antara HD 7970 dan flagship dual-GPU lama sangat menyempit.

Performa, tes permainan

Unigine surga 2

  • HD 7970 memiliki keunggulan kolosal, hampir dua kali lipat dibandingkan HD 6970. Dapat dilihat bahwa AMD telah melakukan pekerjaan yang baik dalam tessellation.
  • GeForce GTX 580 memiliki performa yang sebanding.
  • Berkat overclocking, HD 7970 mencapai level HD 6990, tetapi kurang dari GTX 590.

Krisis 2

  • Perbedaan antara hasil HD 7970 dan HD 6970 hampir dua kali lipat.
  • HD 7970 terlihat lebih unggul dari GeForce GTX 580.
  • Tanpa overclocking, kinerja HD 7970 sebanding dengan HD 6990, dan dengan overclocking, kinerjanya dapat menyamai GeForce GTX 590.

Alien vs Predator

  • HD 7970 memiliki keunggulan 25% dibandingkan HD 6970.
  • GeForce GTX 580 bahkan tertinggal dari Radeon HD 6970 dalam mode AA dan AF.
  • Kartu video dual-chip terasa lebih cepat daripada produk baru, dan bahkan overclocking tidak memungkinkan mereka untuk mengejar ketinggalan.

  • HD 6970 berkinerja baik dalam benchmark ini, oleh karena itu keunggulan HD 7970 lebih besar, tetapi tidak berlebihan.
  • GeForce GTX 580 dapat dengan mudah mengalahkan HD 7970 pada 1920x1080, tetapi gagal pada 2560x1440.
  • Kartu grafis prosesor ganda berada di luar jangkauan HD 7970 bahkan saat di-overclock.

Metro 2033

  • HD 7970 tidak kurang dari sepertiga lebih cepat dari HD 6970.
  • GeForce GTX 580 masih menunjukkan hasil yang baik dan tidak jauh tertinggal dengan produk barunya.
  • SLI dan CrossFire bekerja dengan sempurna, bahkan dengan overclocking, HD 7970 tidak dapat mengunggulinya, meskipun mendekati HD 6990.

Jauh menangis 2

  • HD 7970 20-25% lebih cepat dari HD 6970.
  • HD 7970 secara signifikan di depan GeForce GTX 580.
  • GTX 590 dan HD 6990 berada pada ketinggian yang tak terjangkau untuk HD 7970, bahkan setelah overclocking.

VLIW4 vs GCN

Terakhir, kami menjalankan Radeon HD 7970 melalui pengujian game pada frekuensi yang sama dengan Radeon HD 6970. Diagram dengan jelas menunjukkan keunggulan yang diberikan oleh arsitektur GCN baru itu sendiri dibandingkan dengan VLIW4.

kesimpulan

AMD telah menciptakan GPU dari awal yang sangat berbeda dari apa pun yang telah dirilis di bawah merek Radeon selama beberapa tahun terakhir. Dalam hal skala perubahan, acara ini sebanding dengan implementasi arsitektur shader terpadu VLIW5 dalam chip R600 (Radeon HD 2900). Tetapi jika Anda ingat betapa sulitnya jalan yang harus dilalui VLIW5 sebelum kemungkinan yang melekat di dalamnya terungkap, maka akan terlihat bahwa kali ini semuanya benar-benar berbeda.

Arsitektur GCN, yang diwakili oleh chip Tahiti, sudah menjadi produk yang matang dan sangat efisien. Radeon HD 7970 20-50% lebih cepat dari flagship chip tunggal AMD generasi sebelumnya dan dengan mudah mengatasi pesaing utama - GeForce GTX 580. Pada saat yang sama, terlepas dari kenyataan bahwa Tahiti adalah GPU besar yang belum pernah ada sebelumnya. kompleksitas, kartu tidak mengkonsumsi daya lebih dari HD 6970, dan memiliki langit-langit yang lebih tinggi untuk overclocking. Dan ketika di-overclock, performanya sudah mendekati level dual-processor adapter Radeon HD 6990 dan GeForce GTX 590.

Perhatikan bahwa posisi arsitektur Fermi masih kuat dalam tugas dengan penggunaan aktif DirectX 11. Dalam beberapa game, GTX 580 hanya sedikit lebih rendah dari produk baru dari AMD, jadi NVIDIA masih memiliki setiap kesempatan untuk membalas dendam tahun depan. Akan sama menariknya untuk melihat bagaimana AMD, selangkah demi selangkah, membawa GPU lebih dekat ke prosesor tujuan umum. CUDA NVIDIA telah mendapatkan kemajuan besar selama bertahun-tahun, tetapi sekarang AMD memiliki arsitektur grafis yang sama kuatnya, serta prosesor Fusion, yang cepat atau lambat juga akan menerima inti GCN tertanam.

  • Bagian 2 - Pengantar praktis
  • Bagian 3 - Hasil Tes Game (Kinerja)

Di bagian ini, seperti biasa, kami akan memeriksa kartu video itu sendiri, serta berkenalan dengan hasil tes sintetis.

Membayar

  • GPU: Radeon HD 7970 (Tahiti)
  • Antarmuka: PCI Express x16
  • Frekuensi GPU (ROP): 925 MHz (nominal - 925 MHz)
  • Frekuensi memori (fisik (efektif)): 1375 (5500) MHz (nominal - 1375 (5500) MHz)
  • Lebar bus memori: 384 bit
  • Unit Komputasi GPU / Frekuensi Unit: 32/925 MHz (nominal - 32/925 MHz)
  • Jumlah operasi (ALU) per blok: 64
  • Jumlah total operasi (ALU): 2048
  • Satuan tekstur: 128 (BLF / TLF / ANIS)
  • unit ROP: 32
  • Ukuran: 285 × 100 × 33 mm (angka terakhir adalah ketebalan maksimum kartu video)
  • warna PCB: merah
  • Konsumsi Daya (Puncak 3D / 2D / Tidur): 215/70/3 Watt
  • Jack keluaran: 1 × DVI (Dual-Link / VGA), 1 × HDMI 1.4a, 2 × Mini-DisplayPort 1.2
  • Dukungan multiprosesor: CrossFire X (Perangkat Keras)

AMD Radeon HD 7970 3072MB 384-bit GDDR5 PCI-E

Kartu ini memiliki 3072 MB GDDR5 SDRAM yang terletak di 12 chip di sisi depan PCB.

Karena tidak memiliki tolok ukur DirectX 11 sintetis kami sendiri, kami kembali menggunakan contoh dari Microsoft dan AMD SDK dan demo Nvidia. Yang pertama adalah HDRToneMappingCS11.exe dan NBodyGravityCS11.exe dari DirectX SDK (Februari 2010).

Kami juga mengambil aplikasi dari kedua produsen: Nvidia dan AMD. Sampel DetailTessellation11 dan PNTriangles11 diambil dari ATI Radeon SDK (mereka juga ada di DirectX SDK). Selain itu, kami menggunakan program demo dari Nvidia - Realistic Water Terrain, juga dikenal sebagai Island11 (oleh Timofey Cheblokov, spesialis terkenal dalam grafik 3D).

Tes sintetis dilakukan pada kartu video berikut:

  • Radeon HD 7970 HD 7970)
  • Radeon HD 6990 dengan parameter standar (selanjutnya: HD 6990)
  • Radeon HD 6970 dengan parameter standar (selanjutnya: HD 6970)
  • Radeon HD 5870 dengan parameter standar (selanjutnya: HD 5870)
  • Geforce GTX 590 dengan parameter standar (selanjutnya: GTX 590)
  • Geforce GTX 580 dengan parameter standar (selanjutnya: GTX 580)

Untuk membandingkan hasil kartu video terbaru Radeon HD 7970, model khusus ini dipilih karena berbagai alasan. Radeon HD 6970 diambil sebagai pendahulu langsung dari segmen teratas, HD 6990 - sebagai solusi terkuat (meskipun dua chip) berdasarkan arsitektur GPU sebelumnya, kami menambahkan HD 5870 untuk mengevaluasi pertumbuhan antara dua pembaruan arsitektur yang berbeda dan sebagai GPU persis setengah kompleksitas dari Tahiti.

Solusi yang dipilih Nvidia diambil karena Geforce GTX 580 adalah model chip tunggal tercepat perusahaan, berdasarkan generasi GPU terbaru. Meski bukan pesaing dari video card AMD yang dihadirkan dari segi harga, namun hasilnya menarik karena sudah maksimal untuk solusi single-chip dari Nvidia saat ini. Dan dual-GPU GTX 590 adalah varian ekstrim dari perusahaan ini dengan label harga yang lebih tinggi. Dalam benchmark DirectX 11 kami, kami juga menggunakan Geforce GTX 560 Ti, yang diperlukan untuk mengevaluasi peningkatan kinerja geometris GPU baru AMD.

Direct3D 9: Benchmark Pengisian Piksel

Tes ini menentukan kecepatan texel puncak dalam mode FFP untuk sejumlah tekstur berbeda yang diterapkan pada satu piksel:

Dalam pengujian usang kami untuk memfilter tekstur 32-bit dari RightMark, sebagian besar kartu video menunjukkan angka yang jauh dari kemungkinan secara teoritis. Hasil sintetis tekstur dalam kasus kartu video Radeon HD 7970 tidak mencapai nilai puncak, jadi kami akan sekali lagi mempertimbangkan kecepatan tekstur dengan angka dari uji 3DMark Vantage, yang selalu memberikan angka yang lebih realistis.

Dalam kasus kami, ternyata HD 7970 hanya memilih hingga 80 texel per jam dari tekstur 32-bit dengan pemfilteran bilinear, yang secara signifikan lebih rendah daripada angka teoritis 128 texel yang difilter. Jika tidak, semuanya ternyata dapat diprediksi - semua papan AMD menunjukkan kinerja yang lebih tinggi dan mengungguli kartu video Nvidia. Memang, bahkan chip tunggal top-end Geforce GTX 580 hanya memiliki 64 TMU dan oleh karena itu jauh lebih rendah daripada model yang didasarkan pada chip Tahiti, yang memiliki 128 TMU yang beroperasi pada frekuensi yang lebih tinggi. Oleh karena itu, perbedaannya lebih dari dua kali lipat. Nah, dual-GPU GTX 590 dalam pengujian ini jelas menunjukkan hasil yang tidak memadai.

Versi motherboard dengan dua GPU dari AMD juga jelas tidak berfungsi dengan benar dalam pengujian kami, karena HD 7970 hampir selalu mengunggulinya. Nah, model baru menyalip pendahulunya sekitar 30%, yang sedikit lebih buruk daripada nilai yang mungkin secara teoritis. Namun, dalam kasus dengan sejumlah kecil tekstur, ketika bandwidth memori paling mempengaruhi, hasilnya bahkan lebih rendah - sekitar 25%.

Mari kita pertimbangkan hasil yang sama dalam tes fillrate:

Angka-angka menunjukkan tingkat pengisian, dan di dalamnya kita melihat semuanya sama, kecuali dengan mempertimbangkan jumlah piksel yang ditulis ke buffer bingkai. Hasil maksimal hampir selalu tetap dengan kartu video top-end baru dari keluarga Radeon HD 7900. Ini memiliki rekor jumlah TMU yang beroperasi pada frekuensi yang lebih tinggi dan lebih efisien dalam pengujian sintetis kami. Pindah ke teks shader piksel sederhana.

Direct3D 9: Tolok ukur Pixel Shaders

Kelompok pertama pixel shader yang kami pertimbangkan sangat sederhana untuk chip video modern; ini mencakup berbagai versi program piksel dengan kompleksitas yang relatif rendah: 1.1, 1.4, dan 2.0, yang ditemukan di game lama.

Tes ini terlalu sederhana untuk GPU modern dan sebagian besar dibatasi oleh performa tekstur dan terkadang fillrate. Oleh karena itu, mereka tidak menunjukkan semua kemampuan chip video modern, tetapi mereka menarik dari sudut pandang aplikasi game yang sudah ketinggalan zaman. Dalam dua pengujian paling sederhana, Radeon HD 7970 baru hampir mengejar dual-GPU HD 6990, tetapi dalam pengujian yang lebih kompleks, Radeon HD 7970 dan HD 6970 berada. Sangat menarik bagaimana perilaku pengujian pada GPU arsitektur yang berbeda berbeda. Dan di sini Tahiti agak lebih dekat dengan GF110 daripada pendahulunya. Secara alami, tidak secara absolut, perbedaannya sangat besar - dari satu setengah hingga dua kali lipat.

Performa dalam pengujian lain sebagian besar dibatasi oleh kecepatan unit tekstur dan kecepatan pengisian, sehingga Radeon HD 7970 baru sekitar 30-40% lebih cepat dari HD 6970 sebelumnya, yang sejalan dengan teori. Semua papan AMD mengungguli kedua model Geforce kelas atas, kecuali bahwa perbandingan HD 5870 dan GTX 590 tidak sesederhana itu. Kurangnya kecepatan tekstur jelas merupakan penyebab kegagalan Nvidia dalam pengujian ini. Tetapi bahkan pixel shader pencahayaan dengan tiga sumber Phong, yang lebih bergantung pada kinerja matematis GPU, ketika diluncurkan pada GF110 jauh lebih rendah daripada Cayman dan terlebih lagi pada Tahiti.

Mari kita lihat hasil program piksel yang lebih kompleks dari versi menengah:

Jadi kali ini ternyata hampir sama, HD 7970 secara kasar berada di antara model chip tunggal dan dua chip berdasarkan Cayman dari seri HD 6900. Tes Cook-Torrance lebih intensif secara komputasi, dan perbedaan di dalamnya kira-kira sesuai dengan perbedaan jumlah ALU dan frekuensinya. Oleh karena itu, tes ini lebih cocok untuk arsitektur AMD, yang chipnya memiliki jumlah unit matematika yang lebih banyak, dan Tahiti tidak terkecuali.

Menariknya, HD 5870 mengungguli HD 6970 dalam pengujian ini, dan tampaknya hal ini terjadi karena efisiensi eksekusi yang lebih buruk dari shader ini pada chip yang lebih baru dengan arsitektur VLIW4. Jadi, meskipun Radeon HD 7970 baru mengungguli HD 6970, itu hanya 20% lebih cepat daripada HD 5870 dalam pengujian ini.

Yang kedua, lebih bergantung pada kecepatan tekstur, tes rendering prosedural air "Air" digunakan pengambilan sampel dependen dari tekstur pada tingkat bersarang yang besar, dan kartu video di dalamnya diberi peringkat berdasarkan kecepatan tekstur, disesuaikan untuk efisiensi pemanfaatan TMU yang berbeda. Dalam pengujian ini, solusi AMD selalu bekerja dengan baik, dan HD 7970 memberikan hasil yang sangat baik, meskipun lebih buruk dari dual-GPU HD 6990, tetapi jauh lebih baik daripada pendahulunya di Cayman. Papan Nvidia chip tunggal teratas lebih dari 2,5 kali di belakang!

Direct3D 9: Benchmark Pixel Shaders 2.0

Pengujian DirectX 9 pixel shader ini lebih rumit dari yang sebelumnya, mereka mendekati apa yang kita lihat di game multi-platform, dan terbagi dalam dua kategori. Mari kita mulai dengan shader sederhana versi 2.0:

  • Pemetaan Paralaks- metode pemetaan tekstur yang akrab dengan sebagian besar game modern, dijelaskan secara rinci dalam artikel.
  • Gelas Beku- tekstur prosedural kompleks kaca beku dengan parameter yang dapat dikontrol.

Ada dua varian shader ini: dengan fokus pada perhitungan matematis dan dengan preferensi untuk mengambil nilai dari tekstur. Pertimbangkan opsi intensif matematis yang lebih menjanjikan dari sudut pandang aplikasi masa depan:

Ini adalah tes universal yang bergantung pada kecepatan ALU dan kecepatan tekstur; keseimbangan keseluruhan chip penting di dalamnya, serta efisiensi eksekusi program yang kompleks. Dan kinerja kartu video AMD baru dalam pengujian Frozen Glass ternyata tidak hanya bagus, tetapi juga luar biasa! Inilah yang dimaksud dengan peningkatan efisiensi GPU baru. Pada pengujian pertama, Radeon HD 7970 ternyata terasa lebih cepat bahkan dibandingkan dengan dual-GPU HD 6990. Dan bahkan kartu Nvidia dual-GPU tertinggal jauh, belum lagi Geforce GTX 580.

Dalam pengujian kedua "Pemetaan Paralaks" solusi Nvidia terasa sedikit lebih baik, dan GTX 580 hampir mencapai HD 6970. Tetapi HD 7970 yang disajikan hari ini sangat jauh - AMD baru 80% di depan papan Nvidia terbaik, yang jelas berbicara tentang pengaruh dan perhitungan matematis dan kecepatan tekstur. Menariknya, HD 5870 yang sangat lama sekali lagi lebih cepat daripada HD 6970. Dan HD 7970 baru telah mengungguli pendahulunya sebesar 60%, yang jelas tidak dapat dibenarkan dengan angka teoritis yang kering. Hal ini disebabkan oleh efisiensi yang lebih besar dari arsitektur skalar, dibandingkan dengan VLIW.

Namun, dalam kasus kartu video AMD, semuanya menjadi sangat sulit karena PowerTune. Lagi pula, tes sintetis "memuat" GPU dengan perhitungan yang sangat berat, dan konsumsi daya papan dengan dukungan PowerTune dalam sintetis mungkin melampaui batas yang ditetapkan. Akibatnya, kecepatan clock GPU juga dapat turun, dan dengan itu hasilnya akan ditampilkan lebih rendah dari yang diharapkan. Mari kita pertimbangkan pengujian yang sama yang dimodifikasi dengan preferensi sampel dari tekstur hingga perhitungan matematis:

Untuk kedua kartu video Nvidia, situasinya menjadi lebih menyedihkan, karena semua chip AMD modern memiliki kecepatan tekstur yang jauh lebih baik, dan dalam pengujian ini mereka hanya meningkatkan keunggulan yang tak terbantahkan. Bahkan GTX 590 dual-GPU tidak dapat bersaing dengan single-GPU HD 6970 di kedua pengujian dengan penekanan pada tekstur, belum lagi GTX 580. Dan board dari keluarga Radeon HD 7900 yang disajikan hari ini ternyata menjadi yang tercepat di antara yang lainnya. kartu GPU tunggal, hanya menghasilkan HD 6990. Perbedaan antara HD 7970 dan HD 6970 ternyata 26-28%, yang secara teoritis dapat dijelaskan dengan baik, karena perbedaan kecepatan tekstur pada produk baru sedikit lebih besar.

Tapi ini adalah tugas yang sudah ketinggalan zaman, terutama dengan penekanan pada tekstur, dan terkadang pada fillrate. Selanjutnya, kita akan melihat hasil dari dua tes pixel shader lagi - tapi kali ini versi 3.0, tes pixel shader yang paling kompleks untuk Direct3D 9 API. Mereka paling indikatif dalam hal game PC modern, banyak di antaranya multiplatform. Tesnya berbeda karena memuat ALU dan unit tekstur berat, kedua program shader rumit dan panjang, dan mencakup sejumlah besar cabang:

  • Pemetaan Paralaks Curam- versi yang jauh lebih "berat" dari teknik pemetaan paralaks, juga dijelaskan dalam artikel Terminologi grafis 3D modern.
  • Bulu- shader prosedural yang membuat bulu.

Dalam pengujian DX9 yang paling sulit dari RightMark, kartu video dari Nvidia selalu berkinerja sangat kuat, berbeda dengan semua pengujian sebelumnya dalam ulasan kami. Tes ini tidak terbatas pada kinerja pengambilan tekstur, tetapi lebih bergantung pada efisiensi eksekusi kode shader. Dan sebelumnya, Radeon HD 6970 dengan jelas meningkatkan posisi AMD dalam pengujian ini, meningkatkan efisiensi saat berpindah dari arsitektur VLIW5 ke VLIW4.

Nah, hari ini kita melihat lompatan lain dalam kinerja solusi perusahaan, Radeon HD 7970 menaikkannya ke tingkat yang tidak dapat dicapai - kartu video chip tunggal baru bahkan mengungguli dual-GPU HD 6990 di kedua pengujian! Tugas-tugas ini adalah contoh yang bagus dari peningkatan kinerja dunia nyata dalam komputasi kompleks saat berpindah dari VLIW ke eksekusi skalar.

Jadi, dalam pengujian pixel shader kompleks versi 3.0, kartu video kelas atas baru dari AMD tidak hanya mampu mengejar para pesaingnya, tetapi juga mengungguli dengan margin yang signifikan, yang belum lama berselang. Kecepatan di kedua tes PS 3.0 sangat bergantung pada bandwidth memori dan tekstur, tetapi kodenya rumit, yang sangat baik dengan arsitektur Nvidia dan arsitektur skalar AMD terbaru. Tes ini adalah salah satu yang pertama menunjukkan peningkatan yang jelas dalam efisiensi dan perbedaan positif terbesar antara arsitektur AMD sebelumnya dan terbaru dalam hal kecepatan.

Tapi kami akan memberikan angkanya agar tidak tidak berdasar. Produk baru yang dihadirkan Radeon HD 7970 lebih dari dua kali lebih cepat dari pendahulunya, dan 60-70% lebih cepat dari Geforce GTX 580, yang bahkan tidak berani kami pikirkan baru-baru ini. Bagaimanapun, solusi Nvidia selalu menjadi pemimpin yang tak terbantahkan dalam pasangan tugas pengujian ini, tetapi kartu video di Cayman mampu mendekati mereka, dan Tahiti tercepat akhirnya melampaui pesaing.

Direct3D 10: Tes Pixel Shader PS 4.0 (Tekstur, Loop)

Versi kedua RightMark3D mencakup dua tes PS 3.0 yang sudah dikenal untuk Direct3D 9, yang ditulis ulang untuk DirectX 10, serta dua tes baru lagi. Pasangan pertama menambahkan kemampuan untuk mengaktifkan supersampling self-shadowing dan shader, yang juga meningkatkan beban pada chip video.

Tes ini mengukur kinerja mengeksekusi pixel shader dengan loop dengan sejumlah besar sampel tekstur (dalam mode terberat, hingga beberapa ratus sampel per piksel) dan beban ALU yang relatif rendah. Dengan kata lain, mereka mengukur tingkat pengambilan sampel tekstur dan efisiensi percabangan dalam pixel shader.

Tes pixel shader pertama adalah Fur. Pada pengaturan terendah, ia menggunakan 15 hingga 30 sampel tekstur dari peta ketinggian dan dua sampel dari tekstur utama. Detail efek - Mode "Tinggi" meningkatkan jumlah sampel hingga 40–80, memungkinkan supersampling "shader" - hingga 60-120 sampel, dan mode "Tinggi", bersama dengan SSAA, memiliki "keparahan" maksimum - dari 160 hingga 320 sampel dari peta ketinggian.

Pertama-tama mari kita periksa mode tanpa supersampling diaktifkan, mereka relatif sederhana, dan rasio hasil dalam mode "Rendah" dan "Tinggi" harus kira-kira sama.

Kinerja dalam pengujian ini tergantung pada jumlah dan efisiensi TMU, dan pada efisiensi program yang kompleks. Dalam kasus tanpa supersampling, rasio pengisian efektif (kinerja ROP) dan bandwidth memori memiliki dampak tambahan pada kinerja. Hasil pada tingkat detail "Tinggi" kira-kira satu setengah kali lebih rendah daripada di "Rendah", sebagaimana seharusnya dalam teori, tetapi untuk solusi tercepat perbedaannya sedikit lebih rendah.

Sebelumnya, dalam tes rendering prosedural bulu dengan sejumlah besar tekstur, solusi Nvidia terasa lebih kuat, tetapi mulai dengan AMD generasi sebelumnya, perbedaannya mulai berkurang. Jadi apa yang terjadi dengan Radeon HD 7970? Hasil yang luar biasa - produk AMD baru kembali lebih cepat daripada motherboard dual-chip generasi sebelumnya, dan chip tunggal HD 6970 tertinggal dua kali, yang dengan jelas menunjukkan peningkatan efisiensi arsitektur Kepulauan Selatan yang baru. Dan solusi Nvidia tertinggal, bahkan dual-GPU GTX 590 memberi jalan kepada model teratas Radeon HD 7970 yang disajikan hari ini.

Mari kita lihat hasil pengujian yang sama, tetapi dengan supersampling "shader" diaktifkan, yang melipatgandakan pekerjaan: mungkin, dalam situasi seperti itu, sesuatu akan berubah, dan bandwidth memori dengan rasio pengisian akan lebih sedikit memengaruhi:

Mengaktifkan supersampling meningkatkan beban teoritis empat kali lipat, dan hasil solusi Nvidia selalu turun jika dibandingkan dengan kartu grafis AMD. Sekarang perbedaan efisiensi tugas ini bahkan lebih jelas, dan model HD 7970 baru 2,5 kali lebih cepat daripada HD 6970! Geforce GTX 580 kehilangan jumlah yang sama dengan produk baru. Sangat wajar bahwa bahkan HD 6990 tertinggal jauh di belakang, dan papan baru memperkuat kepemimpinannya, tetapi betapa ...

Tes shader DX10 kedua mengukur kinerja pixel shader kompleks dengan loop dengan sejumlah besar sampel tekstur dan disebut Steep Parallax Mapping. Pada pengaturan rendah, ia menggunakan 10 hingga 50 sampel tekstur dari peta ketinggian dan tiga sampel dari tekstur utama. Saat Anda mengaktifkan mode berat dengan self-shadowing, jumlah sampel berlipat ganda, dan supersampling meningkatkan jumlah ini empat kali lipat. Mode uji paling sulit dengan supersampling dan self-shadowing memilih dari 80 hingga 400 nilai tekstur, yaitu, delapan kali lebih banyak daripada mode sederhana. Kami pertama-tama memeriksa opsi sederhana tanpa supersampling:

Tes pixel-shader kedua Direct3D 10 agak lebih menarik dari sudut pandang praktis, karena varietas pemetaan paralaks banyak digunakan dalam game, dan varian berat seperti pemetaan paralaks curam kami digunakan di banyak proyek, misalnya, dalam game dari seri Crysis dan Lost Planet. Selain itu, dalam pengujian kami, selain supersampling, Anda dapat mengaktifkan self-shadowing, yang menggandakan beban pada chip video, mode ini disebut "Tinggi".

Diagram ini mirip dengan yang sebelumnya tanpa SSAA diaktifkan, tetapi posisi Nvidia sedikit melemah, dan Radeon HD 6990 hampir mengejar model yang disajikan hari ini. Dalam pengujian versi D3D10 yang diperbarui tanpa supersampling, HD 7970 menunjukkan hasil yang sangat baik, secara signifikan mengungguli HD 6970 dan GTX 580 dan bahkan GTX 590. HD 7970 dan HD 6990 berbagi keunggulan, dan dua kartu video AMD lama menunjukkan hasil yang serupa dan jauh lebih lambat daripada model baru) tertinggal. Mari kita lihat apa yang akan mengubah penyertaan supersampling, ini dapat menyebabkan penurunan kecepatan yang signifikan pada papan Nvidia.

Ketika supersampling dan self-shadowing diaktifkan, tugas menjadi lebih sulit, penyertaan dua opsi secara bersamaan meningkatkan beban pada kartu hampir delapan kali, menyebabkan penurunan kinerja yang besar. Perbedaan antara indikator kecepatan kartu video yang diuji telah berubah, penyertaan supersampling mempengaruhi hal yang sama seperti pada kasus sebelumnya - kartu yang dibuat oleh AMD telah meningkatkan indikatornya relatif terhadap solusi Nvidia.

Dan sekarang Radeon HD 7970 kembali menjadi satu-satunya pemimpin dalam perbandingan, menunjukkan hasil yang lebih tinggi daripada HD 6990. Kartu chip tunggal yang lebih lama dari perusahaan jauh di belakang, bersama dengan Geforce GTX 580. Dan hanya kartu dual-chip yang lebih mahal. Opsi GPU dari AMD dan Nvidia mampu melakukan apa saja lalu mendekati kartu video baru. Secara umum, berdasarkan dua tes shader D3D10, kita dapat menyimpulkan bahwa arsitektur AMD baru dan perwakilannya pada chip Tahiti dengan sempurna mengatasi tugas "shader", bahkan lebih baik daripada pesaing kuat tradisional dari Nvidia.

Direct3D 10: Benchmark PS 4.0 Pixel Shader (Hitung)

Beberapa pengujian pixel shader berikutnya berisi jumlah minimum pengambilan tekstur untuk mengurangi dampak kinerja TMU. Mereka menggunakan sejumlah besar operasi aritmatika, dan mereka mengukur dengan tepat kinerja matematis chip video, kecepatan eksekusi instruksi aritmatika dalam shader piksel.

Tes matematika pertama adalah Mineral. Ini adalah tes tekstur prosedural kompleks yang hanya menggunakan dua sampel data tekstur dan 65 instruksi seperti sin dan cos.

Hasil tes matematika ekstrim biasanya sesuai dengan perbedaan frekuensi dan jumlah unit eksekusi, tetapi dengan beberapa pengaruh efisiensi penggunaan yang berbeda. Semua arsitektur AMD terbaru dalam kasus seperti itu memiliki keunggulan luar biasa dibandingkan kartu grafis Nvidia yang bersaing, dan ini menjelaskan hasil pengujian di mana solusi AMD kembali menjadi jauh lebih produktif.

Solusi disusun kira-kira sesuai dengan teori, tetapi dengan beberapa pengecualian. Dalam praktiknya, beberapa nuansa yang terkait dengan efisiensi yang berbeda telah terungkap. Secara teori, Geforce GTX 580 seharusnya lebih dari setengah (2,4 kali) lebih lambat dari Radeon HD 7970 yang baru, tetapi dalam praktiknya perbedaannya hanya 80%, yang jauh lebih sedikit. Dan bahkan ketika membandingkan dengan HD 6970, muncul pertanyaan tentang cara mengoptimalkan arsitektur dan driver baru untuk pengujian ini. Dengan keunggulan komputasi teoritis 40%, papan AMD baru hanya 28% lebih cepat dari HD 6970 sebelumnya, dan jarak antara itu dan HD 5870 yang sangat lama berdasarkan arsitektur VLIW5 bahkan lebih kecil. Entah tes ini benar-benar lebih cocok untuk VLIW (terutama untuk VLIW5), atau driver mentah yang harus disalahkan.

Ada penjelasan lain - mungkin hasil papan HD 7970 HD 6970 dalam pengujian ini dipengaruhi oleh teknologi PowerTune, yang mengurangi frekuensi ketika batas konsumsi daya tercapai. Namun, semua ini sedikit berubah jika dibandingkan dengan pesaing, karena bahkan GPU ganda yang mahal Geforce GTX 590 hanya mencapai level HD 6970 dan HD 5870. Dan GPU tunggal GTX 580 jauh di belakang.

Pertimbangkan tes komputasi shader kedua yang disebut Api. Ini lebih berat untuk ALU, dan hanya ada satu tekstur fetch di dalamnya, dan jumlah instruksi seperti sin dan cos digandakan, menjadi 130. Mari kita lihat apa yang berubah dengan meningkatnya beban:

Kami melihat grafik yang hampir identik dengan grafik sebelumnya, kecuali untuk angka absolut. Kali ini, semua GPU tetap di posisi yang kira-kira sama, kecuali bahwa kartu video berdasarkan Cayman dan Cypress telah bertukar tempat - sekarang model yang lebih baru sedikit lebih cepat, tetapi tidak sama sekali. Meskipun masih belum ada korespondensi yang ketat dengan angka teoretis untuk kinerja puncak, hasilnya masih mendekati teori kering. Perbedaan antara HD 7990 dan HD 6970 sedikit meningkat.

Jika tidak, kami tidak menemukan sesuatu yang baru di grafik. Kecepatan rendering dalam pengujian ini dibatasi secara eksklusif oleh kinerja unit shader dan efisiensinya, sehingga dual-GPU HD 6990 kembali menjadi pemimpin yang jelas, dan produk baru AMD hari ini mengikuti pada jarak yang layak. Kedua kartu Geforce lebih rendah bahkan dari model lama dari keluarga Radeon HD 5800, tetapi kali ini keunggulan solusi AMD tetap sedikit lebih sedikit daripada saat membandingkan angka teoretis, dan ini sekali lagi menunjukkan pengoptimalan terburuk atau pengaruh PowerTune.

Direct3D 10: benchmark geometri shader

Paket RightMark3D 2.0 berisi dua tes kecepatan geometri shader, versi pertama disebut "Galaxy", tekniknya mirip dengan "point sprite" dari versi Direct3D sebelumnya. Ini menjiwai sistem partikel pada GPU, shader geometris menciptakan empat simpul dari setiap titik, membentuk partikel. Algoritme serupa harus digunakan secara luas di game DirectX 10 mendatang.

Mengubah keseimbangan dalam tes shader geometri tidak mempengaruhi hasil rendering akhir, gambar akhir selalu persis sama, hanya metode pemrosesan adegan yang berubah. Parameter "GS load" menentukan shader mana yang melakukan perhitungan - dalam vertex atau geometris. Jumlah perhitungan selalu sama.

Mari kita pertimbangkan varian pertama dari tes Galaxy, dengan perhitungan dalam shader vertex, untuk tiga tingkat kompleksitas geometris:

Rasio kecepatan dengan kompleksitas geometris pemandangan yang berbeda kira-kira sama untuk semua solusi, kinerjanya sesuai dengan jumlah poin, dengan setiap langkah penurunan FPS sekitar dua kali. Tugas untuk kartu video modern tidak terlalu sulit, dan kinerja dibatasi terutama oleh kecepatan pemrosesan geometri, tetapi juga oleh bandwidth / laju pengisian memori (dalam kerangka solusi dari satu pabrikan).

Dalam tes ini, peningkatan kemampuan pemrosesan geometri Kepulauan Selatan seharusnya muncul, jadi mereka muncul. Kartu grafis AMD baru ini memang jauh lebih cepat dalam perhitungan geometris daripada semua solusi sebelumnya dari perusahaan. Meskipun AMD memberikan angka gain hingga 4 kali lipat, dalam pengujian ini performa geometrik meningkat sekitar 1,5-2 kali lipat. Hasilnya, kartu video chip tunggal ternyata memiliki level yang hampir sama dengan model dua chip Radeon HD 6990 berdasarkan GPU generasi sebelumnya.

Peningkatan signifikan seperti itu mengarah pada fakta bahwa Tahiti hampir mengejar kartu video Nvidia kelas atas, meskipun eksekusi shader geometri dalam beberapa kondisi harus lebih efisien. Sebelumnya, kartu video Nvidia mengatasi pekerjaan sekitar dua kali lebih cepat dari kartu video pesaing serupa, tetapi sekarang tidak ada perbedaan sama sekali. Mari kita lihat bagaimana situasinya akan berubah saat mentransfer bagian dari perhitungan ke shader geometri:

Ketika beban berubah dalam pengujian ini, jumlahnya hampir tidak berubah untuk solusi Nvidia dan sebagian besar papan AMD. Hanya kartu video baru dari keluarga HD 7900 dalam pengujian ini yang bereaksi lemah terhadap perubahan parameter beban GS, yang bertanggung jawab untuk mentransfer sebagian perhitungan ke shader geometri. Oleh karena itu, papan menunjukkan hasil yang sedikit lebih tinggi daripada diagram sebelumnya. Mari kita lihat apa yang akan berubah pada pengujian berikutnya, yang mengasumsikan beban berat pada shader geometri.

Hyperlight adalah tes shader geometri kedua yang mendemonstrasikan penggunaan beberapa teknik sekaligus: instancing, stream output, buffer load. Ini menggunakan kreasi dinamis dari geometri menggunakan rendering dalam dua buffer, serta fitur Direct3D 10 baru - keluaran aliran. Shader pertama menghasilkan arah sinar, kecepatan dan arah pertumbuhannya, data ini ditempatkan dalam buffer yang digunakan oleh shader kedua untuk rendering. Untuk setiap titik sinar, 14 simpul dibangun dalam lingkaran, hingga total satu juta titik keluaran.

Jenis program shader baru digunakan untuk menghasilkan "sinar", dan dengan parameter "GS load" disetel ke "Heavy" - juga untuk renderingnya. Artinya, dalam mode "Seimbang", shader geometris hanya digunakan untuk membuat dan "menumbuhkan" sinar, output dilakukan menggunakan "instance", dan dalam mode "Heavy", shader geometri juga terlibat dalam output . Mari kita lihat mode cahaya terlebih dahulu:

Hasil relatif dalam mode yang berbeda lagi kira-kira sesuai dengan perubahan beban: dalam semua kasus, skala kinerja baik dan dekat dengan parameter teoretis, yang menurutnya setiap tingkat berikutnya "Jumlah poligon" harus kurang dari dua kali lebih lambat.

Dalam pengujian ini, kecepatan rendering harus dibatasi oleh kinerja geometris, dan arsitektur baru dari AMD bekerja dengan baik, bahkan sedikit mengungguli pesaing dalam menghadapi Geforce GTX 580! Kedua papan chip ganda menunjukkan hasil yang salah di sini, jadi perbandingan dengan mereka tidak akan berfungsi. Namun HD 7970 40-50% lebih cepat dari pendahulunya, HD 6970, yang dijelaskan dengan jelas oleh perubahan arsitektur pada GPU. Hasil yang sangat baik dari peta di Tahiti dengan jelas membuktikan optimasi yang dilakukan di unit pemrosesan data geometrik di chip baru.

Angka-angka harus banyak berubah pada diagram berikutnya, dalam pengujian dengan lebih banyak shader geometris. Menarik juga untuk membandingkan hasil yang diperoleh dalam mode "Seimbang" dan "Berat" satu sama lain.

Tetapi di sini catatan untuk Radeon HD 7970 tidak berfungsi, bagaimanapun, perbedaan antara chip AMD dengan pipa grafis tradisional (termasuk Cayman dengan Tahiti dengan dua rasterizer) dan chip dengan arsitektur Fermi dengan pemrosesan geometri paralel terlihat jelas. Dan hasil dari Geforce GTX 580, berdasarkan chip GF110, sangat bagus sehingga mengungguli solusi terbaik dari AMD (dan ini adalah model yang diumumkan hari ini) sebesar 35-40%.

Meskipun kemampuan chip AMD top-end baru dalam memproses geometri dan kecepatan eksekusi geometri shader jelas meningkat dibandingkan dengan kartu video perusahaan sebelumnya, dan solusi pertama pada chip Tahiti menunjukkan hasil dalam pengujian ini sebesar 22 -28% lebih tinggi dari solusi berdasarkan Cayman. Mungkin, insinyur AMD memutuskan bahwa pengoptimalan blok seperti itu untuk pengaturan segitiga dan pemrosesan geometri sudah cukup.

Direct3D 10: kecepatan mengambil tekstur dari vertex shader

Tes Vertex Texture Fetch mengukur kecepatan pengambilan tekstur dalam jumlah besar dari vertex shader. Tes pada dasarnya serupa, sehingga rasio antara hasil peta dalam tes Bumi dan Gelombang harus kira-kira sama. Kedua pengujian menggunakan pemetaan perpindahan berdasarkan data pengambilan tekstur, satu-satunya perbedaan yang signifikan adalah bahwa uji Gelombang menggunakan transisi bersyarat, sedangkan uji Bumi tidak.

Pertimbangkan tes pertama "Bumi", pertama dalam mode "Detail Efek Rendah":

Studi sebelumnya telah menunjukkan bahwa banyak hal sekaligus mempengaruhi hasil tes ini: kecepatan tekstur dan bandwidth memori. Dan hasil kartu video seringkali dibatasi oleh beberapa kendala - lihat saja perbandingan dual-GPU GTX 590 dan analog GPU tunggal - hampir tidak ada perbedaan di antara keduanya. Meskipun HD 6990 dua kali lebih cepat dari HD 6970.

Dan motherboard AMD baru dari keluarga Radeon HD 7970 menunjukkan hasil yang sangat baik, hampir mengejar HD 6990 terkemuka. Adapun pesaing chip tunggal, ini adalah yang terbaik di ketiga mode. Keunggulan dibandingkan HD 6970 berkisar antara 25% hingga 75%, tergantung pada modenya. Mari kita lihat kinerja dalam pengujian yang sama dengan peningkatan jumlah pengambilan tekstur:

Tapi kali ini, posisi relatif kartu pada diagram telah berubah secara nyata, dan ini terutama berlaku untuk mode berat. Dengan jumlah poligon yang sedikit, kecepatan rendering dalam pengujian ini dibatasi oleh bandwidth memori, itulah sebabnya papan AMD begitu kuat pada diagram sebelumnya.

Tetapi dalam mode berat, perbedaan antara kartu Nvidia chip tunggal dan kartu AMD baru telah berkurang, dan mereka bersaing satu sama lain dalam pertarungan yang agak ketat. Kartu video dua chip senior dari keluarga Radeon HD 6900 mengungguli semua solusi lain dan merupakan yang terbaik dibandingkan, meskipun Geforce GTX 590 dicocokkan dengannya dalam mode berat. HD 7970 chip tunggal baru memenangkan pendahulunya hingga 70%, yang mungkin menunjukkan efek bandwidth memori yang kuat.

Mari kita perhatikan hasil pengujian kedua sampel tekstur dari vertex shader. Tes Waves memiliki jumlah sampel yang lebih sedikit, tetapi menggunakan lompatan bersyarat. Jumlah sampel tekstur bilinear dalam hal ini adalah hingga 14 ("Effect detail Low") atau hingga 24 ("Effect detail High") untuk setiap vertex. Kompleksitas geometri berubah dengan cara yang sama seperti pada tes sebelumnya.

Hasil dalam pengujian kedua dari vertex texturing "Gelombang" benar-benar berbeda dari apa yang kita lihat pada diagram sebelumnya. Dalam pengujian ini, kartu video AMD dan Nvidia, kecuali HD 6990 dan HD 7970, menunjukkan hasil yang sangat mirip, yang sekali lagi dapat dikaitkan dengan batasan bandwidth memori video, karena indikator ini dekat untuk semua kartu video yang disajikan.

Tetapi model baru dari keluarga Kepulauan Selatan berhasil menonjol, dalam kondisi perbandingan yang sulit, ia hampir mengejar dual-GPU HD 6990, yang menjadi yang terbaik di antara semua kartu video. Perbedaan antara kartu berdasarkan Cayman dan Tahiti GPU lagi-lagi 25-70% mendukung solusi yang lebih baru. Mari kita pertimbangkan varian kedua dari tes yang sama:

Dan kemudian ada perubahan yang serupa dengan yang kita lihat sebelumnya - kartu video Nvidia "melorot" hanya dalam mode mudah, dan sebagian besar solusi AMD - semuanya sekaligus. Namun, ini tidak memungkinkan dewan perusahaan California untuk mengejar produk baru dari keluarga Radeon 7900. Omong-omong, itu menyalip semua orang dalam mode sedang dan berat, menghasilkan HD 6990 dual-GPU hanya sekali.

Dalam mode dengan jumlah poligon rendah, perbedaan antara solusi tidak begitu besar, tetapi rata-rata dan berat, solusi AMD lama lebih rendah, diikuti oleh motherboard Nvidia (dua-GPU hanya sedikit lebih cepat daripada GTX 580 satu-GPU ), HD 6990 dan HD 7970. Papan dari keluarga HD 7900 yang diumumkan hari ini dalam uji pengambilan sampel vertex menunjukkan dirinya dengan sangat baik, dengan margin menyalip kartu video pesaing dari Nvidia dan pendahulunya dari pabrikan yang sama.

3DMark Vantage: Tolok Ukur Fitur

Seperti biasa, benchmark sintetis dari suite 3DMark Vantage dapat menunjukkan kepada kita sesuatu yang kita lewatkan sebelumnya. Pengujian fitur dari rangkaian pengujian ini memiliki dukungan DirectX 10 dan menarik karena berbeda dari kami. Saat menganalisis hasil kartu video baru Radeon HD 7970 dalam paket ini, kami dapat menarik beberapa kesimpulan baru dan berguna yang luput dari kami dalam pengujian keluarga RightMark.

Tes Fitur 1: Isi Tekstur

Tes pertama adalah tes kecepatan sampling tekstur. Digunakan untuk mengisi persegi panjang dengan nilai yang dibaca dari tekstur kecil menggunakan beberapa koordinat tekstur yang mengubah setiap frame.

Meskipun pengujian oleh Futuremark masih tidak menunjukkan tingkat kecepatan pengambilan sampel tekstur yang mungkin secara teoritis, efisiensi kartu video dari AMD dan Nvidia terasa lebih tinggi daripada di RightMark kami. Oleh karena itu, pada pengujian tekstur ini diperoleh perbandingan hasil yang sedikit berbeda, yang lebih mendekati kebenaran.

Kartu video pertama dari keluarga baru AMD menunjukkan hasil yang mendekati parameter teoretis yang sesuai, dan mengatasi pekerjaan dengan lebih efisien daripada generasi sebelumnya. Radeon HD 7970 mengungguli HD 6970 lebih dari 50%, meskipun secara teori perbedaannya hanya 40%. Kemungkinan besar, unit tekstur Tahiti digunakan lebih efisien karena peningkatan memori dan sistem caching, yang menyebabkan peningkatan hasil.

Tentu saja, model chip-tunggal yang baru jauh dari pemimpin - dual-GPU HD 6990, tetapi ini tidak diharapkan. Namun, Anda dapat dengan jelas melihat bahwa kinerja tekstur chip grafis Tahiti telah meningkat secara signifikan dibandingkan dengan Cayman. Nah, GTX 580 kalah dengan produk baru dalam hal kecepatan tekstur sebanyak 2,3 kali. Bahkan kartu dual-GPU Nvidia hanya mengejar HD 6970.

Tes Fitur 2: Isi Warna

Ini adalah tes rasio pengisian. Sebuah pixel shader yang sangat sederhana digunakan tanpa batasan kinerja. Nilai warna yang diinterpolasi ditulis ke buffer offscreen (render target) menggunakan alpha blending. Buffer off-screen FP16 16-bit digunakan, yang paling sering digunakan dalam game yang menggunakan rendering HDR, jadi pengujian ini cukup tepat waktu.

Situasi dalam tes kinerja unit ROP sangat berbeda dari tes tekstur. Angka-angka untuk subtes ini dari 3DMark Vantage menunjukkan kinerja unit ROP, tetapi dengan pengaruh jumlah bandwidth memori video (yang disebut "tingkat pengisian efektif"). Dan di sini model HD 7970 baru menunjukkan hasil yang sangat baik, hanya tertinggal di belakang dua kartu video kelas atas dari AMD dan Nvidia dari generasi sebelumnya, yang memiliki dua GPU di dalamnya.

Bagaimana dengan efisiensi ROP yang dibanggakan AMD? Memang, hanya 32 ROP dalam chip Tahiti baru yang tidak membatasi kecepatan rendering sama sekali, bahkan dalam pengujian khusus. Dan kami mencatat efisiensi ROP yang sedikit lebih tinggi dan rasio pengisian yang lebih tinggi pada kartu grafis baru dari AMD dibandingkan dengan model lama. Perbedaan antara HD 7970 dan HD 6970 lebih dari 50%, yang jelas menunjukkan pengaruh yang lebih besar dari bandwidth memori, daripada kinerja murni unit ROP.

Adapun perbandingan dengan Nvidia, di sini perbedaan kecepatan (35%) sesuai dengan perbedaan teoritis dalam bandwidth memori (36%), dan bukan kecepatan murni unit ROP. Ternyata 32 dari blok ini di Cayman hanya berlebihan dan kemampuannya tidak pernah sepenuhnya digunakan.

Uji Fitur 3: Pemetaan Oklusi Paralaks

Salah satu tes fitur yang paling menarik, karena teknik serupa sudah digunakan dalam game. Ini menggambar satu segi empat (lebih tepatnya, dua segitiga) menggunakan teknik khusus yang disebut Pemetaan Oklusi Paralaks, yang mensimulasikan geometri kompleks. Operasi ray tracing yang cukup intensif sumber daya dan peta kedalaman resolusi tinggi digunakan. Juga permukaan ini diarsir menggunakan algoritma Strauss berat. Ini adalah pengujian dari shader piksel yang sangat kompleks dan GPU-berat yang berisi banyak pilihan tekstur untuk ray tracing, cabang dinamis dan perhitungan pencahayaan yang kompleks menggunakan Strauss.

Tes ini berbeda dari tes serupa lainnya karena hasil di dalamnya tidak hanya bergantung pada kecepatan perhitungan matematis, efisiensi eksekusi cabang, atau kecepatan pengambilan tekstur, tetapi pada sebagian kecil dari segalanya. Untuk mencapai kecepatan tinggi, keseimbangan blok GPU penting di sini; ini juga memiliki efek yang sangat nyata pada kecepatan dan efisiensi percabangan di shader.

Hasil perbandingan kartu video AMD pada diagram umumnya mirip dengan apa yang kita lihat dalam tes kinerja tekstur dari 3DMark Vantage, kecuali bahwa Radeon HD 7970 baru jelas lebih efisien dalam tugas ini, karena hampir mengejar dual-GPU HD 6990 lagi - hasil yang luar biasa! Dalam hal ini, papan Nvidia menerima sedikit peningkatan kinerja, yang menegaskan kesimpulan bahwa bukan hanya kinerja tekstur yang memengaruhi hasil pengujian ini.

Jadi, model baru dari AMD berkinerja sangat baik, kalah sedikit dari motherboard dua chip yang berbasis dua Cayman. Ini mengungguli pendahulunya dengan chip tunggal sebesar 66%. Angka ini tidak sesuai dengan akselerasi dari Cayman ke Tahiti dalam parameter teoretis mana pun dan dapat berarti peningkatan kinerja dalam perhitungan percabangan yang kompleks. Bahkan hasil yang sebelumnya dianggap baik dari Geforce GTX 580 adalah dua kali lebih buruk dari produk AMD baru. Sebenarnya, semua kartu video dari pabrikan ini ternyata lebih cepat daripada model teratas garis Geforce GTX 500 berdasarkan satu chip.

Uji Fitur 4: Kain GPU

Tes ini menarik karena menghitung interaksi fisik (tiruan jaringan) menggunakan chip video. Simulasi simpul digunakan, menggunakan kombinasi kerja simpul dan shader geometri, dengan beberapa lintasan. Gunakan stream out untuk mentransfer simpul dari satu simulasi ke yang lain. Dengan demikian, kinerja eksekusi vertex dan geometri shader dan kecepatan aliran keluar diuji.

Kecepatan rendering dalam tes ini juga tergantung pada banyak parameter, tetapi sudah yang lain. Faktor utama di sini adalah kinerja pemrosesan geometri dan efisiensi eksekusi shader geometri. Jadi cukup logis bahwa kartu video Nvidia berkinerja baik dalam aplikasi ini, secara signifikan mengungguli persaingan.

Dan bahkan Radeon HD 7970 yang disajikan hari ini, meskipun ada peningkatan kinerja yang jelas dibandingkan dengan HD 6970, tidak dapat bersaing dengan GPU tunggal Geforce GTX 580 dan sedikit lebih rendah darinya. Ini adalah salah satu tes geometri, yang menunjukkan keunggulan kartu video HD 6900 terbaru dibandingkan baris sebelumnya, di mana kecepatan pemrosesan geometri dan eksekusi geometri shader ditingkatkan. Radeon HD 7970 meningkatkan hasil sebesar 35% lagi, tetapi ini tidak cukup - solusi Nvidia terus memimpin dalam pengujian ini. Perhatikan, bagaimanapun, bahwa model baru telah secara signifikan meningkatkan posisi AMD dalam tes geometris.

Uji Fitur 5: Partikel GPU

Uji simulasi fisik efek berdasarkan sistem partikel yang dihitung menggunakan chip video. Simulasi simpul juga digunakan, setiap simpul mewakili satu partikel. Stream out digunakan untuk tujuan yang sama seperti pada pengujian sebelumnya. Beberapa ratus ribu partikel dihitung, semuanya dianimasikan secara terpisah, dan tumbukannya dengan peta ketinggian juga dihitung.

Mirip dengan salah satu pengujian di RightMark3D 2.0 kami, partikel dirender menggunakan shader geometri, yang membuat empat simpul dari setiap titik, membentuk partikel. Namun pengujian sebagian besar unit shader beban dengan perhitungan vertex, stream out juga diuji.

Hasil pengujian berikutnya dari rangkaian 3DMark Vantage serupa dengan yang kita lihat pada diagram sebelumnya, tetapi kecepatan pemrosesan geometri di dalamnya menjadi lebih penting. Dan oleh karena itu, kartu video Nvidia mendorong lebih jauh, meninggalkan bahkan monster dua chip - Radeon HD 6990. Sayangnya, tetapi ini adalah fakta - bahkan GTX 580 menyalip semua papan AMD, termasuk model baru berdasarkan GPU Tahiti.

Sayangnya, meskipun papan berdasarkan chip baru menunjukkan hasil yang lebih kuat dibandingkan dengan solusi berdasarkan Cayman dan Cypress, Geforce tertinggal. Perbedaan antara HD 7970 dan HD 6970 dalam perbandingan ini hanya lebih dari 30%, yang menunjukkan pengaruh yang jelas dari kecepatan ALU. Dalam pengujian sintetis tiruan jaringan dan partikel dari rangkaian pengujian 3DMark Vantage, di mana shader geometri digunakan secara aktif, solusi AMD terus tertinggal dari kartu video pesaingnya, yang memiliki kecepatan pemrosesan geometri yang sangat tinggi.

Uji Fitur 6: Kebisingan Perlin

Tes fitur terbaru dari paket Vantage adalah tes intensif matematis dari chip video, yang menghitung beberapa oktaf dari algoritma noise Perlin dalam pixel shader. Setiap saluran warna menggunakan fungsi kebisingannya sendiri untuk memuat lebih banyak pada chip video. Perlin noise adalah algoritma standar yang sering digunakan dalam tekstur prosedural dan menggunakan banyak matematika.

Menariknya, dalam tes matematis dari rangkaian Futuremark, yang menunjukkan kinerja puncak chip video dalam masalah ekstrem, kami melihat gambaran yang sama sekali berbeda dibandingkan dengan pengujian serupa dari rangkaian pengujian kami. Performa solusi yang ditunjukkan pada diagram hanya secara kasar sesuai dengan apa yang seharusnya diperoleh menurut teori, dan juga berbeda dari apa yang kita lihat sebelumnya dalam tes matematika dari paket RightMark 2.0. Misalnya, Anda dapat dengan jelas melihat bahwa kartu video baru dalam pengujian ini semakin mendekati kecepatan teoretis, dibandingkan dengan kartu berbasis GPU dengan arsitektur VLIW.

Mari kita lihat alasannya. Pada suatu waktu, HD 6970 tidak meningkatkan kinerja matematika puncak dibandingkan HD 5870, tetapi itu saja tidak menjelaskan lag Cayman. Alasannya mungkin karena efisiensi yang lebih rendah dari arsitektur VLIW4, dan sistem manajemen daya pintar, yang "membunuh" frekuensi clock dan kinerja solusi ketika ambang batas konsumsi daya tercapai.

Tapi itu tidak mempengaruhi HD 7970. Kemungkinan besar, alasannya terletak pada arsitektur skalar chip baru. Karena rasio angka kinerja dalam tes dan yang teoretis dengan jelas menunjukkan hal ini. Secara teori, HD 6970 memiliki 0,7 dari kekuatan matematika kartu baru, tetapi tes ini hanya menghasilkan 0,56. Perbedaannya kira-kira sama untuk papan AMD lainnya. Tetapi ketika membandingkan GTX 580 dan HD 7970, yang memiliki arsitektur skalar, rasio teoritisnya adalah 0,42 (Tahiti lebih dari dua kali lebih cepat), dan rasio praktisnya juga 0,42. Artinya, efisiensi penggunaan ALU yang tersedia untuk chip ini dari produsen yang berbeda benar-benar sama! Berbeda dengan Cayman dan Cypress yang memiliki arsitektur VLIW.

Bagaimanapun, kedua pesaingnya dari Nvidia dilewati oleh papan AMD baru dengan margin besar, dan Nvidia jelas perlu secara dramatis meningkatkan kekuatan matematisnya dalam solusi masa depan. Sementara itu, gambar biasa diperoleh - Kartu video Geforce menunjukkan hasil yang buruk dalam kasus-kasus seperti itu ketika matematika sederhana dan intensif dilakukan pada kartu Radeon jauh lebih cepat. Dan pelepasan Pulau Selatan hanya memperburuk keadaan.

Direct3D 11: Hitung Shader

Kami menggunakan contoh dari SDK dan demo dari Microsoft, Nvidia, dan AMD untuk menguji solusi baru dari AMD pada fitur DirectX 11 baru seperti tessellation dan compute shader.

Pertama, mari kita lihat pengujian menggunakan Compute shader. Penampilan mereka adalah salah satu inovasi terpenting dalam versi terbaru DX API, mereka sudah digunakan dalam game modern untuk melakukan berbagai tugas: pasca-pemrosesan, simulasi, dll. Tes pertama menunjukkan contoh rendering HDR dengan pemetaan nada dari DirectX SDK, dengan pasca-pemrosesan menggunakan pixel dan shader komputasi.

Mungkin ini bukan contoh terbaik untuk shader komputasi, tetapi ini menunjukkan perbedaan kinerja dengan cukup jelas. Hampir tidak ada perbedaan antara perhitungan dalam komputasi dan pixel shader untuk kartu video AMD, dan pada Nvidia pixel shader sedikit lebih cepat.

AMD Radeon HD 6970 ternyata lebih cepat dari pendahulunya HD 5870, dan tampil di level Geforce GTX 580, tetapi model HD 7970 yang disajikan hari ini secara signifikan di depan mereka semua dan menjadi pemimpin (kami memutuskan untuk tidak menggunakan dual Kartu video -GPU dalam sintetis ini). GTX 560 Ti diambil terutama untuk tes geometri, dan untuk menilai perbedaan antara solusi dari segmen harga yang berbeda.

Jadi, motherboard yang diumumkan berdasarkan chip Tahiti baru adalah 40% di depan analog berdasarkan Cayman, yang sepenuhnya sesuai dengan perbedaan dalam kinerja teoritis unit komputasi. Pada gilirannya, keunggulan dibandingkan GTX 580 yang bersaing adalah 30-40% (tergantung pada jenis program shader), yang jelas lebih rendah daripada yang mungkin secara teoritis. GTX 560 Ti tertinggal sangat jauh, lebih dari dua kali.

Tes shader komputasi kedua, juga diambil dari Microsoft DirectX SDK, menunjukkan masalah gravitasi N-tubuh komputasi - simulasi sistem partikel dinamis yang ditindaklanjuti oleh kekuatan fisik seperti gravitasi.

Hasil dalam tes ini sangat tidak biasa, untuk solusi AMD yang sudah ketinggalan zaman mereka mirip dengan angka-angka dari tes matematika 3DMark Vantage - Cypress ternyata lebih cepat daripada Cayman. Terlepas dari keunggulan teoretis yang luar biasa dalam angka puncak, kartu grafis AMD tercepat - Radeon HD 7970 baru yang disajikan hari ini - hanya 21% di depan solusi Nvidia kelas atas. Dan bahkan GTX 560 Ti tidak terlalu ketinggalan. Model lama dari keluarga HD 6900 dan HD 5800 menunjukkan hasil yang hampir sama dengan Geforce GTX 580.

Kami paling tertarik pada perbedaan antara hasil keputusan di Cayman dan Tahiti, dalam hal ini kami melihat keuntungan dari model baru sebesar 36%. Ini sedikit kurang dari perbedaan teoretis antara model-model ini, tetapi masih mendekatinya. Mengapa kedua kartu tidak bekerja dengan baik dengan latar belakang HD 5870 yang sangat lama? Mungkin, frekuensi PowerTune yang berkurang atau kurangnya pengoptimalan driver untuk arsitektur baru yang harus disalahkan. Mari kita lihat apakah Tahiti akhirnya akan menunjukkan akselerasi yang signifikan dalam tes tessellation.

Direct3D 11: Performa Tesselation

Compute shader sangat penting, tetapi inovasi utama dalam Direct3D 11 masih pengujian perangkat keras. Kami memeriksanya dengan sangat rinci dalam artikel teoretis kami tentang Nvidia GF100. Tessellation sudah lama digunakan di game DX11, seperti STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 dan lain-lain. Beberapa dari mereka menggunakan tessellation untuk model karakter, sementara yang lain menggunakan tessellation untuk mensimulasikan permukaan air atau lanskap yang realistis.

Ada beberapa skema berbeda untuk mempartisi grafik primitif (tessellations). Misalnya tesselasi phong, segitiga PN, subdivisi Catmull-Clark. Jadi, skema partisi PN Triangles digunakan di STALKER: Call of Pripyat, dan di Metro 2033 - tessellation Phong. Metode ini relatif cepat dan mudah diperkenalkan ke dalam proses pengembangan game dan mesin yang ada, dan karena itu menjadi populer.

Tes tessellation pertama akan menjadi contoh Detail Tessellation dari ATI Radeon SDK. Ini mengimplementasikan tidak hanya tessellation, tetapi juga dua teknik pemrosesan per-piksel yang berbeda: peta normal overlay sederhana dan pemetaan oklusi paralaks. Nah, mari kita bandingkan solusi DX11 dari AMD dan Nvidia dalam kondisi berbeda:

Menariknya, pemetaan oklusi paralaks (batang tengah dalam diagram) pada kartu video dari kedua produsen dilakukan jauh lebih efisien daripada tesselasi (batang bawah), dan tesselasi moderat tidak memberikan penurunan kinerja yang besar - bandingkan batang atas dan bawah. Artinya, tiruan geometri berkualitas tinggi menggunakan perhitungan piksel memberikan kinerja yang bahkan lebih rendah daripada geometri tessel dengan pemetaan perpindahan.

Adapun kinerja kartu video relatif satu sama lain, pertama-tama mari kita lihat teknik piksel demi piksel. Dalam tes bumpmapping sederhana, kartu grafis AMD baru memimpin, itu mengungguli HD 6970 dan GTX 580 masing-masing sebesar 27% dan 36%. Namun dalam subtes dari perhitungan piksel-demi-piksel yang kompleks (ingat tes pemetaan paralaks di atas), sebelum rilis Cayman, kartu video Geforce lebih cepat daripada solusi AMD, serta dengan tessellation yang diaktifkan. Dengan dirilisnya Radeon HD 6970 dalam tessellation subtest, ternyata jauh lebih cepat daripada HD 5870, dan dalam pengujian dengan faktor partisi segitiga kecil, HD 6970 bahkan mengungguli GTX 580.

Jauh lebih menarik adalah apa yang kita lihat pada grafis berlabel Radeon HD 7970. Tessellation tidak terlalu rumit di sini, sehingga kartu video baru menang tidak begitu banyak atas model sebelumnya - sekitar 30%. Tes POM adalah masalah lain. Dalam subtes ini, HD 7970 baru merobek semua solusi lain hingga hancur. Keunggulan dibandingkan HD 6970 dan GTX 580 hanya sedikit kurang dari dua kali lipat. Hasil super lainnya dalam uji pemetaan paralaks, yang menunjukkan kinerja tinggi dari program shader kompleks.

Tes kedua kinerja tessellation akan menjadi contoh lain untuk pengembang 3D dari ATI Radeon SDK - PN Triangles. Sebenarnya, kedua contoh tersebut juga disertakan dalam DX SDK, jadi kami yakin pengembang game membuat kode mereka atas dasar mereka. Kami menguji contoh ini dengan faktor tessellation yang berbeda untuk melihat seberapa banyak perubahan yang akan berdampak pada kinerja secara keseluruhan.

Namun dalam contoh ini, kami melihat perbandingan lengkap kekuatan geometrik solusi AMD dan Nvidia dalam kondisi berbeda. Dan ternyata sangat menarik, menurut kami. Arsitektur grafis Fermi sangat menonjol, dan chip arsitektur Tahiti baru dari AMD. Tentu saja, ini adalah tes murni sintetis dan rasio split ekstrim tidak mungkin digunakan dalam game dalam waktu dekat, terutama mengingat sifat multiplatform total. Kami tertarik pada potensi arsitektur, itulah sebabnya kami membutuhkan "sintetis".

Jika dalam kondisi terang Radeon HD 7970 baru berhasil bersaing dengan Geforce GTX 580, mengunggulinya dalam mode paling ringan dan setara dengan yang ketiga, tetapi dalam kondisi paling sulit dengan jumlah segitiga yang sangat besar, mustahil untuk bersaing dengan kartu video Nvidia Geforce pada chip GF110 - dalam tugas tessellation ekstrim, ini secara signifikan lebih cepat daripada chip AMD yang ditingkatkan berulang kali. Meskipun GPU baru sekali lagi mengurangi kesenjangan dengan pesaing dalam tugas pemrosesan geometri, itu masih sangat jauh dari operasi paralel 16 unit tessellation di GF110. Dan bahkan GF114 lebih cepat dari Tahiti pada rasio split maksimum.

Namun demikian, meskipun kalah dalam kondisi paling keras dengan rasio split maksimum, sisa HD 7970 berbasis Tahiti bekerja dengan baik, terutama jika dibandingkan dengan Cayman dan Cypress. Model baru dari AMD dalam mode beban ringan dan sedang menunjukkan peningkatan kecepatan yang mengesankan, dan perbedaan dibandingkan dengan HD 6970 yang sudah lambat mencapai 2,8 kali. Tetapi kami melihat peningkatan seperti itu hanya dalam kasus ekstrem, dan paling sering ternyata dari 30 menjadi 70%. Kami belum melihat perbedaan empat kali lipat yang dijanjikan, setidaknya belum.

Tetapi perbedaan maksimum antara solusi perusahaan dicapai dalam kondisi pengujian yang ekstrem, yang tidak akan ada dalam permainan dan tolok ukur yang dekat dengan mereka. Oleh karena itu, kami berharap Tahiti secara signifikan meningkatkan posisi AMD dalam tes tessellation yang ada seperti 3DMark11 dan Heaven.

Mari kita lihat tes lain, demo Nvidia Realistic Water Terrain, juga dikenal sebagai Island. Demo ini menggunakan tessellation dan pemetaan perpindahan untuk membuat permukaan laut dan medan yang tampak realistis. Kelihatannya bagus, inilah yang hilang di game saat ini:

Island bukanlah patokan sintetis murni untuk mengukur kinerja geometris, ini berisi piksel kompleks dan shader komputasi, dan beban seperti itu lebih dekat ke game nyata, di mana semua unit GPU digunakan sekaligus, dan bukan hanya yang geometris, seperti pada sebelumnya patokan.

Kami juga menguji program pada empat rasio tessellation yang berbeda, pengaturan ini disebut Dynamic Tessellation LOD. Dan jika pada rasio split terendah semua kartu video dari AMD unggul, maka ketika pekerjaan menjadi lebih rumit, motherboard berbasis chip Nvidia mulai memimpin. Dan dengan peningkatan koefisien partisi dan kompleksitas pemandangan, kinerja semua kartu Radeon benar-benar turun secara signifikan, berbeda dengan solusi yang bersaing.

Perilaku Radeon HD 7970 dalam pengujian sangat menarik. Segera jelas bahwa tidak ada perubahan mendasar yang dilakukan pada pipa geometris (secara umum, ini tidak dijanjikan, jadi tidak ada keluhan). Jika dalam mode paling ringan kartu baru 35% lebih cepat dari HD 6970, dan GTX 580 64% lebih cepat, maka ketika LOD diatur ke 25, kinerja kartu baru turun ke tingkat kecepatan GTX 560 Ti. Lebih-lebih lagi. Dengan rasio LOD yang maksimal, perbedaan kecepatan antara Geforce GTX 580 dan Radeon HD 7970 mencapai 3,5 kali lipat!

Mari kita lihat apakah kita mendapatkan perbedaan empat kali lipat yang dijanjikan antara HD 7970 dan HD 6970. Tidak, lag maksimum GPU Cayman kurang dari dua kali. Dan paling sering hanya satu setengah. Secara umum, tidak begitu jelas bagi kita di mana mencari percepatan tessellation empat kali lipat, kita hanya perlu mengambil kata kita untuk itu bahwa itu ada di suatu tempat. Sementara itu, mari kita nyatakan kemenangan lain untuk chip video dari Nvidia - mereka sangat bagus dalam tes geometris.

Kesimpulan pada tes sintetis

Berdasarkan hasil pengujian sintetis kami dari kartu video terbaru Radeon HD 7970, berdasarkan Tahiti GPU dari keluarga Kepulauan Selatan, serta hasil dari model kartu video lain yang diproduksi oleh kedua produsen chip video diskrit, kami dapat menyimpulkan bahwa produk baru pasti akan menjadi pemimpin di antara solusi chip tunggal yang tersedia di pasar. Ini hanyalah kelanjutan yang sangat baik dari jajaran Radeon HD 5800 dan HD 6900 yang sukses, yang seharusnya secara serius memperkuat posisi AMD dalam beberapa bulan mendatang.

GPU Tahiti didasarkan pada arsitektur baru menggunakan teknologi proses 28nm paling canggih, dan sangat berbeda dari semua chip sebelumnya dari perusahaan. Meskipun jumlah beberapa unit eksekusi di dalamnya tidak bertambah banyak (unit komputasi ALU dan unit ROP), GPU baru ini berbeda dengan perubahan arsitektur penting yang bertujuan untuk meningkatkan efisiensi perhitungan pada GPU, serta meningkatkan posisi kinerja. pengolahan data geometrik. Banyak pengujian sintetis kami telah menunjukkan bahwa efisiensi perhitungan dalam tugas-tugas kompleks dan kecepatan tessellation dan eksekusi shader geometri telah meningkat secara signifikan, meskipun tidak selalu sebanyak yang kami harapkan.

Apa yang harus terjadi terjadi pada chip video AMD. Hal yang sama yang telah dialami Nvidia sedikit lebih awal. Karena penekanan dialihkan dari komputasi grafis ke komputasi tujuan umum, dan transisi yang sesuai dari VLIW ke arsitektur skalar, serta penambahan fungsi penting lainnya untuk GPGPU, seperti caching lanjutan dan menambahkan penjadwal ke setiap unit komputasi, peningkatan dalam kompleksitas chip tentu akan melebihi pertumbuhan indikator kinerja puncak. Artinya, murni pada kenyataannya, ternyata solusi sebelumnya bisa lebih efisien - meskipun kurang produktif, tetapi ini dicapai dengan sedikit usaha (dalam bentuk kompleksitas chip).

Mari kita jelaskan ini dengan sebuah contoh. Keuntungan Radeon HD 7970 dibandingkan Radeon HD 5870 yang sama dalam beberapa pengujian sintetis jauh dari perbedaan dalam kompleksitas GPU - lagi pula, Cypress memiliki tepat setengah dari jumlah transistor (2,15 versus 4,3 miliar), dan dalam pengujian jarang tertinggal seperti banyak. Ternyata chip lama lebih hemat dari yang baru? Ya, tetapi hanya untuk tugas grafis murni yang usang! Dalam hal perhitungan non-grafis, dan banyak perhitungan 3D yang rumit, Tahiti ternyata bahkan lebih dari dua kali lebih kuat dari Cypress, dan ini dikonfirmasi oleh sintetis yang sesuai. GPGPU adalah masa depan, dan tugas chip video akan menjadi lebih rumit, jadi AMD tidak punya cara lain.

Namun berkat perubahan arsitektur dan karakteristiknya, kartu video seri baru dalam banyak pengujian sintetis, yang sebelumnya merupakan "tumit Achilles" dari solusi AMD, menjadi lebih dari sekadar kompetitif, terutama dibandingkan dengan pesaing langsung Geforce GTX 580, bahkan dengan mempertimbangkan harga yang lebih tinggi. Ini terlihat jelas di hampir semua pengujian sintetis paket RightMark dan Vantage, serta contoh dari berbagai SDK.

Tapi ada juga yang berpotensi ... yah, tidak terlalu lemah, tetapi kekuatan GPU baru tidak mencukupi. Ini termasuk peningkatan kinerja yang tidak terlalu besar dalam beberapa tes matematika, dan pertanyaan tentang geometris juga muncul (misalnya, di mana percepatan empat kali lipat yang dijanjikan?). Meskipun kompleksitas dan area chip lebih besar dibandingkan dengan Cayman yang sama, hasil model HD 7970 terkadang lebih rendah dari yang diharapkan, yang tidak selalu dapat dijelaskan dengan mudah. Kami menduga bahwa kurangnya pengoptimalan driver mungkin menjadi penyebab hal ini, karena untuk AMD arsitektur ini benar-benar baru dan memerlukan pemolesan yang hati-hati dan panjang. Dalam beberapa pengujian, sistem manajemen daya PowerTune juga dapat gagal, yang dapat menurunkan kecepatan clock saat mencapai konsumsi daya maksimum dalam pengujian sintetis yang paling menuntut, mencegah kartu menampilkan kinerja yang diharapkan berdasarkan jumlah unit eksekusi dan frekuensi clocknya.

Meskipun, secara umum, hasil sintetis terbukti cukup baik, dan sangat menyenangkan bahwa para insinyur AMD memperketat beberapa titik lemah mereka. Sayangnya, dalam permainan saat ini akan jauh lebih sulit untuk mencapai keuntungan yang mengesankan seperti itu, dibandingkan dengan sintetis canggih. Karena beberapa alasan sekaligus. Bahkan hanya karena kinerja dalam aplikasi game jarang dibatasi oleh salah satu karakteristik kartu video, tidak seperti sintetis, dan dengan perubahan radikal dalam arsitektur grafis, driver masih perlu dioptimalkan dan dioptimalkan. Selain itu, bahkan game modern pun jarang memanfaatkan sepenuhnya kartu grafis PC kelas atas. Mereka sering mengalami kecepatan pengambilan sampel tekstur dan rasio pengisian efektif (bandwidth memori video), dan dalam kondisi seperti itu chip yang kompleks tidak dapat sepenuhnya terbuka. Kita harus menunggu baik eksklusif PC yang kuat atau generasi berikutnya dari konsol game.

Kami berasumsi bahwa hasil Radeon HD 7970 dalam pengujian sintetis akan dikonfirmasi oleh angka yang sesuai di bagian "permainan" dari materi kami. Dalam permainan, HD 7970 baru harus berkinerja lebih baik daripada semua pesaing dan mengungguli Geforce GTX 580 setidaknya 30%, atau bahkan lebih. Ini mungkin akan bekerja seperti biasa - dalam beberapa tes keuntungannya akan lebih besar, sementara di lain itu hampir tidak ada. Bagaimanapun, HD 7970 pasti akan menjadi yang terbaik di antara semua model chip tunggal dari AMD dan Nvidia, setidaknya kami telah menemukan semua prasyarat untuk ini. Jadi mari kita beralih ke bagian materi selanjutnya - studi tentang kecepatan dalam permainan.

Pintu keluar baru AMD Radeon HD 7970 GHz Edisi Itu tidak mengejutkan siapa pun, karena dari pengumuman Radeon HD 7970 (dan bahkan sebelumnya) dan pengenalan potensi overclocking yang sangat baik dari GPU Tahiti, desas-desus beredar tentang kemungkinan kartu video yang lebih cepat. . Jadi itu benar-benar terjadi, meskipun tidak segera setelah munculnya pesaing utama - NVIDIA GeForce GTX 680. Rupanya, penundaan tiga bulan dalam penampilan Radeon HD 7970 yang dipaksakan tidak hanya disebabkan oleh debugging 28-nm baru. proses teknis, tetapi juga oleh keinginan AMD pada saat yang sama harga yang lebih rendah untuk baris baru kartu video mereka. Sekarang Radeon HD 7970 GHz Edition yang baru berharga $ 499, yaitu $ 50 lebih rendah dari Radeon HD 7970 yang diumumkan lebih dari setengah tahun yang lalu, yang sekarang direkomendasikan untuk dijual seharga $ 429:

Mari kita pelajari produk baru, fitur-fiturnya, dan jawab pertanyaannya, dapatkah AMD menjadi pemimpin tunggal di antara kartu video prosesor tunggal dengan merilis Radeon HD 7970 GHz Edition?

spesifikasi

Karakteristik teknis AMD Radeon HD 7970 GHz Edition ditampilkan dalam tabel dibandingkan dengan karakteristik kartu video referensi AMD Radeon HD 7970 dan NVIDIA GeForce GTX 680:

Fitur desain

Secara lahiriah, dibandingkan dengan AMD Radeon HD 7970, referensi baru Radeon HD 7970 GHz Edition benar-benar tidak dapat dibedakan:




Secara alami, dalam hal ukuran kartu video, tidak ada perubahan yang terjadi - panjangnya adalah 278 mm, tinggi dan ketebalannya masing-masing 100 dan 38 mm.

Dari segi output juga tidak ada perubahan, video card ini dilengkapi dengan satu DVI-I dengan dukungan resolusi tinggi (Dual Link), satu HDMI versi 1.4a dan dua DisplayPort versi 1.2:


Mempertimbangkan tren ini, tentu saja dalam hal konektor daya, MIO dan BIOS ganda, tidak ada yang berubah baik: Radeon HD 7970 GHz Edition dilengkapi dengan konektor delapan dan enam pin untuk menghubungkan daya tambahan, dua konektor MIO untuk membuat bundel CrossFireX dan sakelar pemilihan BIOS kecil:


Meskipun frekuensi meningkat, konsumsi daya kartu video baru dinyatakan pada tingkat yang sama: dalam mode 3D mencapai puncak 250 W, dan dalam 2D ​​Radeon HD 7970 GHz Edition konsumsi dapat dikurangi hingga 3 W (bila monitor dimatikan). Izinkan kami juga mengingatkan Anda tentang menonaktifkan semua kartu video lainnya, kecuali yang pertama, dalam mode CrossFireX saat keluar dari mode 3D. Fitur yang tidak diragukan lagi berguna dari Radeon HD 79xx baru ini tidak hilang di mana pun.

Dalam hal tampilan papan sirkuit tercetak dan pengaturan elemen, kami tidak menemukan perubahan apa pun dibandingkan dengan Radeon HD 7970 biasa:


Seperti referensi Radeon HD 7970, versi paksa kartu video dilengkapi dengan skema daya "5 + 1", di mana lima fase jatuh pada GPU dan satu di sirkuit suplai memori video:


Mereka masih dikendalikan oleh pengontrol CHiL Semiconductor CHL8228G yang dipasang di bagian belakang sisi depan PCB:


GPU 28nm dari AMD Radeon HD 7970 GHz Edition kami adalah sebagai berikut:


Seperti yang Anda lihat dari tabel karakteristik, ia tidak memiliki perubahan fungsional: 2048 prosesor shader terpadu, 32 unit rasterisasi, dan 128 unit tekstur. Satu-satunya hal yang dilakukan AMD adalah meningkatkan frekuensinya dari 925 MHz sebelumnya menjadi 1000 MHz, dan juga memperkenalkan mode boost baru, di mana frekuensi GPU di bawah beban tinggi dapat ditingkatkan hingga 1050 MHz. Dengan demikian, kita dapat mengatakan bahwa frekuensi GPU AMD Radeon HD 7970 GHz Edition 13,5% lebih tinggi dari frekuensi Radeon HD 7970 biasa. Menurut data pemantauan, tegangan GPU dalam mode 3D adalah 1,256 V, dan dalam 2D, ketika frekuensi menurun menjadi 300 MHz, tegangan turun menjadi 0,949 V.

Kualitas ASIC dari kristal GPU ternyata sangat rendah - hanya 56,3%:


Seperti Radeon HD 7970 biasa, tiga gigabyte memori video GDDR5 terletak di 12 chip FCFBGA di sisi depan PCB. Chip tersebut diproduksi oleh Hynix Semiconductor Inc. dan ditandai H5GQ2H24AFR R0C:


Frekuensi efektif teoritis dari sirkuit mikro tersebut dalam mode 3D adalah 6000 MHz, di mana fungsi memori AMD Radeon HD 7970 GHz Edition, berbeda dengan 5500 MHz pada Radeon HD 7970 (+ 9,1%). Dengan lebar bus memori 384-bit, bandwidth memori mencapai rekor 288 GB / s. Dalam mode 2D, frekuensi dikurangi menjadi 600 megahertz efektif.

Referensi AMD Radeon HD 7970 GHz Edition tidak memiliki perubahan lagi:


Baca dengan utilitas GPU-Z dan simpan BIOS Anda dapat mengunduh dari arsip file.

Sistem pendingin dan efisiensinya

Seperti yang sudah Anda pahami, semua perbedaan antara AMD Radeon HD 7970 GHz Edition dan Radeon HD 7970 biasa dapat dihitung dengan dua jari, karena tidak menyentuh sistem pendingin kartu video, yang terdiri dari radiator dengan ruang penguapan tembaga di pangkalan, dasar tembaga, turbin dan casing plastik:


Kami tidak menemukan satu perubahan pun saat membongkar pendingin ini dan melepas kipas radialnya:




Menurut data pemantauan, kecepatan putaran turbin ini dapat bervariasi dalam kisaran 1050 hingga 5400 rpm, dan konsumsi daya maksimum tidak boleh melebihi 20 watt.

Untuk memeriksa rezim suhu kartu video sebagai beban, kami menggunakan lima siklus uji dari game Aliens vs. Predator (2010) dengan kualitas grafis maksimum pada 2560x1440 piksel dengan pemfilteran anisotropik 16x dan anti-aliasing MSAA 4x:



Untuk memantau suhu dan parameter lainnya, program ini digunakan MSI Afterburner versi 2.2.2 dan utilitas GPU-Z versi 0.6.3. Semua pengujian dilakukan dalam wadah tertutup dari unit sistem, yang konfigurasinya dapat Anda lihat di bagian artikel selanjutnya, pada suhu kamar 25 derajat Celcius. Pengujian efisiensi sistem pendingin kartu video dilakukan sebelum pembongkarannya menggunakan antarmuka termal standar.

Mari kita lihat apakah pendingin referensi AMD Radeon HD 7970 GHz Edition akan mengatasi peningkatan frekuensinya:


Mode otomatis Daya maksimum


Ya, dia mengatasinya, tentu saja, tetapi mode suhu kartu video dengan kontrol kecepatan kipas otomatis meninggalkan banyak hal yang diinginkan, karena prosesor grafis memanas hampir 90 derajat Celcius, dan kipas radial dipercepat hingga 3200 rpm, yaitu sangat berisik. Sangat sulit untuk berada di ruangan yang sama dengan kartu video yang menderu pada maksimum 5400 rpm, tetapi rpm tinggi seperti itu memungkinkan Anda untuk memenangkan kembali 18 derajat Celcius sekaligus dalam hal suhu GPU di puncak beban di atasnya.

Potensi overclock

Mungkin karena kualitas GPU yang rendah, atau mungkin hanya karena nasib buruk, tetapi potensi overclocking dari sampel AMD Radeon HD 7970 GHz Edition yang diberikan kepada kami untuk pengujian ternyata rata-rata. Tanpa meningkatkan tegangan pada inti, dimungkinkan untuk melakukan overclock hanya hingga 1180 MHz:


Memori juga menjadi sederhana dengan overclocking, berhenti hanya pada 6680 MHz. Hasilnya, frekuensi kartu video kami adalah 1180 MHz (+ 12,4%) untuk GPU dan 6680 MHz (+ 11,3%) untuk memori video:


Yah, setidaknya mode suhu kartu video yang di-overclock dengan penyesuaian otomatis kecepatan kipas praktis tidak berubah:


Sedikit kesal, kami memutuskan untuk memeras "semua jus" dan, memasukkan penyumbat telinga dan mengatur kecepatan kipas ke maksimum, kami memeriksa potensi prosesor grafis pada peningkatan tegangan 1,3 V. Hasilnya adalah 1250 MHz, yang tidak terlalu buruk:




Rezim suhu kartu video yang di-overclock dengan peningkatan tegangan ternyata sebagai berikut:


Suhu puncak GPU mencapai 77 derajat Celcius (ingat - pada turbin maksimum 5400 rpm). Kami berharap kartu video seri “Edisi GHz” dengan pendingin asli dan sangat efisien akan dapat menyenangkan kami tidak hanya dengan suhu yang lebih rendah, tetapi juga dengan tingkat kebisingan yang moderat.

Konsumsi energi

Konsumsi energi sistem dengan berbagai kartu video diukur menggunakan panel multifungsi Zalman ZM-MFC3, yang menunjukkan konsumsi sistem "dari stopkontak" secara keseluruhan (tidak termasuk monitor). Pengukuran dilakukan dalam mode 2D, selama pekerjaan normal di Microsoft Word atau "berselancar" Internet, serta dalam mode 3D, beban yang dibuat menggunakan tes tiga kali dari game Metro 2033: The Last Refuge di 2560x1440 pada pengaturan kualitas grafis maksimum.

Mari kita lihat hasilnya:



Jelas, untuk sistem pengujian kami dengan prosesor enam inti yang di-overclock dan kartu video mana pun yang diuji hari ini, catu daya 550 watt berkualitas tinggi sudah cukup. Untuk AMD Radeon HD 7970 GHz Edition yang baru, pada frekuensi nominal, sistem dengannya mengonsumsi daya 20 watt lebih banyak daripada sistem dengan Radeon HD 7970 biasa, dan sekitar 80 watt lebih banyak daripada sistem dengan GeForce GTX 680 yang tidak di-clock. Catatan bahwa pada kartu video overclocking, konsumsi daya sistem di puncak beban tidak meningkat secara signifikan, bahkan ketika tegangan pada GPU naik. Dalam mode siaga, angka konsumsi daya hampir sama.

Konfigurasi pengujian, alat, dan metodologi pengujian

Kartu video diuji pada sistem dengan konfigurasi berikut:

Motherboard: Intel Siler DX79SI (Intel X79 Express, LGA 2011, BIOS 0525 tanggal 07/09/2012);
CPU: Intel Core i7-3960X Extreme Edition 3,3 GHz(Sandy Bridge-E, C1, 1.2 V, 6x256 KB L2, 15 MB L3);
Sistem pendingin CPU: Phanteks PH-TC14PЕ (2x135 mm, 900 rpm);
Antarmuka termal: ARCTIC MX-4;
RAM: DDR3 4x4 GB Mushkin Redline(2133 MHz, 9-10-10-28, 1,65 V);
Kartu Video:

AMD Radeon HD 7970 GHz Edition 3 GB 384 bit GDDR5, 1050/6000 dan 1250/6680 MHz @ 1,3 V;
Sapphire Radeon HD 7970 OC Dual-X 3 GB 384 bit GDDR5, 925/5500 MHz;
ASUS GeForce GTX 680 DirectCU II TOP 2 GB 256 bit GDDR5, 1006/6008, 1137/6008 dan 1217/7168 MHz;

Disk sistem: SSD 256 GB Krusial m4 (SATA-III, CT256M4SSD2, BIOS v0009);
Disk untuk program dan game: Western Digital VelociRaptor (SATA-II, 300 GB, 10.000 rpm, 16 MB, NCQ) dalam kotak Scythe Quiet Drive 3,5 ";
Disk arsip: Samsung Ecogreen F4 HD204UI (SATA-II, 2 TB, 5400 rpm, 32 MB, NCQ);
Kasus: Antec Dua Belas Ratus (dinding depan - tiga Noiseblocker NB-Multiframe S-Series MF12-S2 pada 1020 rpm; kembali - dua Penghalang Kebisingan NB-BlackSilentPRO PL-1 pada 1020 rpm; atas - kipas standar 200 mm pada 400 rpm);
Panel kontrol dan pemantauan: Zalman ZM-MFC3;
Sumber Daya listrik: Xigmatek "Tanpa Aturan Kekuasaan" NRP-HC1501(1500W) kipas 140mm
Monitor: 27 "Samsung S27A850D (DVI-I, 2560x1440, 60 Hz).

Sebagai perbandingan dengan AMD Radeon HD 7970 GHz Edition, kami menyertakan kartu video dalam pengujian Sapphire Radeon HD 7970 OC Dual-X 3 GB:


Karena kedua BIOS-nya telah meningkatkan frekuensi, kami secara manual mengurangi frekuensi prosesor grafis dan memori kartu video ke frekuensi nominal untuk Radeon HD 7970 –925/5500 MHz, meskipun GPU-Z dengan keras kepala menunjukkan kepada kami frekuensi yang sedikit meningkat:


Di sisi NVIDIA, kami menyertakan GeForce GTX 680 terbaik di lab kami untuk pengujian. Ini adalah kartu video ASUS GeForce GTX 680 DirectCU II TOP 2 GB:


Performanya diuji pada frekuensi nominal untuk ASUS - 1137/6008 MHz, frekuensi nominal untuk referensi NVIDIA GeForce GTX 680 - 1006/6008 MHz, dan dengan kemungkinan overclocking maksimum untuk instans kartu video ini 1217/7168 MHz:


Untuk mengurangi ketergantungan kinerja kartu video pada kecepatan platform, prosesor enam inti 32 nm dengan pengali 37, frekuensi referensi 125 MHz, dan fungsi "Kalibrasi Load-Line" yang diaktifkan di-overclock hingga 4,625 GHz ketika tegangan di BIOS motherboard dinaikkan menjadi 1,47 V:



Teknologi Hyper-Threading diaktifkan. Pada saat yang sama, RAM 16 GB beroperasi pada frekuensi 2 GHz dengan pengaturan waktu 9-10-10-28 pada tegangan 1,65 V.

Pengujian, yang dimulai pada 30 Juli 2012, dilakukan di bawah sistem operasi Microsoft Windows 7 Ultimate x64 SP1 dengan semua pembaruan penting pada tanggal yang ditentukan dan dengan driver berikut diinstal:

chipset motherboard Driver Chipset Intel - 9.3.0.1020 WHQL dari 26.01.2012;
Pustaka DirectX End-User Runtimes, dirilis pada 30 November 2010;
driver kartu video pada GPU AMD - Katalis 12.x (8.982.0.0 RC1) dari 19.07.2012+ Profil Aplikasi Katalis 12,7 (CAP1);
driver kartu video pada GPU NVIDIA - GeForce 304.79 beta mulai 07/03/2012.

Kinerja kartu video diuji dalam dua resolusi: 1920x1080 dan 2560x1440 piksel. Dua mode kualitas grafis digunakan untuk pengujian: "Kualitas + AF16x" - kualitas tekstur pada driver secara default dengan pemfilteran anisotropik pada level 16x, dan "Kualitas + AF16x + MSAA 4x (8x)" dengan pemfilteran anisotropik pada level 16x dan tingkat anti-aliasing layar penuh 4x atau 8x, dalam kasus di mana jumlah rata-rata frame per detik tetap cukup tinggi untuk kenyamanan bermain game. Pemfilteran anisotropik dan anti-aliasing layar penuh diaktifkan langsung di pengaturan game. Jika pengaturan ini tidak ada dalam game, maka pengaturan diubah di panel kontrol driver Catalyst dan GeForce. Sinkronisasi vertikal juga dinonaktifkan di sana. Tidak ada perubahan lebih lanjut yang dilakukan pada pengaturan driver.

Daftar aplikasi pengujian terdiri dari dua paket semisintetik, satu techno-demo dan 13 game yang diperbarui ke versi terbaru (sejak tanggal mulai pengujian):

3DMark Vantage(DirectX 10) - versi 1.0.2.1, pengaturan profil "Kinerja" dan "Ekstrim" (hanya tes dasar yang diuji);
3DMark 2011(DirectX 11) - versi 1.0.3.0, pengaturan profil "Kinerja" dan "Ekstrim";
Demo Unigine Surga(DirectX 11) - versi 3.0, pengaturan kualitas maksimum, tessellation pada level "ekstrim", AF16x, resolusi 1280x1024 tanpa MSAA dan 1920x1080 dengan MSAA 8x;
(DirectX 11) - versi 1.6.02, profil pengaturan "Peningkatan pencahayaan dinamis DX11" dengan pengaturan manual tambahan untuk semua parameter secara maksimal, kami menguji catatan demo kami sendiri "cop03" di tingkat "Backwater";
Metro 2033: Tempat Perlindungan Terakhir(DirectX 10/11) - versi 1.2, uji resmi digunakan, pengaturan kualitas "Sangat Tinggi", tessellation, DOF diaktifkan, anti-aliasing AAA digunakan, pass berurutan ganda dari adegan "Frontline";
Hanya Sebab 2(DirectX DX10.1) - versi 1.0.0.2, pengaturan kualitas maksimum, metode "Background blur" dan simulasi air GPU "dinonaktifkan, pass berurutan ganda dari rekaman demo" Menara Gelap ";
Alien vs. Pemangsa (2010)(DirectX 11) - "Kualitas Tekstur" dalam mode "Sangat Tinggi", "Kualitas Bayangan" dalam mode "Tinggi", teknologi SSAO diaktifkan, dua siklus pengujian pada setiap resolusi;
Planet yang Hilang 2(DirectX 11) - versi game 1.0, pengaturan kualitas grafis maksimum, gerakan kabur diaktifkan, uji kinerja "B" digunakan;
Peradaban Sid Meier V(DirectX 11) - versi game 1.0.1.348, pengaturan kualitas grafis maksimum, uji "diplomatik" dua kali dari lima adegan paling sulit;
Perang Total: Shogun 2(DirectX 11) - versi 2.0, tes bawaan (pertempuran di Sekigahara) pada pengaturan kualitas grafis maksimum dan menggunakan salah satu mode MSAA 4x;
Krisis 2(DirectX 11) - versi 1.9, digunakan Alat Patokan Adrenalin Crysis 2 v1.0.1.14 BETA, Profil pengaturan kualitas grafis "Ultra Tinggi", tekstur resolusi tinggi diaktifkan, siklus perekaman demo ganda pada tahap "Times Square";
Demo pengaturan ulang keras(DirectX 9) - tes yang dibangun ke dalam versi demo dengan grafis berkualitas Ultra, satu lintasan adegan pengujian;
Batman: kota arkham(DirectX 11) - versi 1.2, pengaturan kualitas grafis maksimum, fisika dinonaktifkan, lulus tes berurutan ganda yang ada di dalam game;
Medan Perang 3(DirectX 11) - versi 1.4, semua pengaturan kualitas grafis ke "Ultra", pass berurutan ganda dari adegan skrip dari awal misi "On the Hunt" yang berlangsung 110 detik;
Pertarungan DiRT(DirectX 11) - versi 1.0, tes bawaan di trek Nevada pada pengaturan kualitas grafis maksimum (Ultra preset);
Benchmark v2 elit penembak jitu(DirectX 11) - versi 1.05, digunakan Alat Patokan Adrenalin Sniper Elite V2 v1.0.0.2 BETA pengaturan kualitas grafis maksimum ("Ultra"), Bayangan Lanjutan: TINGGI, Oklusi Sekitar: ON, Stereo 3D: OFF, uji coba berurutan ganda;

Penjelasan lebih rinci tentang metode pengujian kartu video dan pengaturan grafis di beberapa game yang terdaftar dapat ditemukan di yang dibuat khusus untuk ini. cabang konferensi kami, serta berpartisipasi dalam diskusi dan peningkatan teknik ini.

Jika game menerapkan kemampuan untuk memperbaiki jumlah minimum frame per detik, maka itu juga tercermin dalam diagram. Setiap tes dilakukan dua kali, yang terbaik dari dua nilai yang diperoleh diambil sebagai hasil akhir, tetapi hanya jika perbedaan di antara keduanya tidak melebihi 1%. Jika penyimpangan uji berjalan melebihi 1%, maka pengujian diulang setidaknya satu kali lagi untuk mendapatkan hasil yang andal.

Hasil dan analisis tes kinerja

3DMark Vantage



Tes Vantage 3DMark semi-sintetik pertama menunjukkan kepada kita gambar yang agak menarik. Jika dalam mode tanpa anti-aliasing, AMD Radeon HD 7970 GHz Edition yang baru masih terasa lebih rendah daripada GeForce GTX 680, dalam mode pengaturan "Ekstrim" yang lebih intensif sumber daya, perbedaannya dikurangi seminimal mungkin. Saat kedua kartu video di-overclock, gambar tidak berubah, NVIDIA sedikit lebih cepat dari AMD di sini. Secara umum, Radeon HD 7970 GHz Edition mengungguli pendahulunya dengan 6,5-10,6%.

3DMark 2011



Di 3DMark 2011, keselarasan kekuatan tidak berubah, tetapi kepemimpinan GeForce GTX 680 lebih percaya diri di sini. AMD Radeon HD 7970 GHz Edition sekitar 9% di depan HD 7970 biasa.

Demo Unigine Surga



Gambar berulang: dalam mode grafis "ringan", GeForce GTX 680 menunjukkan kecepatan yang lebih tinggi daripada kedua variasi Radeon HD 7970, dan pada resolusi 1920x1080 dan dengan anti-aliasing diaktifkan, kinerja kartu video praktis setara. Radeon HD 7970 GHz Edition yang baru 10,5-12% lebih cepat daripada HD 7970 biasa.

S.T.A.L.K.E.R .: Panggilan Pripyat


Seperti yang dapat kita lihat dari hasil Radeon HD 7970 biasa, di STALKER .: Call of Pripyat, kartu video kelas atas dari AMD belum pernah hilang sebelumnya, dan dengan dirilisnya Radeon HD 7970 GHz Edition, mereka mulai melampaui pesaing dalam menghadapi GeForce GTX 680 sebesar 7,5-11%. Demi keadilan, kami mencatat bahwa ketika meng-overclock kedua kartu video ini, kinerjanya praktis sama, termasuk dalam mode dengan anti-aliasing.

Metro 2033: Tempat Perlindungan Terakhir


Di Metro 2033: The Last Refuge, Radeon HD 7970 yang sederhana sudah sedikit lebih cepat daripada GeForce GTX 680, dan Edisi GHz yang baru mampu meningkatkan celah ini, karena karena frekuensi yang lebih tinggi, ia mengungguli HD 7970 biasa dengan 4-6 %. Benar, Anda dapat memainkan Metro 2033 dengan nyaman di kartu video ini hanya pada resolusi 1920 x 1080 piksel ke bawah.

Hanya Sebab 2


Just Cause 2 menunjukkan kepada Anda dan saya perlunya meng-overclock Radeon HD 7970 dan mengubahnya menjadi Edisi GHz untuk bersaing dengan GeForce GTX 680. Jika flagship AMD sebelumnya tertinggal dari pesaing langsungnya, maka versi paksa sudah ada di setara dengan itu dalam game ini.

Alien vs. Pemangsa (2010)


Dalam permainan Aliens vs. Predator (2010) Radeon HD 7970 tampak lebih disukai daripada GeForce GTX 680 sebelumnya, dan dengan dirilisnya versi GHz Edition dari kartu video ini, ia mampu meningkatkan keunggulannya hingga 44% dalam mode paling intensif sumber daya.

Planet yang Hilang 2

Tetapi di Lost Planet 2, peningkatan frekuensi AMD Radeon HD 7970 GHz Edition tidak membantunya dalam perang melawan GeForce GTX 680:


Kesenjangan itu menutup, tapi tidak lebih. Para pemimpin dalam game ini masih menggunakan kartu video berbasis GPU NVIDIA.

Peradaban Sid Meier V


Penggemar game Sid Meier's Civilization V memiliki, secara umum, hanya satu pilihan - kartu video berbasis GPU AMD, yang mengungguli pesaing hingga 67%.

Perang Total: Shogun 2

Hingga update terbaru untuk Total War: Shogun 2, yang secara otomatis diinstal oleh Steam, kartu grafis NVIDIA dapat bersaing dengan kartu grafis AMD, tetapi sekarang situasinya telah berubah secara dramatis:


Ini sudah terjadi beberapa bulan yang lalu, dan NVIDIA mampu memperbaiki situasi di game ini dengan merilis versi baru driver. Akankah kali ini - waktu akan memberi tahu, tetapi untuk saat ini GeForce GTX 680 ada di sini hanya dalam peran untuk mengejar ketinggalan.

Krisis 2


Jika sebelumnya Radeon HD 7970 dan GeForce GTX 680 kira-kira sama di Crysis 2, maka dengan dirilisnya Radeon HD 7970 GHz Edition, keseimbangannya menguntungkan AMD. Meskipun dengan sedikit keuntungan, tetapi kebaruan memimpin dalam tes ini. Dengan overclocking maksimum kedua kartu video, kinerjanya tidak berbeda.

Demo pengaturan ulang keras


Di sini AMD Radeon HD 7970 GHz Edition yang baru mengungguli Radeon HD 7970 biasa hingga 16%, dan karena ini, hilangnya GeForce GTX 680 digantikan oleh kemenangan atasnya. Namun, yang terakhir, ketika di-overclock, mendapatkan pengembalian yang lebih tinggi dalam Hard Reset daripada Radeon HD 7970 GHz Edition, dan dengan mudah mendapatkan kembali kepemimpinannya.

Batman: kota arkham


AMD Radeon HD 7970 GHz Edition bermain dengan berbagai keberhasilan di Batman: Arkham City: jika dalam mode tanpa anti-aliasing, GeForce GTX 680 sangat cepat, maka ketika MSAA 8x diaktifkan, telapak tangan beralih ke kartu video AMD baru, yang adalah 7- sembilan persen.

Medan Perang 3


Peningkatan frekuensi Radeon baru ternyata sesuai di game Battlefield 3: di mana GeForce GTX 680 sebelumnya memimpin, sekarang Edisi HD 7970 GHz setidaknya tidak kalah, dan bahkan sedikit mengungguli pesaing dalam hal anti- mode alias.

Pertarungan DiRT


Yah, semuanya jelas di sini dan tanpa komentar, dengan mesin DiRT Showdown arsitektur NVIDIA bekerja kurang efisien, oleh karena itu mengalami kegagalan total dalam game ini dengan latar belakang hasil kartu video AMD yang tinggi.

Benchmark v2 elit penembak jitu


Situasinya serupa, tetapi masih belum begitu cerah, dalam tes Sniper Elite V2 yang baru. Keunggulan AMD Radeon HD 7970 GHz Edition dibandingkan GeForce GTX 680 mencapai 54% yang mengesankan di sini.

Secara tradisional, kami menerapkan final ke diagram dan grafik, dan beralih ke diagram ringkasan.

Bagan pivot

Pasangan diagram ringkasan pertama akan menunjukkan kepada kita keunggulan AMD Radeon HD 7970 GHz Edition dengan frekuensi 1050/6000 MHz dibandingkan Radeon HD 7970 biasa dengan frekuensi 925/5500 MHz:



Rata-rata, untuk semua pengujian, peningkatan frekuensi GPU sebesar 13,5% dan memori video sebesar 9,1% membawa Radeon HD 7970 peningkatan kinerja sebesar 9,3-9,6% pada resolusi 1920 x 1080 piksel dan 9,9-10 % pada resolusi 2560 x 1440 piksel. ... Keuntungan terbesar dicapai dalam game seperti Aliens vs. Predator (2010) dan Lost Planet 2, dan minimal di Metro 2033: The Last Refuge.

Sekarang mari kita lihat konfrontasi antara AMD Radeon HD 7970 GHz Edition 3 GB dan GeForce GTX 680 2 GB pada frekuensi nominalnya:



GeForce GTX 680 masih lebih cepat dalam pengujian semi-sintetik, Lost Planet 2, serta mode individual Just Cause 2, Hard Reset, Batman: Arkham City dan Battlefield 3. Dalam pengujian lainnya, keunggulan ada di sisi AMD baru. Radeon HD 7970 GHz Edition, apalagi di game seperti Aliens vs. Predator (2010), Sid Meier's Civilization V, Total War: Shogun 2, DiRT Showdown dan Sniper Elite V2 cukup bagus.Namun, jangan lupa bahwa hari ini banyak tergantung pada game tertentu dan mesinnya, dan bukan hanya pada kinerja. contoh, dari pengalaman saya sendiri, saya akan mengatakan bahwa StarCraft II: Wings of Liberty (karena ketergantungan prosesor yang berlebihan) dan HAWX Tom Clancy 2 (mengingat tidak relevan) akan memimpin GeForce GTX 680. Jadi semuanya relatif.

Terakhir, mari kita bandingkan kinerja AMD Radeon HD 7970 GHz Edition yang di-overclock pada 1250/6680 MHz dan ASUS GeForce GTX 680 TOP pada 1217/7168 MHz:



Tidak dapat dikatakan bahwa situasinya telah berubah secara dramatis, namun, GeForce GTX 680, karena overclocking yang lebih tinggi (dalam persentase), berhasil mengurangi lag di belakang Radeon HD 7970 GHz Edition di mana ia menang dan meningkatkan di mana ia kalah.

Kesimpulan

Mengatakan bahwa AMD Radeon HD 7970 GHz Edition yang baru sekarang menjadi kartu video prosesor tunggal tercepat tidak sepenuhnya benar, karena kami tidak mengungkapkan keunggulan totalnya atas referensi NVIDIA GeForce GTX 680. Namun demikian, peningkatan frekuensi memungkinkan solusi grafis ini melampaui tingkat kinerja kartu video AMD Hi-End sebelumnya sebesar 10% dan dalam banyak kasus masih mengungguli pesaing dari NVIDIA. Namun, menurut kami, rilis AMD Radeon HD 7970 GHz Edition ternyata agak "buram", karena saat ini selusin pabrik Radeon HD 7970 dengan frekuensi yang meningkat, dan terkadang dengan frekuensi yang lebih tinggi dari level "Edisi GHz", ditawarkan secara bebas. Artinya, kinerja produk baru secara umum tidak mengejutkan siapa pun dan tentu saja tidak mengesankan siapa pun. Mungkin, penggemar overclocking menaruh harapan terbesar padanya, mengharapkan langkah baru dari inti Tahiti XT, tegangannya yang berkurang dan, sebagai akibatnya, potensi overclocking yang tinggi. Dalam artikel hari ini, sayangnya, ini tidak dikonfirmasi. Kami berharap kartu video serial akan lebih menarik dalam hal ini. Waktu akan menunjukkan.

AMD memamerkan kartu grafis Radeon HD 7970 pada paruh pertama Januari. Produk baru ini ternyata sangat sukses dan berhak menduduki puncak daftar solusi chip tunggal paling produktif di pasar. Saat ini saatnya untuk mempersiapkan dan mempublikasikan materi tentang pesaing utama (GTX 680 disajikan pada malam 22 Maret), tetapi karena keadaan, kami melewati kubu "merah" pada bulan Januari. Dan celah ini harus diisi. akan mempertimbangkan solusi teratas dari AMD pada contoh kartu video dari Gigabyte. Indeks model rumit dan tidak semua orang akan memahaminya - GV-R797D5-3GD-B - jadi kami akan menghilangkannya di artikel kami. Mari kita mulai dengan spesifikasinya.

Gigabyte Radeon HD 7970 | spesifikasi

Kartu ini dilengkapi dengan chip arsitektur baru dengan nama kode Tahiti. Ini adalah arsitektur pertama dalam rangkaian yang direncanakan, dengan nama kode Kepulauan Selatan. Kami telah menyaksikan rilis Tahiti berikut kartu dengan chip Cape Verde (baris 77xx), dan baru-baru ini juga kartu 78xx dengan chip Pitcairn.

Rekan-rekan kami telah mengatakan banyak tentang fitur utama dari arsitektur baru, jadi kami tidak melihat banyak arti dalam pengulangan. Mari kita tekankan hanya metrik utama yang dapat diukur yang mungkin menarik bagi pengguna biasa yang tidak masuk ke dalam struktur logis tertentu dari unit komputasi. Karakteristik utama kartu seri HD 7970, di mana Gigabyte dicontohkan hari ini, diberikan dalam tabel.

Ciri Radeon HD 7970 Radeon HD 6970 Nvidia GTX 580
Standar proses teknologi, nm 28 40 40
Luas kristal, mm² 378 389 530
Perkiraan jumlah transistor, juta. 4300 2640 3000
Frekuensi inti dalam mode 2D, MHz 150 150 50/100
Frekuensi inti dalam mode 3D, MHz 925 880 772/1544
Ukuran memori, MB 3072 2048
Frekuensi memori dalam 2D, MHz 300 300 67
Frekuensi memori dalam 3D, MHz 5500 5500 4008
Lebar bus memori, bit 384 256 384
Jumlah shader, pcs 2048 1536 512
Jumlah blok rasterisasi, pcs 32 32 48
Jumlah unit tekstur, pcs 128 96 64
Konsumsi daya dalam 2D, W 3 20 -
Konsumsi daya dalam 3D (maksimum), W 250 250 244
Keseluruhan P x P x T, mm 275x100x37 275x100x37 270x100x38

Selain perubahan arsitektur, yang tidak diragukan lagi signifikan, kebaruan memiliki keunggulan kompetitif lain - proses teknologi "halus". Radeon HD 7970 adalah kartu video pertama dengan chip 28nm yang diproduksi di pabrik TSMC. Dan ini segera memberikan peluang untuk meningkatkan efisiensi, mengurangi konsumsi energi per unit produktivitas. Alhasil, pada kristal dengan luas 365 mm². berhasil mengetsa lebih dari empat miliar transistor. Di Cayman, dengan luas 389 mm², itu sedikit lebih dari dua setengah, dan dalam kasus pemimpin "hijau" saat ini, GTX 580, dengan ukuran kristal raksasa (520 sq. Mm ) - sekitar 3 miliar. Di GTX 680, berkat transisi ke teknologi proses 28nm, dimungkinkan untuk memasang 3,54 miliar transistor di area yang jauh lebih kecil 294 mm².

Frekuensi inti telah meningkat, tetapi memori masih berjalan di bawah beban pada frekuensi efektif yang sama yaitu 5500 MHz. Tetapi lebar bus memori meningkat menjadi 384 bit, seperti model pesaing GTX 580 (meskipun diputuskan untuk kembali ke bus 256-bit untuk GTX 680). Ini meningkatkan bandwidth memori menjadi 264 GB per detik. Jumlah memori juga meningkat satu setengah kali dan mencapai tiga gigabyte.

Jika kita berbicara tentang unit komputasi, maka pada chip baru ada peningkatan kuantitatif dibandingkan dengan pendahulunya. Kecuali bahwa masih ada 32 ROP yang tersisa. Angka yang menarik terlihat di tabel - konsumsi daya dalam mode 2D. Hanya tiga watt! Jika demikian, "Tahiti" adalah chip grafis top idle terdingin yang pernah ada.

Radeon HD 7970 adalah perangkat mainstream pertama yang mendukung PCI Express 3.0. Sangat praktis, mengingat tampilan platform Intel LGA 2011 dan prosesor Sandy Bridge-E. Selain itu, prosesor Ivy Bridge yang berisi pengontrol PCI Express 3.0 akan muncul pada akhir April. Dan kemudian menggandakan bandwidth antarmuka akan menjadi lebih tersedia. Produsen motherboard bersiap-siap untuk mengisi pasar dengan model multiplexer cepat. Pertanyaan wajar yang muncul adalah apakah HD 7970 akan dapat memanfaatkan PCI Express 3.0? - kami tidak akan menjawab dalam kerangka artikel ini. Tetapi kami berjanji untuk melengkapi materi setelah menerima peralatan yang diperlukan yang kami miliki.

Gigabyte Radeon HD 7970 | Inspeksi terperinci

Sampel dengan desain referensi tidak semenarik kartu video dengan pendingin dan PCB yang dikembangkan sendiri. Namun, sebagai sampel, titik awal untuk meninjau akselerator modifikasi yang akan datang, perlu untuk "membedah" yang asli. Bukan tanpa alasan itu disebut versi referensi.

Seperti biasa dalam kasus akselerator kelas atas, papannya terlalu besar: panjangnya 26,5 sentimeter, dan sistem pendinginnya dua slot. Casing plastik, menyembunyikan nuansa pendinginan, ditutupi dengan stiker Gigabyte - tungau untuk membedakannya dari banyak "klon". Mari kita perhatikan braket logam di bagian belakang papan: itu mengeraskan tempat pendingin terpasang ke chip.

Ada empat konektor layar pada penutup slot: AMD pada kartu video generasi terbaru memperhatikan konfigurasi multi-monitor. DVI dan HDMI yang paling umum dilengkapi dengan dua soket mini-DP untuk pemilik monitor modern yang bahagia.

Untuk memberi daya pada kartu video, dua konektor ditampilkan di dinding samping: enam dan delapan pin.

Di tempat tradisional, ada konektor untuk menghubungkan kartu video dengan jembatan ke array CrossFireX. Di sebelah kiri, jika Anda perhatikan lebih dekat, ada sakelar kecil di antara kedua BIOS. Ada dua di antaranya di kartu: jika ada masalah dengan yang pertama selama percobaan dengan mengganti firmware, atau kesalahan apa pun, Anda dapat beralih ke yang cadangan.

Pendinginan dilakukan oleh ruang penguapan tembaga sekarang tradisional, di mana sirip aluminium disolder. Dan mereka dihembuskan oleh kipas desain turbin sesuai dengan skema standar: udara melewati seluruh kartu ke arah peningkatan suhu komponen (dari baterai ke chip) dan dikeluarkan melalui dinding belakang kasing. Salinan Gigabyte Radeon HD 7970 kami telah berada di tangan "peduli" seseorang: radiator di bawah casing telah mengalami pengaruh kejam seseorang, memar terlihat.

Seluruh sistem pendingin dipasang dalam bingkai logam dan dibaut bersama di area chip video. Bingkai tidak hanya memberikan kekakuan, tetapi juga menghilangkan panas dari baterai dan chip memori. Kontak dilakukan melalui spacer termal.

Dasar tembaga dari ruang penguapan secara kasar selesai.

Setelah menghilangkan sisa pasta termal dari chip, papan muncul dalam bentuk berikut:

Dalam hal ini, chip memori dual-gigabit Hynix H5GQ2H24MFR R0C digunakan. Frekuensi nominal operasi mereka adalah 6 GHz, yang 500 MHz lebih tinggi dari mode operasi normal di Radeon HD 7970. Dengan demikian, Anda dapat mengandalkan overclocking memori.

Tidak ada tanda pada kristal - permukaan silikon murni seperti cermin. Namun tidak seperti flagship generasi sebelumnya, di HD 7970 bingkai pelindung di sekitar chip menjadi lebih besar dan membingkainya dengan rapat.

Mari kita perhatikan subsistem daya. Ada enam fase di bagian belakang kartu: lima untuk inti itu sendiri, satu untuk chip memori. Dalam deretan choke dan kunci yang ramping, ada celah yang menganga, di mana diasumsikan bahwa ada komponen dari fase lain - itu benar-benar dalam sampel teknik pertama, tetapi untuk beberapa alasan diputuskan untuk melepaskan kartu dengan fase yang lebih sedikit dalam produk.

Kontrol fase dipercayakan ke pengontrol CHiL CHL8228G delapan saluran, yang akrab dengan kartu grafis AMD generasi sebelumnya.

Fase terpisah memberi daya pada logika I / O, terletak lebih dekat ke bagian depan papan dan dikendalikan secara terpisah.

Gigabyte Radeon HD 7970 | Platform dan aplikasi uji

Konfigurasi bangku tes ditunjukkan pada tabel di bawah ini. Untuk membaca, kami menggunakan platform Sandy Bridge dengan mikroprosesor Intel Core i5 2500K yang di-overclock hingga 4 GHz.

Untuk saingan Gigabyte Radeon HD 7970, kami telah mengidentifikasi kartu video referensi pendahulunya dari AMD dan kartu teratas dari Nvidia (dengan mempertimbangkan GTX 680 yang belum dirilis pada saat pengujian). Konfigurasi perangkat keras yang ditentukan menjalankan Windows 7 Ultimate x64 SP1. Versi driver grafis: AMD Catalyst 12.2 dan 296.10 untuk kartu Nvidia.

Kumpulan aplikasi dan pengaturan pengujian ditunjukkan pada tabel di bawah ini.

Semua game ditangkap pada 1920 x 1080 menggunakan DirectX 11 API secara eksklusif.

Gigabyte Radeon HD 7970 | Hasil tes

Mari kita beralih ke hasil yang diperoleh. Sebagai permulaan, tes sintetis. Dalam 3DMark 11, Radeon HD 7970 memimpin dengan solid, melebihi seperempat GTX 580 terbaik kedua.

Benchmark Unigine Heaven berguna tidak hanya untuk menilai kinerja secara umum, tetapi juga untuk menganalisis kemungkinan dalam efek visual individu, misalnya, dalam tessellation. Grafik menunjukkan perbedaan jumlah frame pada mode tessellation Normal dan Extreme.

Seperti yang Anda lihat, HD 7970 hanya sedikit lebih baik daripada GTX 580. Namun pemimpin performa sebelumnya, AMD, sangat tertinggal di belakang. Dengan demikian, kami dapat mengevaluasi upaya para insinyur AMD yang telah meningkatkan kinerja secara signifikan menurut tolok ukur ini.

Di Crysis 2, kebaruan praktis memberikan FPS minimum pada tingkat yang nyaman. Jika dalam kasus kartu saingan, pembekuan dimungkinkan, dalam kasus HD7970 mereka hampir tidak terlihat, gambarnya halus dan memungkinkan Anda untuk bermain dengan nyaman.

Battlefield 3 sekali lagi menunjukkan kemajuan HD 7970 dari pendahulunya. Dan GTX tertinggal.

Di Dirt3, hasil dari tiga kartu cukup ketat dan memungkinkan Anda bermain dengan nyaman. Distribusi tempat adalah sama: produk baru dalam beberapa tiga frame diikuti oleh GTX 580, HD6970 masih sedikit di belakang.

Meto 2033 masih merupakan badai petir untuk kartu grafis. Penurunan FPS terjadi pada adegan dinamis. Menariknya, GTX 580 memberikan FPS minimum yang sedikit lebih tinggi, tetapi pada pesanan seperti itu tidak masalah - bagaimanapun, dekorasi lebih dari terlihat.

Gigabyte Radeon HD 7970 | Rezim suhu

AMD telah mengimplementasikan teknologi ZeroCore Power di seri terbarunya. Ini mengasumsikan pengurangan yang signifikan dalam konsumsi daya siaga. Konsumsi daya maksimum (TDP) dinyatakan pada tingkat solusi kinerja generasi sebelumnya - 250 watt. Di satu sisi, proses teknis menjadi lebih tipis, dan di sisi lain, jumlah transistor pada sebuah chip meningkat tajam. Kami menggunakan Unigine Heaven untuk menghangatkan GPU. Hasilnya disajikan dalam diagram. Suhu udara di ruangan tempat pengujian dilakukan adalah 19 derajat Celcius.

Dalam mode siaga, chip ini hampir belasan derajat lebih dingin dibandingkan dengan GTX 580. Mengesankan.

Gigabyte Radeon HD 7970 | Kesimpulan

Contoh Gigabyte Radeon HD 7970 menunjukkan bahwa produk baru dari AMD adalah solusi tercepat di pasar. Apakah kepemimpinan ini akan bertahan lebih dari dua setengah bulan, kami akan segera mengetahuinya - GTX 680 diluncurkan pada 22 Maret, dan segera akan muncul.

Insinyur AMD melakukan pekerjaan yang baik pada arsitektur, dilihat dari keunggulan yang dimiliki chip Tahiti dibandingkan Cayman. Teknologi ZeroCore juga mengesankan. Kami akan mempertimbangkan kemungkinan overclocking dari chip baru yang "lebih tipis" setelah menerima model dengan desain pabrikan sendiri yang kami miliki. Mereka adalah yang paling menarik dalam hal ini. Nah, data yang sudah tersedia menunjukkan bahwa Tahiti memiliki potensi overclocking yang solid - sebagian besar chip mampu beroperasi di sekitar 1100 MHz. Tapi ini adalah topik untuk artikel terpisah.

Harga kartu saat ini rata-rata 19.200 rubel (menurut layanan Yandex.Market). Banyak atau sedikit, semua orang akan memutuskan sendiri. Tetapi Anda harus ingat bahwa GTX 580 yang sama dapat ditemukan untuk 12-13 ribu rubel.