Здавалка
Главная | Обратная связь

Архитектура топового чипсета RV770



Основную вычислительную нагрузку в этом чипсете выполняют 10 SIMD-ядер (можно провести аналогию с ТРС в процессорах NVIDIA). Каждое из ядер, и свою очередь, состоит из 16 суперскалярных потоковых процессоров, в состав которых входят но пять 32-разрядных логических модулей. Таким образом, общее количество вычислительных блоков, которые любят приводить в маркетинговых материалах, составляет ровно 800, что в 2,5 раза больше, чем в процессоре RV670.

Что примечательно, эти же блоки используются для 64-разрядиых вычислений. В этом проявилась изобретательность разработчиков AMD ATI. Они. в отличие от NVIDIA, сделали блоки универсальными, тем самым сохранив относительно простую структуру своего продукта, по при этом существенно нарастив функциональность.

Рисунок 14 – Архитектура ядра RV770

Рассмотрим более подробно структуру SIMD ядра.

На входе данные распределяются потоковым диспетчером и попадают в вычислительные блоки, которых водном модуле, как мы уже упоминали, 16. Каждый такой блок имеет 16 Кбайт собственной памяти.

Рисунок 15 - Структура SIMD ядра

Существенно переработаны блоки TMU. Во-первых, они привязаны к SIMD гак же, как у NVIDIA. Во-вторых, немного упрощена их структура и повышена частота их работы. В-третьих, по сравнению с RV670 удвоена полоса пропускания к текстурному кэшу с возможностью выборки до 160 текстур за такт.

Наряду с TMU подверглись существенной ревизии и блоки ROP. Их производительность удвоена по сравнению с предыдущим поколением чипов, хотя количество блоков осталось тем же.

Рисунок 16 – Структура блока TMU

Невероятно, но факт: разработчики отказались от применяемой ранее кольцевой структуры шины памяти в пользу более традиционной с центральным хабом. Как видно на схеме, контроллеры памяти расположены по краям чина. Задача хаба — распределять потоки данных между генерирующими график блоками. Кроме того, он служит связующим звеном с шиной PCI Express 2.0, CrossFireX, UVD2 и контроллерами вывода.

Новые чипы поддерживают память GDDR5, работающую на эффективной частоте 3,6-4 ГГц. И свою очередь, это позволяет добиться высоких скоростей передачи данных даже на 256-битной шине (до 120 Гбайт/с).

Подтвердив еще раз постулат, что самые эффективные решения должны быть простыми, AMD/ATI выпустила на рынок очень сильный продукт как по себестоимости, так и по производительности, который конкурируют с изделиями NVIDIA во всех сегментах.

Рисунок 17 – Структурная схема процесса управления памятью

Таблица 8 - Сравнение производительности видеоплат NVIDIA и AMD/ATI

GeForce (NVIDIA) Radeon HD (ATI/AMD)
GTX 295  
  HO 5870
  HO 4870 X2
  HD 5850
GTX 285  
GTX 280  
GTX 275  
9800 GX2 HD4890
GTX 260 (216)  
  HD4850 X2
GTX 260 (192) HD4870
  HD 5770
8800 Ultra HD3870 X2
GTS 250 HD 5750
9800 GTX/GTX+ HD4850
8800 GTX HD4770
8800 GTS(512 Мбайт)  
GTS 240 HD4830
9800 GT HD4730
8800 GT  
9600 GTS  
9600 GT HD3870
9600 GSO (768 Мбайт)  
8800 GS (768 Мбайт)  
8800 GTS (640 Мбайт) HD 3850 X2
9600 GSO (384 Мбайт) HD4670






©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.