Архитектура топового чипсета RV770
Основную вычислительную нагрузку в этом чипсете выполняют 10 SIMD-ядер (можно провести аналогию с ТРС в процессорах NVIDIA). Каждое из ядер, и свою очередь, состоит из 16 суперскалярных потоковых процессоров, в состав которых входят но пять 32-разрядных логических модулей. Таким образом, общее количество вычислительных блоков, которые любят приводить в маркетинговых материалах, составляет ровно 800, что в 2,5 раза больше, чем в процессоре RV670. Что примечательно, эти же блоки используются для 64-разрядиых вычислений. В этом проявилась изобретательность разработчиков AMD ATI. Они. в отличие от NVIDIA, сделали блоки универсальными, тем самым сохранив относительно простую структуру своего продукта, по при этом существенно нарастив функциональность.
Рассмотрим более подробно структуру SIMD ядра. На входе данные распределяются потоковым диспетчером и попадают в вычислительные блоки, которых водном модуле, как мы уже упоминали, 16. Каждый такой блок имеет 16 Кбайт собственной памяти.
Существенно переработаны блоки TMU. Во-первых, они привязаны к SIMD гак же, как у NVIDIA. Во-вторых, немного упрощена их структура и повышена частота их работы. В-третьих, по сравнению с RV670 удвоена полоса пропускания к текстурному кэшу с возможностью выборки до 160 текстур за такт. Наряду с TMU подверглись существенной ревизии и блоки ROP. Их производительность удвоена по сравнению с предыдущим поколением чипов, хотя количество блоков осталось тем же.
Невероятно, но факт: разработчики отказались от применяемой ранее кольцевой структуры шины памяти в пользу более традиционной с центральным хабом. Как видно на схеме, контроллеры памяти расположены по краям чина. Задача хаба — распределять потоки данных между генерирующими график блоками. Кроме того, он служит связующим звеном с шиной PCI Express 2.0, CrossFireX, UVD2 и контроллерами вывода. Новые чипы поддерживают память GDDR5, работающую на эффективной частоте 3,6-4 ГГц. И свою очередь, это позволяет добиться высоких скоростей передачи данных даже на 256-битной шине (до 120 Гбайт/с). Подтвердив еще раз постулат, что самые эффективные решения должны быть простыми, AMD/ATI выпустила на рынок очень сильный продукт как по себестоимости, так и по производительности, который конкурируют с изделиями NVIDIA во всех сегментах.
Таблица 8 - Сравнение производительности видеоплат NVIDIA и AMD/ATI
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|