Здавалка
Главная | Обратная связь

Особенности GTX 280



Рисунок 10 – Архитектура потокового процессора (ТРС)

Рассмотрим особенности серии GeForce 200 на примере топового чипа. При её разработке инженеры существенно переработали (по сравнению с G9x и G8x) структуру большинства исполнительных блоков, в частности ТРС (Texture Processin Clusters)

По сравнению с кластерами ТРС предыдущего поколения, здесь количество потоковых мультипроцессоров увеличено с двух до трех. Несмотря па то что в каждом из мультипроцессоров (SM) количество структурных блоков (SP) осталось прежним (восемь модулей), увеличилась их разрядность до FP64 в рамках стандарта IEEE 754(R). Не изменилось и количество сегментов текстурной фильтрации - их также осталось восемь.

В целом структура нового чипа стала более сложной. Даже количество самих универсальных кластеров увеличилось до 10, хотя для G92 максимальной была цифра 8. К тому же был существенно переработан блок управления параллельными операциями.

Если предыдущее поколение чипов позволяло одновременно работать 12288 потокам, то здесь их количество возросло до впечатляющих 30000. Это сделано не только в угоду любителям 3D-развлечений, но и в рамках направле­ния CUDA/PhysX, где NVIDIA выступает в качестве поставщика высокопроизводительной платформы для сложных научных вычислений.

Рисунок 11 – Структурная схема процессорной архитектуры GT200

Вслед за улучшенной производительностью ТРС возросла и мощность ROP до 32 пикселов за такт. И если графические процессоры предыдущего поколения умели выводить 2 пиксела за такт и блендить 12 пикселов, то GeForce 200 выдает свои 32 пиксела уже с блеидингом.

Следует обратить внимание на технологию Dual Issue, которая позволяет выполнять две инструкции затакт в одном шейдере (MAD+MUL). В каждом блоке SM содержатся специальные исполнительные блоки (Special Function Unit, SFU), которые вычисляют сложные функции, интерполируют атрибуты, а также выполняют операции умножения (MUL). С их помощью каждый потоковый процессор чипа GT200 способен исполнять не только одну операцию умножения со сложением (Multiply-Add, MAD), по одновременно еще и MUL.

Впечатляет и 512-битная шина памяти. Ее дополняют переработанные блоки предвыборки и кэширования данных.

В совокупности с рядом других улучшений выход видеокарт этой серии был многообещающим. Компания предложила реальное улучшение по сравнению с предшественниками.
Следует отметить, что чип, содержащий рекордное количество транзисторов (1400 млн.), получился у NVIDIA очень сложным и, соответственно, дорогим в производстве.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.