Здавалка
Главная | Обратная связь

Семейство NVIDIA GeForce 8 (Унифицированные шейдерные процессоры)



Рисунок 1 – 80 графических ядер с унифицированными шейдерными процессорами

Новое поколение графических процессоров имеет принципиально новую архитектуру, основанную на унифицированных потоковых процессорах (шейдерные процессоры). Если в графических процессорах предыдущего поколения отдельно выделяли пиксельные и вершинные процессоры, которые называли также конвейерами, то в новой архитектуре речь идет именно об унифицированных шейдерных процессорах. Такие процессоры способны выполнять не только вершинные и пиксельные шейдерм, но также геометрические и физические, что не было реализовано в графических чипах предыдущих поколений. Архитектура унифицированных блоков позволяет достичь сбалансированной нагрузки при выполнении различных шейдеров, чего в принципе нельзя было достичь при использовании классической архитектуры графического процессора.

Унифицированные потоковые процессоры (Unified Streaming Processors, USP) представляют собой скалярные процессоры общего назначения для обработки данных с плавающей запятой. При этом необходимо акцентировать внимание на том, что ранее как NVIDIA, так и ATI применяли в своих изделиях векторную архитектуру исполнительных блоков.

Переход к скалярным процессорам вызван тем, что традиционная векторная архитектура менее эффективно использует вычислительные ресурсы, чем скалярный дизайн процессорных модулей, особенно в случае обработки сложных смешанных шейдеров, сочетающих векторные и скалярные инструкции.

Рисунок 2 – Структура шейдерного процессора G80

SP = Streaming Processors
TF = Texture Filtering Units
ТА = Texture Address Units
L1/L2 = Caches

Потоковые процессоры обрабатывают сырые данные и передают их блокам текстурирования. На каждые четыре потоковых процессора приходится один модуль адресации текстур и два модуля фильтрации текстур. То есть на каждый функциональный блок в ядре, как видно на рисунке, приходится 16 потоковых процессоров, четыре модуля адресации текстур и восемь модулей фильтрации текстур. Примечательно, что каждому такому блоку выделен кэш первого уровня. При выполнении скалярным унифицированным потоковым процессором векторного программного кода преобразование в скалярные операции производится графическим процессором GeForce 8800.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.