самостоятельно и от первого лица. Достаточно скачать и установить симулятор космических полетов 'Orbiter 2010', распространяющийся по свободной лицензии, и загрузить в него миссию 'Луна- 3'.
Графические ускорители NVIDIA серии GeForce 500
Автор: Олег Нечай
В ноябре 2010 года компания NVIDIA представила обновлённую серию десктопных графических ускорителей на базе доработанной микроархитектуры Fermi. По сравнению с 400-й серией, появившейся на рынке осенью 2009 года, 500-е карты отличаются существенно меньшим энергопотреблением, повышенной производительностью и тихими системами охлаждения новой конструкции.
Прежде чем перейти к отличиям чипов на основе модифицированной микроархитектуры Fermi от микросхем первого поколения, напомним характерные особенности их конструкции.
Чипы на основе архитектуры Fermi относятся к классу MIMD (МКМД - вычислительная система со множественным потоком команд и множественным потоком данных). К ключевым особенностям Fermi относятся поддержка программного интерфейса DirectX 11 (включая шейдеры версии 5 и, самое главное, аппаратную тесселяцию), а также интерфейсов DirectCompute 11 и OpenCL 1.0, позволяющие использовать видеочип для общих (то есть, не графических) вычислений.
Для аппаратной поддержки тесселяции и алгоритма трассировки лучей в чипах используются параллельно работающие блоки растеризации и полиморфных движков, что позволило существенно поднять производительность рендеринга геометрии. Именно эту особенность можно считать главной, которая отличает ГП на основе микроархитектуры Fermi от микросхем предыдущего поколения.
Первые чипы с микроархитектурой Fermi получили индексы GF10x (GF расшифровывается как 'Graphics Fermi'). 'Полноформатный' графический процессор GF100 состоит из движка GigaThread, четырёх больших блоков Graphics Processing Clusters ('Кластеров графической обработки'), в каждый из которых входит по четыре мультипроцессора SM и выделенный движок растеризации. 16 мультипроцессоров, в свою очередь, объединяют 512 потоковых процессоров CUDA - по 32 в каждом SM, четыре текстурных модуля, полиморфный движок и 64 Кб кэш-памяти L1.
В мультипроцессоре установлены по два планировщика для группы CUDA (Warp Scheduler) и по два диспетчера инструкций. 48 блоков ROP сгруппированы в шесть модулей по восемь блоков, каждый из которых работает с одним из шести 64-разрядных контроллеров видеопамяти GDDR5 - общая ширина шины памяти составляет 384 бит. Объём кэш-памяти L2, подключённой к контроллерам кадрового буфера, - 768 Кб.
В чипах Fermi GF100 реализована система NVIDIA 3D Vision Surround, которую можно задействовать на двух видеокартах, работающих в режиме SLI. Благодаря этой технологии, можно выводить одновременно на три монитора трёхмерное изображение высокого разрешения 1920х1080 пикселей или двухмерную картинку с разрешением 2560х1600 точек. Для просмотра 3D, разумеется, потребуются затворные очки и стереодрайверы, способные 'оживить' картинку в нескольких сотнях популярных видеоигр.
Несмотря на то, что в чипе GF100 изначально было заявлено 512 потоковых процессоров, такие микросхемы никогда не выпускались в рамках 400-й серии. Максимальным числом CUDA было 480 в кристаллах для видеокарт GeForce 480, хотя физически в чипе были реализованы все 512. Отключение 32 ядер было связано с недостаточной отработанностью 40-нм технологического процесса и слишком большим выходом некондиционных чипов с полным набором ядер. Сегодня эта проблема решена, а в конструкцию внесены изменения, позволяющие минимизировать возможность брака.
Новые ускорители серии 500 получили индекс GF11x и в топовых моделях (GF110) задействованы все 512 потоковых процессоров CUDA. Кроме того, в конструкцию транзисторов микросхемы внесены существенные изменения, что позволило минимизировать токи утечки и заметно снизить энергопотребление. К прочим ключевым конструктивным изменениям относятся доработанные блоки адресации и фильтрации текстур, обеспечивающие удвоенную скорость (за один такт, а не за два) обработки текселей в режимах вплоть до FP16, а также улучшенные алгоритмы обработки буфера глубины, в частности, отсечения перекрытых объектов (Z-culling), ускоряющие рендеринг картинки за счёт исключения невидимых (скрытых) объектов.
Аппаратно все чипы серии 500 поддерживают программный интерфейс OpenCL версии 1.1, но на момент написания этих строк драйверы NVIDIA обеспечивают поддержку лишь OpenCL версии 1.0.
Процессор NVIDIA GeForce 5xx состоит из более чем трёх миллиардов транзисторов. Тактовые частоты ядра и рабочие частоты универсальных процессоров в новых чипах были повышены по сравнению с микросхемами 400-й серии. Так, если максимальная штатная частота ядра чипов предыдущей серии составляла 810 МГц (GF108), то у нынешней она достигает 900 МГц (GF116), пиковая частота CUDA выросла с 1620 МГц (GF108) до 1800 МГц (GF116).
Как и ранее, производитель варьирует число блоков в микросхеме, что позволяет выпускать на основе одной базовой конструкции несколько вариантов чипа с различной производительностью. На данный момент в 500-е семейство входят бюджетные модели GeForce GT 520 (GF119),
GT 530 (GF118) и GT 545 DDR3/GDDR5 (GF106), карты среднего класса GeForce GTX 550 Ti (GF116) и GTX 560/560 Ti (GF114) и флагманские ускорители GeForce GTX 570 (GF110), GTX 580 (GF110) и GTX 590 (2 x GF110).
Флагман новой серии десктопных графических ускорителей - двухпроцессорная карта GeForce GTX 590 на основе двух чипов GF110, представлен 24 марта 2011 года. Это первый двухпроцессорный ускоритель NVIDIA со времён GeForce GTX 295 (то есть, с начала 2009 года), и он, несомненно, представляет собой ответ компании на новую двухчиповую карту конкурента - AMD Radeon HD 6990.
В активе GeForce GTX 590 - новейшая система охлаждения на основе двух испарительных камер с радиаторами и 90-мм кулером, работающем на низких оборотах. Возможно, это самая тихая видеокарта высшего класса не только среди двухпроцессорных, но и вообще среди топовых ускорителей последних лет, причём по размерам карта не больше обычной двухслотовой. Эффективность охлаждения не вызывает никаких нареканий, в чём, очевидно, заслуга заметно пониженных рабочих частот - по сравнению с штатными для GF110 и номинальными для карт GeForce GTX 580.
Карта способна работать в режиме Quad SLI или в режиме, когда один из графических процессоров выделен под физические эффекты PhysX. Поддерживается вывод изображения высокого разрешения одновременно на три монитора или работа с 3D-очками (технология 3D Vision).
К сожалению, GeForce GTX 590 в подавляющем большинстве независимых тестов, в том числе и игровых, уступает по производительности Radeon HD 6990 - от 1 до 20%, в зависимости от приложения и настроек.
На карте установлены два 8-штырьковых разъёма для дополнительного питания. Максимальное заявленное энергопотребление карты составляет 365 Вт, что сравнительно немного для двухпроцессорного ускорителя высшего класса, но не стоит забывать, что для подобных систем требуется мощный сетевой блок питания мощностью не менее 700 Вт.
• Графический процессор 2 х GF110
• 2 х 512 универсальных процессоров
• 2 х 64 текстурных и 2 х 48 блоков блендинга
• Тактовая частота ядра - 607 МГц
• Тактовая частота универсальных процессоров - 1215 МГц
• Частота видеопамяти, эффективная - 3414 МГц (4 х 854 МГц)
• Тип видеопамяти - GDDR5
• Объём памяти - 2 х 1,5 Гбайт
• Шина памяти - 384 бит