NVIDIA Quadro K5000 — профессиональное графическое решение

NVIDIA Quadro K5000 для Mac — самое производительное в мире профессиональное графическое решение на платформе Apple Mac Pro для ускорения профессиональных приложений.

Как в маленьких агентствах, так и в крупных медиахолдингах, творческие профессионалы,работающие на Apple Mac Pro, хотят иметь инструменты, которые позволят быстро воплощать свои идеи в реальность без ущерба для качества. Видеокарта Quadro K5000 для Mac позволяет художникам и видеомонтажерам воспользоваться беспрецедентной мощностью и интерактивностью. Инновационные технологии, повышенная производительность и поддержка до четырех дисплеев делают эту видеокарту идеальной для крупномасштабных визуализационных решений.

k5000mac_top_asm_200

Дизайн потокового мультипроцессора нового поколения видеокарты Quadro K5000 представляет важные архитектурные изменения, которые могут полностью изменить рабочий процесс. Эти изменения включают в себя значительное увеличение производительности ключевых графических операций для достижения нового уровня производительности и энергоэффективности. Кроме того,Quadro К5000 имеет большой кадровый буфер объемом в 4 ГБ, который позволит работать с более крупными сценами и улучшить взаимодействие во время творческого процесса.

Теперь вы можете подключать одновременно до четырех дисплеев через два DVI-разъема и два разъема DisplayPort. Благодаря поддержке возможностей DisplayPort 1.2, теперь вы получаете улучшенную глубину цвета, более высокую частоту регенерации изображения и возможность поддержки ультравысоких разрешений 3840×2160 при частоте экране 60Гц или 4096×2160 при частоте экрана до 48Гц.

Ядра CUDA 1536
Память GPU 4 ГБ GDDR5
Интерфейс памяти 256-битный
Пропускная способность памяти 173 Гб/с
Хост-интерфейс PCI Express 2.0×16
Разъемы подключения дисплеев DVI-I DL + DVI-D DL + DP 1.2 + DP 1.2
DisplayPort 1.2 Есть
Максимальное количество подключенных дисплеев Четыре
Парт-номер PNY VCQK5000MAC-PB

Рабочая станция с новым графическим ускорителем Quadro K5000 на борту демонстрирует свое однозначное превосходство над профессиональным решением прошлого поколения – станцией с Quadro 5000. В зависимости от используемого приложения разница может достигать 10- 80% в пользу новинки.

— Mediavision

Давно добившись на рынке профессиональных видеоускорителей подавляющего преимущества, компания NVIDIA не почивает на лаврах, а регулярно обновляет свои предложения для рабочих станций, переводя их на новые поколения архитектуры и обеспечивая за счёт этого не только планомерный рост быстродействия, но и улучшение остальных характеристик. Рассмотренная нами свежевышедшая видеокарта Quadro K5000 прекрасно отражает данную тенденцию.

— FCenter Russia

Возможности GPU

Архитектура NVIDIA CUDA

Архитектура параллельных вычислений объединяет продвинутую визуализацию и вычислительные возможности, обеспечивая невероятное ускорение профессиональной работы.

NVIDIA® Scalable Geometry Engine

Позволяет значительно улучшить производительность обработки геометрии в целом ряде приложений для компьютерного моделирования, создания цифрового контента и медицинских приложений, обеспечивая интерактивную работу с моделями и сценами, сложность которых в разы превышает прежние проекты.

Большой буфер кадров с ультравысокой пропускной способностью

Большой объем памяти GPU с высокой пропускной способностью позволяет визуализировать огромные модели и сложные сцены, а также производить вычисления с использованием больших наборов данных.

Двойные движки

Обеспечивают самую высокую скорость параллельной обработки данных и одновременную передачу данных между GPU и хостом, ускоряя известные техники, такие как трассировку лучей,цветокоррекцию и моделирование физических явлений.

NVIDIA SMX

Обеспечивает большую энергоэффективность и производительность обработки данных благодаря новому инновационному строению потоковых мультипроцессоров, которое позволяет использовать большую площадь для размещения ядер по сравнению с управляющей логикой.

Ультратихий дизайн

Бесшумный дизайн вентилятора обеспечивает уровень шума ниже 28 дБ для ультратихой рабочей среды.

Качество изображения

Полноэкранное сглаживание (FSAA)

Алгоритм сглаживания до 64x FSAA (128X со SLI) заметно снижает эффект зубчатости и неровность изображения, обеспечивая высокую реалистичность сцен.

GPU-тесселяция с Shader Model 5.0

Механизмы тесселяции на основе Quadro GPU самостоятельно генерируют подробную геометрию,обеспечивая окружения и сцены кинематографического качества без ущерба для производительности.

16K текстурирование и рендеринг

Возможность работы с разрешением 16K x 16K при текстурировании и рендеринге для приложений,требующих самого высокого разрешения и качества визуализации изображений.

Возможности отображения

Поддержка до четырех дисплеев

Совершенно новый движок дисплея позволяет одновременно подключать до четырех дисплеев и поддерживает возможности нового поколения DisplayPort 1.2. DisplayPort 1.2 поддерживает улучшенную глубину цвета, более высокую частоту регенерацию изображения и такие высокие разрешения, как 3840×2160 при частоте экрана 60Гц или 4096×2160 при частоте экрана до 48Гц,чтобы расширить рабочее пространство и увеличить производительность.

30-битная глубина цвета (10 бит на цвет)

30-битная глубина цвета обеспечивает миллиарды, а не миллионы цветовых вариаций для насыщенного яркого изображения с широчайшим динамическим диапазоном.

Профессиональная синхронизация стерео 3D

Обеспечивает надежный контроль стереоэффектов посредством специализированного соединения 3-pin mini-din между видеокартой и устройствами 3D стерео.

Программная поддержка

Архитектура параллельных вычислений CUDA

Решения NVIDIA Quadro используют универсальные вычисления на GPU при помощи стандартных языков программирования, таких как C/C++ и Fortran, а также развивающихся API, таких как OpenCL и Direct Compute. Широкое применение возможностей CUDA позволяет ускорять такие техники, как трассировка лучей, обработка видео и изображений, а также вычисления в области динамики жидких тел.

ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ

Объем памяти 4 Гб GDDR5
Интерфейс памяти 256-битный
Полоса пропускания памяти 173 Гб/с
Ядра CUDA 1536
Хост-интерфейс PCI Express 2.0×16
Максимальное энергопотребление 122 Вт
Поддержка Energy Star да
Тип охлаждения активный
Форм-фактор 110 мм (В) х 265 мм (Д)
Двойной конфигурации слотов, Полноразмерный
Разъемы для подключения дисплеев 1 x DVI-I DL
1 x DVI-D DL
2 x DP1.2
1 x стерео
Максимальное число дисплеев,
подключаемых одновременно
4
DisplayPort 1.2 да
DisplayPort с аудио да
Поддержка VGA Через входящий в комплект адаптер
Максимальное разрешение DP 1.2 3840×2160 @ 60 Гц или 4096×2160 @ 48 Гц
Максимальное разрешение DVI-I DL 2560×1600 @ 60 Гц
Максимальное разрешение DVI-I SL 1920×1200 @ 60 Гц
Максимальное разрешение VGA 2048×1536 @ 85 Гц
Поддержка HDCP да
Поддержка Professional 3D да
Графический API под Mac OS X OpenGL 3.2
Графические API под Windows Shader Model 5.0, OpenGL 4.3, DirectX 11
Парт-номер VCQK5000MAC-PB

Минимальные системные требования

  • MacPro3,1; MacPro4,1; MacPro5,1 или более поздние модели
  • Mac OS X 10.8.3 или более поздние версии
  • Microsoft Windows (через Boot Camp) 8, 7, Vista или XP SP3 (32- или 64-битные версии)
  • DisplayPort-, DVI- или VGA-совместимые дисплеи

3D-архитектура

  • Технология NVidia Scalable Geometry Engine
  • Аппаратный механизм тесселяции
  • Механизм NVIDIA GigaThread с двойным механизмом копирования
  • Shader Model 5.0 (OpenGL 4.3 и DirectX 11)
  • 16K x 16K текстурирование и рендеринг
  • Прозрачный мультисэмплинг и суперсэмплинг
  • 16-ракурсная независимая анизотропная фильтрация
  • 128-битная обработка с плавающей точкой
  • Фильтрация и смешение текстур с разрешением 32 бита с плавающей точкой на каждый компонент
  • 64-кратное полноэкранное сглаживание
  • Полноэкранное сглаживание FXAA и TXAA
  • Ускорение декодирования кодеков MPEG-2, MPEG-4 Part 2 Advanced Simple Profile, H.264, MVC,VC1, DivX (версии 3.11 и более поздних), Flash (версии 10.1 и более поздних)
  • Отдельный кодер формата H.264
  • Двухпоточное аппаратное ускорение Blu-ray с поддержкой вывода картинки в картинке (HD)

Архитектура параллельной обработки NVIDIA CUDA

  • Архитектура SMX (мультипроцессорное распределение нагрузки, обеспечивающее более высокую производительность и эффективность вычислений)
  • Поддержка различных API, включая CUDA C, CUDA C++, DirectCompute 5.0, OpenCL, Java, Python и Fortran
  • Иерархия параллельного кэширования данных NVIDIA (конфигурируемый кэш L1 и унифицированный кэш L2)
  • Память с коррекцией ошибок (ECC)
  • 64 кБ RAM (настраиваемое выделение разделяемой памяти и кэша L1)
  • Двойной блок планировки Dual Warp Schedules (планирует и отправляет на обработку инструкции из двух пулов одновременно)

Продвинутые возможности отображения

  • 30-битное цветовое разрешение (по 10 бит на красный, зеленый и синий канал)
  • Поддержка любой комбинации трех подключенных дисплеев
  • DisplayPort 1.2 (до 3840×2160 при 60 Гц и 2560×1600 при 120 Гц)
  • Выход DVI-I Dual-Link (до 2560×1600 при 60 Гц и 1920×1200 при 120 Гц)
  • Выход DVI-D Dual-Link (до 2560×1600 при 60 Гц и 1920×1200 при 120 Гц)
  • Интегрированный 400 МГц DAC DVI-I для вывода аналогового сигнала с разрешением до 2048×1536 при 85 Гц
  • Поддержка DisplayPort 1.2, HDMI 1.4 и HDCP (HDMI-вывод требует использования дополнительного адаптера)
  • Внутренняя 10-битная обработка изображения
  • Поддержка технологии NVIDIA 3D Vision, 3D DLP, чересстрочных и прочих стереоскопических 3D-форматов
  • Полная поддержка OpenGL Quad Buffer
  • Аппаратное масштабирование с компенсацией черных полос (underscan или overscan)
  • Мультиэкранная технология NVIDIA NVIEW — NVIDIA Mosaic
  • Поддержка широкоформатных, сверхвысоких разрешений с использованием технологий Quadro Mosaic, Quadro Sync и Warp/Blend.

Цифровое интегрированное аудио DisplayPort и HDMI

  • Dolby Digital (AC3), DTS 5.1, многоканальное (7.1) LPCM, Dolby Digital Plus (DD+) и MPEG-2/MPEG-4 AAC
  • Частоты дискретизации 44.1 кГц, 48 кГц, 88.2 кГц, 96 кГц, 176 кГц и 192 кГц
  • Разрядность 16, 20 и 24 бита.

Комплектация

  • Профессиональная графическая плата PNY NVIDIA Quadro K5000 для Mac
  • Крепление стереоразъема
  • Два адаптера DisplayPort на mini-DisplayPort
  • Адаптер DVI-I на VGA
  • Печатная краткая инструкция пользователя

Семейство видеокарт, базирующихся на архитектуре NVIDIA Kepler, несколько отличается по своей структуре от прочих решений. Дело в том, что обычно производители графики в первую очередь сосредотачиваются на подготовке максимального по возможностям предложения, представляя его в виде старшей модели ускорителя, а затем выводят на рынок младшие упрощённые модели. Однако в случае с Kepler всё получилось несколько иным образом. Первым и основным базовым элементом для строительства графических ускорителей этого поколения оказался чип GK104, который в действительности не является старшим носителем новой архитектуры. Наибольшую производительность имеет GPU с кодовым именем GK110, однако он пока что не попал ни в одну графическую карту, и используется лишь в вычислительных комплексах Tesla K20 и K20X. Это связанно как с низкоуровневой ориентацией GK110 именно на вычислительную нагрузку, так и с тем, что изготовление столь сложных чипов по 28-нм техпроцессу в массовых количествах остаётся для NVIDIA и её производственного партнёра TSMC определённой проблемой.

Таким образом, современные видеокарты поколения Kepler для игроков и профессионалов, продаваемые под торговыми марками GeForce и Quadro, используют хорошо знакомую многим начинку в виде чипа GK104. Причём, если игровых ускорителей на базе GK104 выпущено уже немало, то подобная профессиональная карта на данный момент существует всего одна – это рассматриваемая в данной статье Quadro K5000.

Позиционируется Quadro K5000 как замена Quadro 5000, основывающейся на архитектуре Fermi. Рекомендованная производителем стоимость новинки составляет $2250, однако по факту купить её можно и немного дешевле – примерно за $1800 – по реальной цене она мало отличается от Quadro 5000. Однако характеристики Quadro K5000 выглядят заманчивее спецификаций старших профессиональных карт семейства Fermi:

195355

Базируясь на той же самой версии графического чипа, что и GeForce 680, профессиональная видеокарта Quadro K5000 может предложить более высокий уровень быстродействия, нежели флагман прошлого поколения. В её основе лежит полностью разблокированная версия GPU GK104 с 1536 CUDA-ядрами, работающая на частоте 706 МГц и дополненная 4 Гбайтами GDDR5-видеопамяти с эффективной частотой 5.4 ГГц. Надо сказать, что эти частоты заметно ниже, чем у современных игровых видеокарт NVIDIA верхнего ценового диапазона, но благодаря этому Quadro K5000 может похвастать хорошим уровнем энергетической эффективности. Она выглядит экономичной не только по сравнению с игровыми модификациями Kepler, но и на фоне профессиональных видеоакселераторов прошлых поколений.

195352

Сравнительно низкий уровень потребления – это не только результат взвешенного подхода к подбору рабочих частот, совмещённый с понижением верхней границы напряжения питания GPU до 0.975 В. Его обеспечивает и вся архитектура Kepler, одним из основных принципов при работе над которой как раз и была оптимизация Fermi в сторону улучшения энергетической эффективности. По базовому строению графический процессор GK104 во м

ногом похож на представителей прошлого поколения. Он содержит блок управления потоками GigaThread Engine, контроллеры памяти, кэш второго уровня для данных и инструкций, блоки растровых операций, и, разумеется, базовые блоки GPC (Graphics Processing Clusters), отвечающие за вычислительные и текстурные операции. Но при этом в используемой в Quadro K5000 версии GPU имеется четыре полностью функциональных GPC, каждый из которых, в свою очередь, состоит из блока растеризации (Raster Engine) и пары потоковых мультипроцессоров NVIDIA Streaming Multiprocessor (SMX), пришедших на смену SM из чипов прошлого поколения.195353

Блоки SMX ответственны за основную часть выполняемых графическим акселератором вычислительных работ. В новом дизайне мультипроцессоров, применяемых в архитектуре Kepler, NVIDIA повысила роль собственно вычислительных ядер, теперь они занимают на кристалле существенно большую площадь, нежели вся остальная, в том числе и управляющая, логика. В результате, можно сказать, что Kepler – более вычислительно плотная архитектура, нежели Fermi, что очень хорошо для профессиональных графических ускорителей, которым приходится сталкиваться с обработкой больших массивов данных однотипными операциями.

195354

Каждый мультипроцессор SMX содержит 192 CUDA-ядра, а это – в шесть раз больше количества SM в архитектуре Fermi. И хотя ядра в Kepler работают на обычной, а не на удвоенной (как ранее) тактовой частоте, в сумме всё равно достигается троекратное увеличение удельной производительности в пересчёте на каждый затраченный ватт. В итоге мы можем говорить о Quadro K5000 не только как о высокопроизводительном, но и как об очень экономичном на фоне прочих профессиональных графических карт решении.

На экономичность Quadro K5000 указывает и её внешний вид. Внушительно эта видеокарта выглядит лишь с лицевой стороны, которую полностью закрывает система охлаждения. Если же повернуть карту обратной стороной, то становится понятно, что в основе профессионального ускорителя лежит короткая печатная плата, хорошо знакомая нам по игровым ускорителям GeForce GTX 670.

195341195343

Разница лишь в том, что на Quadro K5000, обладающей 4-гигабайтной видеопамятью, задействованы все посадочные места под чипы GDDR5 SDRAM. Схожесть с GeForce GTX 670 означает, что за электропитание GPU на рассматриваемой профессиональной плате отвечает упрощённая четырёхканальная схема, но, по всей видимости, более мощный преобразователь здесь не требуется, ведь у Quadro K5000 имеется только один шестиконтактный разъём питания.

195347 195345

Иными словами, понижение рабочих частот и снижение напряжения питания GPU у максимальной версии чипа GK104 сделало Quadro K5000 даже экономичнее, чем GeForce GTX 670. И мы расцениваем это как огромный плюс профессионального ускорителя, который не только работает при благоприятном температурном режиме, но и не производит слишком много шума даже при серьёзных нагрузках. Максимальная скорость вращения, которую в процессе тестирования развивал штатный радиальный вентилятор, не превышала 1700 оборотов в минуту, а температура GPU всегда оставалась в пределах 80 градусов. Содействует качественному охлаждению и массивный штатный радиатор, который по своим размерам даже превосходит оный у GeForce GTX 680. Обратите внимание, длина видеоплаты Quadro K5000 с кулером составляет 270 мм, а по ширине она занимает два слота.

Как и игровые карты поколения Kepler, Quadro K5000 оснащена четырьмя дисплейными выводами: двумя DisplayPort, одним Dual-Link DVI-I и одним Dual-Link DVI-D. При этом к одной карте могут быть подключены четыре монитора одновременно: вдвое больше, чем к профессиональным картам NVIDIA прошлого поколения.

195351

Возможность увеличения количества одновременно обслуживаемых мониторов может дать дополнительная плата Quadro Sync. Она позволяет совместно использовать выводы сразу нескольких видеокарт Quadro K5000, установленных в одной рабочей станции. Например, система с четырьмя профессиональными платами сможет формировать единое изображение, распределённое по шестнадцати синхронизированным мониторам, собранным в «стенку». Подчеркнём, что новая технология NVIDIA Mosaic позволяет обойтись в этом случае без утомительного конфигурирования драйверов и программного обеспечения. Стенка из мониторов просто представляется системе как один дисплей со сверхвысоким разрешением.

Ещё одним интересным сценарием применения профессиональных ускорителей Quadro K5000 является их объединение в тандем с вычислительными системами Tesla K10, K20 или K20X. У NVIDIA специально для этой цели имеется технология Maximus, которая открывает возможность построения и проектирования моделей одновременно с CUDA-рендерингом на одной рабочей станции.

Компания FCenter Russia провела тестирование видеокарты.

Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на самом быстром на данный момент десктопном шестиядерном процессоре Intel Core i7-3970X Extreme Edition, имеющем номинальную тактовую частоту 3.5 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X79 Express и 16 Гбайт скоростной памяти стандарта DDR3-1867 SDRAM.

Основным соперником Quadro K5000 с дизайном Kepler в рамках тестирования стала профессиональная видеокарта NVIDIA предыдущего поколения Fermi, Quadro 5000. Кроме того, для иллюстрации различий между профессиональными и графическими картами общего назначения мы протестировали и один из флагманских игровых ускорителей с такой же, как у Quadro K5000, архитектурой.

Таким образом, для тестовых испытаний задействовалось следующее оборудование и программное обеспечение:
Процессор: Intel Core Core i7-3960X Extreme Edition (Sandy Bridge-E, 6 ядер + HT, 3.3-3.9 ГГц, 6 x 256 Кбайт L2, 15 Мбайт L3).
Материнская плата: ASUS Rampage IV Formula (LGA2011, Intel X79 Express).
Память: 4 x 4 GB, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
Графические карты:
Nvidia GeForce GTX 680 (2 Гбайта/256-бит GDDR5, 1006/6008 МГц);
Nvidia Quadro 5000 (2.5 Гбайта/320-бит GDDR5, 513/3000 МГц);
Nvidia Quadro K5000 (4 Гбайта/256-бит GDDR5, 706/5400 МГц).
Дисковая подсистема: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 W).
Операционная система: Microsoft Windows 7 Ultimate x64.
Драйверы:
Intel Chipset Driver 9.3.0.1025;
Intel Management Engine Driver 8.1.2.1318;
Intel Rapid Storage Technology 11.6.0.1030;
NVIDIA GeForce Driver Release 310;
NVIDIA Quadro/Tesla Driver Release 310;
NVIDIA 3ds Max Performance Driver 13.00.04.
Тестирование видеокарт происходило в разрешении 1920×1200 с отключенным параметром Vsync. Для тестирования использовались популярные приложения для автоматизированного проектирования и трёхмерного моделирования и специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC) тесты. На приводимых ниже диаграммах приводятся результаты тестов в баллах, соответственно большее значение всегда говорит о лучшей производительности.

Производительность

SPECviewperf 11.0

При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя достаточно примитивные операции, этот тест показывает «геометрическую» производительность ускорителей при работе через OpenGL, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных последовательностей OpenGL команд, задающих вращение сложных моделей, характерных для тех или иных профессиональных приложений.

Встроенные в SPECviewperf используемой нами одиннадцатой версии скрипты моделируют деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): LightWave (lightwave-01), CATIA (catia-03), EnSight (ensight-04), Maya (maya-03), Pro/ENGINEER (proe-05), SolidWorks (sw-03), Siemens Teamcenter Visualization Mockup (tcvis-02) и Siemens NX (snx-01).

195379 195372 (1) 195373 195374 195375 195376 195377 195378

Новая профессиональная видеокарта NVIDIA Quadro K5000 демонстрирует своё однозначное превосходство над акселератором прошлого поколения, Quadro 5000. В различных приложениях соотношение результатов может отличаться, но Quadro K5000 быстрее всегда, доказывая тем самым прогрессивность новой архитектуры Kepler. Особое преимущество новое профессиональное решение показывает в тестах ensight-04, tcvis-02 и snx-01, в них Quadro K5000 обгоняет Quadro 5000 на 70-80 процентов. Но есть и другие примеры. Например, в сценариях lightwave-01 и sw-02 разница между результатами ускорителей Quadro разных поколений не превышает и 10 процентов.

Вместе с этим SPECviewperf весьма отчетливо даёт понять, что использование игровых графических карт для профессиональных задач не может принести хороших результатов. Хотя GeForce GTX 680 имеет такую же архитектуру, как и Quadro K5000, и даже функционирует на более высоких частотах, оперирование сложными моделями в OpenGL вызывает у неё огромные сложности: скорость игровой карты оказывается на порядок ниже, чем у специализированных решений с оптимизированными драйверами.

Используя тест SPECviewperf 11.0 мы изучили и то, какое влияние на производительность оказывает включение полноэкранного антиалиазинга (FSAA). Приводимые нами ниже графики как раз и показывают изменение результатов стандартных тестов, входящих в SPECviewperf, при активации различных режимов FSAA.

195382

195380

195381

 

195387

195383

195384

195385

195386

Полноэкранное сглаживание ожидаемо уменьшает производительность, однако падение скорости у профессионального ускорителя нового поколения менее выражено, чем у Quadro 5000. Поэтому в режимах с 32x или 64x сглаживанием преимущество Quadro K5000, ранее выражавшееся в десятках процентов, доходит до двукратного размера.

SPECviewperf 11.0 даёт неплохое представление об общей производительности новой профессиональной видеокарты, но это всё-таки — синтетический тест. Именно поэтому мы не ограничились им одним, и провели дополнительное сравнение в реальных профессиональных приложениях.

Autodesk 3ds Max 2011

Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи профессиональной версии теста SPEC. Эта версия знаменательна тем, что в ней, в том числе, используются сверхсложные модели, насчитывающие порядка 32 миллионов многоугольников, а оценка производительности графических карт выполняется раздельно для обычных и для сложных моделей.

Отдельно необходимо отметить и тот факт, что NVIDIA уделяет отдельное внимание скорости работы своих профессиональных ускорителей в окнах проекции 3ds Max. Для её увеличения программистами компании разработан специальный оптимизированный мини-драйвер, который подменяет в пакете стандартный DirectX-драйвер и обеспечивает увеличение производительности карт семейства Quadro.

195358

Оптимизированный мини-драйвер работает исключительно на профессиональных картах NVIDIA и полуторакратное превосходство Quadro K5000 над GeForce GTX 680 – во многом его заслуга. Впрочем, не стоит упускать из виду и достоинства новой архитектуры Kepler. Новая Quadro K5000 обходит свою предшественницу на 10 процентов. Однако в большей степени высокую скорость профессионального видеоускорителя с архитектурой Kepler можно почувствовать при работе со сложными моделями.

195359

Когда дело доходит до обработки модели города, насчитывающей 32 миллиона многоугольников, преимущество Quadro K5000 над Quadro 5000 доходит до 20 процентов, а превосходство профессионального акселератора над игровой картой с той же архитектурой увеличивается до 85 процентов. Конечно, в SPECvieperf мы видели и более впечатляющие числа, но не забывайте, 3ds Max относится к числу немногих пакетов для моделирования и проектирования, работающих через DirectX.

К тому же, интегральный показатель производительности не отражает ситуацию в полной мере. Более глубокую картину можно получить, если проанализировать выдаваемые тестом «второстепенные» индексы быстродействия.

195360

Заметьте, основное преимущество видеокарты с архитектурой Kepler над её Fermi-предшественницей вырисовывается при рендеринге с использованием мощностей GPU. Это закономерно: ещё в начале статьи мы говорили о том, что новый графический процессор GK104 имеет явную оптимизацию под вычисления.

Autodesk AutoCAD 2013

Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX – это AutoCAD. Также как и в случае с 3ds Max, NVIDIA старается обеспечить AutoCAD-разработчикам специальную поддержку, по крайней мере, так дело обстояло раньше. Однако, к сожалению, соответствующий мини-драйвер для графических карт Quadro очень давно не обновлялся, а его последняя вышедшая версия совместима лишь с AutoCAD 2011. Поэтому на данный момент пользователи последних выпусков данного профессионального пакета находятся в очень неприятной ситуации, когда они не могут воспользоваться всеми преимуществами профессиональных видеоускорителей NVIDIA. На практике это выливается в обескураживающее отсутствие принципиальных различий между сериями видеокарт Quadro и GeForce поколения Kepler.

195361

Как видим, результат игрового ускорителя GeForce GTX 680 очень близок к показателю производительности Quadro K5000. Практически не отличается по скорости новая профессиональная карта NVIDIA и от своей предшественницы. Впрочем, разница между картами всё-таки есть, но наблюдается она в частных случаях – при включении в AutoCAD 2013 специфических стилей отображения.

195362

Quadro K5000 оказывается лучше других фигурирующих на диаграмме видеокарт при работе с 2D чертежами и при использовании стиля отображения Hidden, в котором объекты представляются в каркасном виде, а линии, относящиеся к задним граням, не видны. В режимах Wireframe и Conceptual лучшую производительность показывает профессиональный ускоритель с архитектурой Fermi, а реалистичное отображение – это конёк игрового ускорителя.

Впрочем, следует иметь в виду, что выпуск компанией NVIDIA мини-драйвера AutoCAD 2013, если он состоится, поменяет наблюдаемую картину в корне. По опыту прошлых версий можно утверждать, что скорость графических карт семейства Quadro при должной программной поддержке способна вырасти в несколько раз.

MAXON Cinema 4D (CINEBENCH R11.5)

Для исследования производительности в популярном пакете для построения трёхмерных моделей и анимации Maxon CINEMA 4D был использован специально предназначенный для этих целей тест CINEBENCH. К сожалению, этот бенчмарк использует движок от версии R11.5 родительского пакета, однако, по утверждению разработчиков, он вполне применим и для получения представления о том, насколько быстро профессиональные видеокарты способны работать в актуальной версии CINEMA 4D R14.

195363

Согласно бенчмарку CINEBENCH, новая профессиональная видеокарта Quadro K5000 с архитектурой Kepler превосходит по скорости Quadro 5000, базирующуюся на архитектуре Fermi, на 14 процентов.

PTC Creo Parametric 2.0

Система автоматизированного проектирования Creo – очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. И хотя это программное обеспечение работает через OpenGL, в нём одинаково высокие результаты способны показать как профессиональные, так и игровые графические карты с архитектурой Kepler.

195364

Причём, показатели GeForce GTX 680 даже выше, чем у Quadro K5000, что, очевидно, объясняется более высокой частотой, на которой работает GPU и память у игровой видеокарты. При этом новая Quadro показывает отчётливый прогресс в производительности по сравнению с предшественницей, опирающейся на дизайн Fermi. По общему показателю превосходство новой видеокарты составляет 25 процентов.

195365

Более подробное знакомство с результатами теста производительности в Creo Parametric 2.0 позволяет обнаружить тот факт, что наибольший выигрыш архитектура Kepler даёт при работе с каркасными моделями. В этом случае преимущество Quadro K5000 над Quadro 5000 доходит до 45 процентов.

Autodesk Maya 2013

Популярный редактор трёхмерной графики Maya 2013 – это хороший пример типичного профессионального приложения, использующего интерфейс OpenGL. При этом для данной программы не требуется никаких специализированных мини-драйверов: всё превосходно работает через стандартный общий драйвер.

195366

Причём, драйвер профессиональных видеокарт серии Quadro имеет такие оптимизации, которые позволяют им показывать как минимум вдвое более высокую скорость, чем старшим геймерским графическим ускорителям, основанном на самой современной архитектуре Kepler. Между тем, как показывают результаты, Ouadro K5000 на базе Kepler – это не самое хорошее решение для Maya. Профессиональный видеоускоритель прошлого поколения оказывается способен выдать немного более высокую производительность. Правда, необходимо иметь в виду, что преимущество Quadro 5000 по интегральному показателю не означает превосходства этого решения при любом виде деятельности в Maya.

195367

Собственно, Quadro 5000 быстрее, чем более новая Quadro K5000, лишь в том случае, когда речь идёт о работе с трёхмерными моделями, текстурированными или затенёнными с высоким качеством. Во всех же остальных ситуациях новинка с архитектурой Kepler обеспечивает на 8-10 процентов более высокую производительность.

Siemens PLM NX 7.5

NX – это флагманская CAD/CAM/CAE PLM-система, нашедшая широкое применение в машиностроении, и обойти вниманием тестирование в ней мы никак не могли. Тем более, что ситуация с производительностью нового профессионального видеоакселератора компании NVIDIA складывается в ней эталонным образом.

195368

Действительно, преимущество Quadro K5000 над Quadro 5000 достигает 60-процентной величины, а игровой ускоритель отстаёт от профессиональных решений в разы. Quadro K5000 – это отличный выбор для рабочей станции, использующей NX, и добавить тут нечего.

195369

Превосходство Quadro K5000 прослеживается в любом случае, однако наибольшие дивиденды новейший ускоритель с архитектурой Kepler приносит при операциях с полупрозрачными моделями.

Futuremark 3DMark 11

Хотя профессиональные ускорители практически никогда не используются для игр, мы решили добавить результат популярного игрового теста FutureMark 3DMark 11, который может позволить взглянуть на участников сегодняшнего тестирования под другим углом.

195357 195356

Вот здесь-то и всплывает тот факт, что нагрузка, создаваемая играми, сильно отличается от нагрузки в профессиональных задачах. Совершенно неудивительно, что в этом тесте игровая карта GeForce GTX 680 значительно превосходит Quadro K5000. Хотя оба эти ускорителя не только основываются на одной архитектуре, но и даже используют один и тот же чип GPU, GeForce GTX 680 работает на заметно более высоких тактовых частотах. Это неминуемо сказывается на скорости в «игровом» режиме, выводя на первое место именно ускоритель серии GeForce. В профессиональных же приложениях ничего подобного не наблюдается, и на фоне приведённой выше диаграммы становится ясно, что правильная оптимизация драйверов способна творить настоящие чудеса, а аппаратные возможности ускорителей — далеко не самый важный из факторов, определяющих производительность в дизайнерских и инженерных пакетах.

Энергопотребление

В этом разделе мы приводим измеренный нами уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. Используемый нами в тестовой системе новый цифровой блок питания Corsair AX1200i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для наших измерений. Согласно методике снятие значений потребления осуществляется после блока питания и представляет собой сумму энергопотребления всех задействованных в системе компонентов. КПД же самого блока питания в данном случае на результат не влияет.

Измерения выполнялись как в состоянии покоя, так и под нагрузкой — во время прохождения теста FurMark 1.9.2, запущенного в режиме «Burn» в окне с разрешением 1280х720. Этот тест хорош тем, что, как и большинство профессиональных приложений, использует OpenGL, а кроме того, он создаёт существенную нагрузку на видеоподсистему.

195371 195370

Напомним ещё раз: архитектура Kepler родилась из Fermi как раз при оптимизации энергетических и тепловых характеристик. Поэтому совершенно неудивительно, что новая Quadro K5000 на фоне своей предшественницы кажется большим шагом вперёд. Её лучшая экономичность (при возросшем уровне производительности) видна и в покое, и при трёхмерной нагрузке. С точки зрения официальных спецификаций Quadro K5000 экономичнее, чем Quadro 5000, примерно на 20 процентов. На практике же мы видим, что замена старой профессиональной карты на новую позволяет снизить потребление электроэнергии рабочей станцией при нагрузке на графическую подсистему на внушительную величину – 56 Вт.

Попутно обратим внимание и на то, что Quadro K5000 потребляет существенно меньше игровой видеокарты с той же архитектурой. Практика показывает, что чип GK104 способен лежать в основе весьма энергоэффективных ускорителей, а достигается это простым снижением его частоты и напряжения. Иными словами, по поводу того, что дизайн печатной платы Quadro K5000 примитивнее, чем у GeForce GTX 680, переживать не стоит. Профессиональная карта имеет полное право на более простую схему питания GPU.

Выводы

Давно добившись на рынке профессиональных видеоускорителей подавляющего преимущества, компания NVIDIA не почивает на лаврах, а регулярно обновляет свои предложения для рабочих станций, переводя их на новые поколения архитектуры и обеспечивая за счёт этого не только планомерный рост быстродействия, но и улучшение остальных характеристик. Рассмотренная нами свежевышедшая видеокарта Quadro K5000 прекрасно отражает данную тенденцию. Придя на смену ускорителю Quadro 5000, новинка предлагает примерно 35-процентное увеличение производительности, как минимум 20-процентное снижение энергопотребления и целый ряд новых вкусных возможностей. Немаловажно, что стоимость Quadro K5000 при этом остаётся на типичном для таких карт уровне, то есть новая профессиональная видеокарта с архитектурой Kepler – очень привлекательное предложение для дизайнеров и инженеров, нуждающихся в высокой производительности графики.

Чип GK104, хорошо проявивший себя в игровых ускорителях, смог отлично вписаться и в видеокарты, нацеленные на работу с системами автоматизированного моделирования и проектирования. Разработчики NVIDIA не просто перенесли игровой дизайн в профессиональную сферу, а творчески его переработали. Во-первых, это касается изменения профиля питания и рабочих частот, в результате чего достигнута высокая энергоэффективность Quadro K5000. Во-вторых, профессиональная карта обладает большим объёмом памяти, что позволяет ей без проблем работать со сверхсложными моделями и высококачественными текстурами. В-третьих, видеокарты семейства Quadro снабжаются специально оптимизированными для выполнения функций, свойственных для CAD/CAM/CAE-систем, драйверами. И, в-четвёртых, в активе Quadro K5000 имеется поддержка новой версии технологии Maximus, позволяющей ей объединяться с построенными на архитектуре Kepler вычислительными комплексами Tesla; а также технологии Mosaic, которая даёт возможность беспроблемного подключения к видеокарте массивов из нескольких мониторов.
Кроме того, NVIDIA активно работает над тем, чтобы найти для своих карт серии Quadro применение и в сфере профессиональных программ для создания и обработки видеоконтента. Так, поддержку Quadro K5000 должны будут получить приложения из перспективного пакета Adobe CS7, движок Mercury Playback Engine которых сможет активно задействовать развитые вычислительные CUDA-возможности архитектуры Kepler.

Впрочем, у нас есть и некоторые претензии к программистам из NVIDIA. Главным образом они касаются работы Quadro K5000 с системой AutoCAD 2013. По какой-то причине разработка мини-драйвера для этого популярнейшего приложения заброшена, в результате чего инженеры, использующие данную систему автоматизированного проектирования, не могут ощутить все преимущества профессионального ускорителя в полной мере. Похожая ситуация прослеживается и в Creo Parametric 2.0. Хочется надеяться, что в ближайшем будущем эти недостатки будут устранены. Всё-таки, качественная драйверная поддержка – это одно из важнейших качеств, которые должны быть присущи профессиональным видеоускорителям, а NVIDIA всегда относилась к оттачиванию драйверов для собственной продукции с огромным вниманием.

Официальный сайт NVIDIA