Новости

Обзоры

Файлы

Форум

FAQ

Ссылки

       

02.  Обзоры
 

Новые статьи

 
Новые материалы:

  Foxconn GeForce 8600GT-256OC - на частоте GeForce 8800 Ultra  16.10.2007

Видеокарте GeForce 8600GT-256OC производства компании Foxconn удалось не только существенно обогнать стандартную плату на базе GeForce 8600 GT, но и почти догнать GeForce 8600 GTS. Залог столь высокой производительности – грамотный разгон. »

  XFX анонсирует Fatal1ty 8500 GT  16.10.2007

  Foxconn GeForce 8600GT-256OC и подорванный авторитет  16.10.2007

  Мини-обзор BFG GeForce 8800 GTX WaterCooled Edition  14.10.2007

  MSI RX2600XT Diamond OC Edition  22.08.2007

  Catalyst 7.7 против Catalyst 7.8: тестирование в 11 приложениях  18.08.2007

 

 

Последние новости


 

Статистика




be number one
Rambler's Top100
Rambler's Top100

 

   
Реклама на SavageHQ




Анонс GPU GeForce3 от nVidia

Что же это за зверь?

GeForce3… что же это? 57 миллионов транзисторов, 4 пиксельных конвейера с двумя текстурными блоками на каждом, и все это применимо к возможностям DirectX 8. Пиксельные конвейеры полностью программируемы и включают библиотеку команд процессора вершин "vertex processor" для удобной разработки игр. Усовершенствованный FSAA и поддержка DirectX 7 - для совместимости со старыми программами. А теперь поговорим об этом поподробней.

Чип

В соответствии с заявлениями NVIDIA, обработка графики требует огромного количества транзисторов. К примеру, процессор NVIDIA RIVA 128 состоит из 7 миллионов транзисторов, в TNT2 на одном кристалле размещены 15 миллионов транзисторов, а их число в GeForce2 достигает 25 миллионов. Для сравнения, ATI RADEON использует 30 миллионов, а новый процессор от Intel - Pentium 4 содержит 42 миллиона транзисторов, помещенных в ядро с помощью технологии производства .18 микрон.

Ранее, NVIDIA объявила, что количество транзисторов в GeForce3 будет не меньше 57 миллионов в кристалле, построенном с помощью новой технологии TMSC .15 микрон. В наследство от предыдущих карт, новая логика получила аппаратную поддержку T&L, что очень важно для совместимости с приложениями под DirectX 7.

Как и в GeForce2 GTS, архитектура GeForce3 использует 4 пиксельных конвейера, каждый из которых сожержит по два болка текстуирования. Существует проблема: как предотвратить расхождение результатов при использовании такого принципа ? В GeForce2 GTS четырех-текстурированный пиксель проходил проверку дважды (первый раз - для первых двух текстур, и второй раз - для вторых). GeForce3 применяет совсем другой принцип: просто в двух пиксельных конвейерах обрабатывает четырех-текстурированный пиксель. Это означает, что только два таких четырех-текстурированных пикселя могут быть обработаны за один цикл. Больших потерь в производительности это не влечет, а вот разработчики получат возможность создавать более гибкие эффекты с помощью этой карты.

Частота ядра карты - 200 МГц, количество транзисторов - 57 миллионов - это примерно в 2 раза больше, чем у GeForce2 GTS. Простые вычисления покажут теоретические возможности новой карты.

200 Мгц * 4 пиксельных конвейера = 800 мега пикселей в сек.
200 Мгц * 4 пиксельных конвейера * 2 текстуры в конвейере = 1600 мега текселей в сек.

NVIDIA объявила, что с "сырыми продуктами" покончено, ведь частота памяти может просто "заслонить" результаты производительности даже самых быстрых ускорителей. Основная работа, как и у продукта от ATI с GPU RADEON, заключается в правильной балансировке процессора и памяти. Именно поэтому мы не обнаружили в существующих приложениях большого прироста производительности по сравнению с GeForce2 Ultra.

Все розничные видеокарты GeForce3 оснащены 64 Мб памяти DDR SDRAM, работающей на частоте 230 Мгц (эффективная частота 460 Мгц). Теоретическая скорость работы памяти GeForce3 составляет 7.36 Гб/с:

460 Мгц * (шина 128 бит / 8 = 16 байт) = 7360 Мб/с

Эта цифра является теоретической, так что реальная скорость скорее всего будет ниже. Но мы надеемся, что новая архитектура памяти от NVIDIA "Lightspeed Memory Architecture" это компенсирует.

Архитектура Памяти Lightspeed

Не для кого ни секрет, что большинство существующих модулей DRAM не достаточно эффективны, чтобы обеспечить необходимую производительность в продуктах последнего поколения на больших разрешениях. Именно из-за этого ATI разработала технологию HyperZ, которая освобождает частоту, теряемую при выборке данных или очистке Z-буфера. Также добавлен алгоритм сжатия без потерь (lossless compression algorithm) для дальнейшей минимизации изображения без потери точности.

NVIDIA разработала похожую технологию максимального использования памяти для применения в 230 МГц DDR модулях, используемых в GeForce3. Первое техническое нововведение называется "Перекрестный Контроллер Памяти" ("crossbar memory controller"). Большинство современных контроллеров памяти работают с порциями по 256 бит (т.е. один канал данных 128 бит помноженный на 2, т.к. DDR передает данные по 2-м каналам одновременно). Проблема возникает в передаче данных для маленьких треугольников. Если величина данных 64 бит, а обычный контроллер памяти способен передать порции только по 256 бит, то эффективность такой передачи составляет всего 25%. Это исправлено в новой памяти GeForce3: здесь общий контроллер памяти разбит на 4 эффективных подконтроллера, каждый из которых независимо от других способен обмениваться данными с GPU. Каждый подконтроллер работает с порциями по 64 бит, т.е. всего 256 бит. Преимущество этого мы увидим в будущих приложения, когда для обеспечения большего реализма будет обрабатываться большое количество маленьких треугольников. В таких случаях передача местоположения и свойств этих треугольников будет происходить более эффективно.

Второе техническое нововведение в архитектуре Lightspeed - это специальный алгоритм сжатия без потерь Z буфера, аналогичный алгоритму от RADEON. Этот алгоритм сжимает данные Z-буфера (эти данные представляют собой координаты объекта по оси Z в 3D пространстве) примерно в 4 раза, причем сжатие/восстановление происходит без потерь в производительности. Кроме этого, сжатие происходит без ошибок, и Z данные при этом не теряются.

И наконец, последняя новинка от NVIDIA: она называется Z-преграждение и Отбор (Z-Occlusion Culling). Принцип действия таков: определяется, должен ли пиксель отображаться в данный момент, или он принадлежит другому, невидимому в данный момент, объекту (похоже на Иерархию Z-буфера от ATI). Если этот объект невиден, GeForce3 просто не формирует для него изображение, освобождая тем самым Z-буфер для других объектов. Для каждого видимого пикселя, в среднем, 3D приложения имеют глубину сложности около 2, именно такое количество необходимо для достижения необходимого качества изображения. При правильной настройке, Z-преграждение и Отбор (Z-Occlusion Culling) способно очень сильно разгрузить буфер.

Движок nfiniteFX

Когда вышел чип GeForce2 GTS, возможности по затенению пикселей потрясли всех разработчиков. Сейчас NVIDIA ставит на новую технологию, которая называется "Программируемый Шейдер для Вершин" ("vertex shaders"). В основе этого метода лежит программируемый конвейер вершин, который работает с поистине огромным количеством визуальных эффектов в реальном времени. В своей самой простой форме, "Шейдер для Вершин" представляет собой функцию по обработке графики, которая применяет специальные эффекты к объектам в 3D сцене. Программируемый шейдер вершин, который используется в GeForce3, дарует разработчикам новый уровень гибкости. Данные вершин, такие как x,y, и z координаты, данные о цвете, освещении и инструкции для текстур, помещаются в затенитель вершин - "ящик", содержащий математическую функцию. Эта функция манипулирует данными вершин (при этом данные не создаются и не удаляются), дальше измененные данные появляются с другой стороны с другими координатами, измененной прозрачностью, или с другим цветом. Но не все данные, попадающие в "ящик" меняются - функция может отбирать только данные, обладающие определенными свойствами. Если функция уже обрабатывала какой-нибудь эффект, и он опять требуется в новой 3D сцене, он просто подгружается из затенителя, а не обрабатывается заново.

Т.к. затенитель вершин полностью программируем, количество выполняемых им эффектов зависит только от воображения разработчиков, пишущих программы для GPU. Для "раскрутки", NVIDIA написала специальную программу для организации эффектов и библиотеку, и включила туда около 100 готовых эффектов. Это означает, что мы можем продемонстрировать некоторые из них.

Вершинные шейдеры

Анимация персонажей - это первое использование затенителя вершин. ATI начала продвигать возможности "матричного наложения" ("matrix skinning") в RADEON. Эта технология получила высокую оценку разработчиков, т.к. она позволяет очень реалистично "растягивать" кожу персонажей и отображать их суставы. ATI заявила, что у RADEON количество аппаратных ускорителей матрицы в два раза больше, чем у GeForce2 GTS (4 к 2). Ну а их количество в GeForce3 достигло 32 различных контроллеров матриц, которые используются для контроля над "скелетом" персонажа. Картинка внизу демонстрирует технологию NVIDIA, которая использует свойства шейдера вершин для обработки анимации лица (facial animation) и интерполяция главного кадра (keyframe interpolation) (другое нововведение от ATI, используемое в RADEON).

   

Кроме того, используя шейдер вершин, можно добиться потрясающей реалистичности в обработке тумана, в эффектах преломления, и конечно же в эффектах, связанных с образованием волн на воде. Другой эффект, который можно применить к 3D сцене - это эффект фотографических линз. Используя специальную преобразовательную матрицу - эффект выпуклых линз - можно с помощью нового DirectX 8 добиться потрясающих результатов. Такой тип преобразования не возможен с фиксированным набором функций старого конвейера T&L и на предыдущих версиях API (Application Programming Interface - Интерфейс Разработки Приложений).

В дополнение к эффектам окружающей среды, шейдер вершин в GeForce3 способен применять разные технологии деформаций к объектам. Первое возможное применение - движение стационарных объектов - развивание на ветру флага, или грудная клетка какого-нибудь животного при вдохе и выдохе. Другое применение - стационарные эффекты - могут применяться к внешнему виду объектов, к примеру - дырка от пули, или реалистичные повреждения при столкновении машин в автосимуляторе.

Одна из отрицательных сторон и в GeForce2 GTS и в ATI RADEON - это ограниченное количество аппаратных осветителей для каждой вершины. Используя шейдер вершин GeForce3 вместе с DirectX 8, теоретическое количество аппаратных осветителей для вершины может быть бесконечным.

Мы рассмотрели очень малое количество возможных эффектов. Другие включают специфические эффекты освещения, морфинг (плавное преобразование одного изображения в другое с помощью геометрических операций и цветовой интерполяции), и множество эффектов, связанных с технологией от 3dfx T-Buffer - размытием (motion blur). Основная идея - это полная программируемость шейдеров. Вы поймете все достоинства этой идеи, когда начнут продавать игры под DirectX 8.

Пиксельные шейдеры

В дополнение к попиксельному затенению, NVIDIA хотела включить в GeForce2 GTS и программируемые пиксельные шейдеры. Но это стало возможным только сейчас - из-за его высокой сложности, ведь "вес" GPU - 57 миллионов транзисторов!

Но до того, как применять различные эффекты к 3D сцене, используя шейдер вершин, все пиксели должны быть сформированы, необходимым образом освещены, затенены и окрашены. Сначала текстурные карты с низким разрешением должны наложиться на полигоны, для создания игровой 3D сцены. С выпуском GeForce2 GTS, разработчики получили возможность контролировать эффекты освещения на уровне каждого пикселя, используя NVIDIA Shading Rasterizer с непрограммируемыми пиксельными конвейерами (fixed-function pixel pipelines).

С программируемым пиксельным шейдером, GeForce3 позволяет разработчикам создавать их собственные эффекты затенения пикселей - это лучше, чем зависеть от ограниченных возможностей от NSR. В то время, как GeForce2 может обрабатывать две операции по смешиванию текстур за цикл, GeForce3 успешно справляется с 8 таких операций за цикл (четыре конвейера с двумя модуля для текстур на каждый). Кроме того, максимум 2 пикселя могут иметь 4 текстуры, обрабатываемые за цикл, в отличие от GeForce2 GTS, которая требует большое количество циклов для обработки дополнительных текстур. Это свойство помогает облегчить проблемы с нехваткой ресурсов в чипе, т.к. большое количество циклов требует дополнительного геометрического преобразования и вычислений Z-буфера.

Расширяя свойства пиксельного затенения, NVIDIA добавила 36 запускающихся одновременно операций к имеющимся у GeForce 2 GTS 7. Аппаратная обработка теней, обработка отражающего bump mapping, свойства материалов, и освещение каждого пикселя - все это намного улучшено благодаря такой экспансии. Некоторые эти эффекты можно увидеть в демонстрации от NVIDIA - кожа, волосы, мех животного, и реалистичное отражение.

HRAA (High Resolution Anti-Aliasing) Сглаживание на Высоком Разрешении

С появлением Voodoo5, сглаживание становится важной особенностью. Драйвера и от NVIDIA, и от ATI поддерживают его, несмотря на низкое качество реализации. Метод, используемый в этих драйверах, называется super-sampling. Известный, как техника "грубой силы", super-sampling формирует каждый кадр на чрезвычайно высоком разрешении, до того, как происходит масштабирование и фильтрация на выбранном разрешении. Такая техника работает очень медленно когда обрабатывается за один кадр очень большое количество пикселей. Используя похожую технологию HRAA, можно добиться лучшей производительности, чем в super-sampling, при таком же качестве. "Фильтр Реконструкции" ("reconstruction filter") использует данные из окружающих пикселей для подсчета окончательных свойств какого-нибудь пикселя. Отбираемый образец, используемый в фильтре реконструкции, называется Quincunx, и в соответствии с заявлениями NVIDIA, показывает качество четырехступенчатого отбора (four-sample), при производительности, как у двухступенчатого отбора (two-sample).

Преимущество Quincunx состоит в использовании большего количества данных для постройки окончательных характеристик пикселя, в минимизации объема памяти, который используется при обработке 3D сцен на высоких разрешениях. Как вы могли убедиться, Quincunx требует такой же объем буфера для кадров, как при двухступенчатом отборе, обрабатывая при этом такое же количество входных характеристик, как и при четырехступенчатом отборе.

2D и Видео

Хотя мы не получали никаких характеристик о скорости RAMDAC в GeForce3, но с полной уверенностью можно сказать, что "качество видео и 2D графики на таком же высоком уровне, что у семейства GeForce2". С другой стороны, мы отмечали недостаток качества при разрешении 1600х1200 в GeForce2, поэтому остается только надеяться, что в GeForce3 таких проблем нет.

Спецификации GPU GeForce3

» технологический процесс производства: 0.15 мкм
» число транзисторов: 57 миллионов
» частота графического ядра: 200 МГц
» число пиксельных конвейеров рендеринга: четыре
» число текстурных блоков на каждом конвейере рендеринга: два
» возможность наложения до четырех текстур на один пиксель за один проход (требуется два такта, если число комбинируемых текстур больше двух)
» интерфейс памяти: 128 бит
» поддерживаемые типы памяти: DDR SDRAM/SGRAM
» на момент выхода карты на базе GeForce3 будут оснащаться 3.8 нс памятью, работающей на частоте 230 (460) МГц
» пиковая пропускная способность шины памяти (230 МГц DDR): 7 Гб/с
» поддерживаемый объем локальной видеопамяти: до 128 Мб (большинство первых карт будут иметь 64 Мб)
» RAMDAC: 350 МГц
» максимальное разрешение: 2048x1536@75Hz
» интегрированный в чип TMDS трансмиттер позволяет подключать мониторы по цифровому интерфейсу (DVI), разрешение до 1600x1200 включительно
» интерфейс внешней шины: полная поддержка AGP x2/x4 (включая SBA, DME и Fast Writes) и PCI 2.2 (включая Bus mastering)
» Аппаратный T&L с производительностью эквивалентной 76 миллиардам операций с плавающей точкой в секунду.
» полная аппаратная поддержка всех возможностей MS DirectX 8.0 и OpenGL 1.2
» полностью поддерживаются аппаратные вершинные шейдеры (VertexShaders) DX8, версия 1.1
» полностью поддерживаются аппаратные пиксельные шейдеры (PixelShaders) DX8, версия 1.1
» имеется поддержка объемных текстур
» имеется поддержка кубических карт среды (Cube environment mapping)
» поддерживается проективные текстуры (projective textures)
» имеется поддержка аппаратной тесселяции гладких поверхностей - прямоугольных и треугольных патчей (RT Patches)
» аппаратная поддержка рельефного текстурирования следующих типов: Embosing, Dot Product3 и EMBM
» имеется поддержка S3TC и всех пяти DXTC методов компрессии текстур
» имеется поддержка отсечения примитивов по произвольно заданным плоскостям
» имеется поддержка FSAA на основе различных методик мультисэмплинга (MSAA)
» аппаратные средства для экономии полосы пропускания видеопамяти: поддержка сжатого формата буфера глубины (compressed Z) и раннего определения видимости точек (HSR на базе early Z test)
» поддерживаются текстуры с размером вплоть до 4096x4096 @ 32 bit

X-Box: NVIDIA скрытая сторона

На печатной плате GeForce3 вы найдете почти тот же самый микропроцессорный набор, что и на игровой приставке X-Box с некоторыми незначительными отличиями. Это значит, что разработчики, пишущие под X-box смогут адаптировать игры под ПК (и наоборот) легче. Получатся этакий двойственный эффект. Во-первых, это то, что больше разработчиков будут работать в направлении X-Box, так как они смогут продвигать свои продукты на рынок ПК. Во-вторых, оборотное время игры будет намного меньше. Так что NVIDIA в будущем году попытается захватить игровой рынок.

Для размышлений

Интерес разработчиков к GeForce3 очень высок. Когда мы спросили одного из разработчиков, что он думает об этой карточке, он сказал " GeForce3 изменит ВСЕ представления о 3D графике. Что тут еще сказать?" Другие разработчики думают точно так же, это , скорее всего связанно с программируемостью чипа. Благодаря сотрудничеству NVIDIA с Microsoft, игры, написанные под DirectX 8, будут воплощением наших мечтаний.

Есть ли у нас чего-нибудь новенькое для вас о GeForce3? Конечно. Главное то, что NVIDIA уже подтвердила, что игры, написанные под DirectX 8 появятся на полках примерно к рождеству 2001. Наряду с этим, NVIDIA в следующие шесть месяцев выпустит новый продукт, мы имеем в виду NV25, которая выйдет ближе к осени. Так что в скором будущем лидером продаж будет NV25.

Если же вы услышите положительные отклик от Джона Кармака (John Carmack) из iD Software, вы можете быть уверены. Что продукт удался. Мы, конечно, подождем и воздержимся о каких-либо высказываний пока сами не протестируем GeForce3. Но если, то что говорят лидеры в игровом обществе об этой карточке, то можно с уверенностью сказать, что GeForce3 от NVIDIA изменит ваше представление о манере игры, ее юзабильности, реалистичности и будущем игровой инустрии.


   18 сентября 2001 года.    Главный редактор - Крис Ангелини (Chris Angelini), Перевод - Иван "Reg" Пешалов, Дополнение и редактирование - Дмитрий "Digit" Петрусенко, HardVision Digital SIR

Наверх