Nvidia GeForce GTX 460

Честно говоря, мы не знаем, о чём думала Nvidia, представляя новую видеокарту. Конечно, инженеры компании проводили схожие тесты и прекрасно видели, что GeForce GTX 465 и Radeon HD 5830 обмениваются своими позициями в тестах. Конечно, они знали и о том, что Radeon HD 5830 на международном рынке продаётся по цене от $220. Почему же Nvidia решила, что $279 – это хорошая стартовая цена? Именно такое заключение мы сделали после недели Тестирования Nvidia GeForce GTX 465. И как в воду глядели. Nvidia как будто сделала домашнее задание и представила сегодня пару новых видеокарт, которые смогли сделать то, что не удалось 465. GeForce GTX 460 1 GB и GeForce GTX 460 768 MB дают намного лучше за свою цену. Представленные ранее три видеокарты (GTX 480, 470 и 465) были построены на графическом процессоре GF100, но теперь перед нами, наконец, изменённая версия GF104.

Nvidia могла бы обрезать половину GF100 для представления GeForce GTX 460, что дало бы графический процессор с 256 потоковыми ядрами, 32 текстурными блоками и 192-битной шиной памяти.

Он работал бы достаточно хорошо, хотя представлял бы собой эволюционный шаг назад по сравнению с GTX 465, у которого 352 потоковых ядра, 44 текстурных блока и 256-битная шина памяти.

Впрочем, подобная видеокарта могла бы, в лучшем случае, конкурировать только с AMD Radeon HD 5770. Вместо этого мы получили видоизменённый процессор на основе архитектуры Fermi, но с другим расположением ресурсов – примерно где-то на уровне двух третьих от сложности GF100.

Таким образом, перед нами появился меньший по размеру, более холодный и более функциональный процессор (действительно, новый GPU содержит обновлённое ядро вывода видео, которое позволяет передавать звуковые дорожки Dolby TrueHD и DTS-HD Master Audio в фильмах Blu-ray на внешний ресивер).

Так что перед нами второй и более мощный удар по Radeon HD 5830.

Как вы увидите, GeForce GTX 460 работает быстрее GeForce GTX 465 во многих тестах.

Но как такое возможно для GPU с меньшим числом потоковых ядер? Данный GPU всё же больше нацелен на массовый рынок, чем «монстр» GF100 с тремя миллиардами транзисторов, не так ли? Всё дело в распределении ресурсов.

На макроуровне GF104 по-прежнему использует концепцию кластеров обработки графики Graphics Processing Clusters (GPC), каждый из которых содержит четыре потоковых мультипроцессора Streaming Multiprocessors (SM). Изменения начинаются с потоковых мультипроцессоров SM. Вместо 32 ядер CUDA на SM в архитектуре GF100, у GF104 используется 48 ядер CUDA на SM. Чтобы более сложные мультипроцессоры были нагружены информацией, необходима большая пропускная способность инструкций, поэтому мы наблюдаем ещё одно улучшение: два блока диспетчеризации GF100 на SM превратились в четыре блока у GF104. Наконец, каждый SM теперь содержит восемь текстурных блоков (вместо четырёх).

Если говорить простыми словами, то перед нами более «широкий» GPU, чем GF100.

В результате мы получаем большую производительность, чем можно было бы получить от урезанного GF100, во многих играх.

Теперь давайте немного посчитаем. Полный графический процессор GF104 (без каких-либо отключённых ресурсов) использует два кластера GPC. Учитывая четыре потоковых мультипроцессора SM на GPC, мы получаем восемь SM. Поскольку на каждый SM приходятся 48 ядер CUDA, то в GF104 мы получаем 384 ядра CUDA, 64 текстурных блока и восемь движков PolyMorph, которые Nvidia использует для масштабирования геометрической производительности.

Задняя часть конвейера процессора тоже немного отличается. Полный GF100 использует шесть разделов растровых операций ROP, независимых от GPC, и каждый способен выдавать восемь 32-битных целочисленных пикселей за такт (в сумме 48). Каждый из шести разделов также подключен к 64-битной шине памяти, что даёт суммарную шину 384 бита.

GF104 получает максимум четыре раздела, что приводит к 32 пикселям за такт и к 256-битной шине. Впечатляет для чипа, который по-прежнему производится по 40-нм техпроцессу и состоит из чуть меньше двух миллиардов транзисторов, не так ли? Насколько хорошо он будет конкурировать с «двухмиллиардником» AMD Cypress?

Это покажут наши тесты производительности.

Комментарии запрещены.

Поиск