Ревю на видеоадаптера NVIDIA GeForce GTX 1080

0
399
GeForce GTX 1080 веднага стана първият по рода си по няколко признака: това е първият дискретен видео адаптер с GPU, произведено на базата на 16 nm технологичен процес, първият с видео-памет от типа GDDR5X и е първият масов продукт на базата на Pascal архитектурата. Но освен тези регалии, новият крал на производителността крие още много интересни функции…
 

 
NVIDIA GP104 – първият игрови GPU на базата на архитектурата Pascal
GeForce GTX 1080 – флагманът от „хилядната“ серия на геймърските графични карти на NVIDIA – построен на базата на GPU GP104 – вторият по старшинство чип от гамата Pascal. Въпреки, че по-големият кристал на GP100 вече беше представен по-рано в състава на адаптера Tesla P100, в потребителските продукти, той ще дойде много по-късно (понеже първата партида на Tesla P100, NVIDIA ще предостави на избрани организации, а в OEM каналите, ускорителя ще се появи през първото тримесечие на 2017 г.).
 

 
P104 в сравнение с P100 е с почти два пъти по-малко на брой транзистори и площ на кристала. Ако започнем от линията Maxwell, то това означава, че новият чип заема междинно положение между GM204, който NVIDIA използва в GeForce GTX 970/980 и GM200 (GeForce GTX 980 Ti и GTX 980 TITAN X), както по „физическите“ параметри на кристала, така и по броя на CUDA ядрата и текстурните модулите.
 
back-end конфигурацията на GP104 безпогрешно определя неговата позиция, като последовател на GM204, тъй като той също идва с 256-битова шина на паметта, разделена между осем контролера и 64 ROP блока.
 
GeForce GTX 1080: технически характеристики
Най-важното постижение на 16 нм технологичен процес тук се изразява в тактовите честоти, които са се увеличили почти два пъти спрямо GeForce GTX 980: базова честота – 1607 Mhz, Boost Clock – 1733 Mhz (т. к. последният се явява усреднена честота в типичните приложения, GTX 1080 е способен за кратко да се клокне до по-високи стойности – те обаче предстои да бъдат определени на практика). Все пак, NVIDIA съобщи, че този сериозен ръст на честотите не може изцяло да се дължи на прогресивния технологичен процес и създателя всъщност е трябвало внимателно да поработи върху схемотехниката на чипа, така че „слабите“ връзки да не създават ограничения в общия честотен потенциал.
 
В резултат на това, максималната производителност на GTX 1080 в GFLOPS с единична точност (FP32) значително надхвърля както тази на GTX 980 Ti, така дори и на GTX TITAN X. В игрите, сравнението на GTX 1080 с TITAN X може да се окаже дори по-изгодно, тъй като последният в графичните приложения на практика няма да има предимства пред GTX 980 Ti.
 
Изчисленията с двойна точност (FP64) се изпълняват от процесора GP104 със скорост 1/32 от FP32 – в този случай той наследява чипа от втория и следващите ешелони на семейството Maxwell. Архитектурата Pascal също може да извършва FP16 операции с удвоена производителност в сравнение с FP32, докато Maxwell ги изпълнява на една и съща скорост.
 
Обемът на RAM е 8 GВ от типа GDDR5X – обемът, който по-рано бе прерогатив на графичните карти на AMD, на базата на GPU Hawaii с 512-битова шина на паметта.
 
Както Maxwell, така и GeForce GTX 1080 притежава най-широката сред GPU на пазара поддръжка на нови функции за рендиране от DirectX 12 стандарта (feature level 12_1).
 
GDDR5X
Преминаваме към още една особеност на GeForce GTX 1080, която направи този модел първият по рода си – поддръжката на паметта GDDR5X. В това си качество GTX 1080 известно време ще бъде единственият продукт на пазара, тъй като вече знаем, че GeForce GTX 1070 ще бъде обслужван от GDDR5 чипове. В комбинация с новите алгоритми за компресия на цвета (за това малко по-късно), високата ПСП (пропускателна способност на паметта) ще позволи на GP104 по-ефективно да се разпорежда с наличните изчислителни ресурси, отколкото могат да си позволят продуктите, базирани на чиповете GM104 и GM200.
 
JEDEC пусна финалните спецификации на новия стандарт през януари тази година, а единственият производител на GDDR5X в този момент е компанията Micron.
 

 
Едно от основните разлики между GDDR5X и GDDR5 се състои във възможностите за предаване на четири бита данни на един цикъл на сигнала (QDR – Quad Data Rate) в противоположност на двата бита (DDR – Double Data Rate), както беше във всички предходни модификации на DDR SDRAM паметта. Физически честотата на ядрата на паметта и интерфейса за пренос на данни са приблизително в същия диапазон, като при GDDR5 чиповете.
 
Следващото предимство на GDDR5X се състои в увеличаване обема на чипа – от 8 до 16 GВ. GeForce GTX 1080 е окомплектова с осем чипа по 8 GВ, но в бъдеще производителите на графични карти ще могат да удвоят обема на RAM след появата на по-капацитивни микросхеми. Както и GDDR5, така и GDDR5X позволява използването на два чипа на един 32-битов контролер в така наречения clamshell mode режим, което дава възможност за насочване на 32 GВ памет по 256-битовата шина към GP104. 
 
Подобрена компресия на цвета
Архитектурата Pascal внесе нови алгоритми за делта-компресия на цвета, заедно с компресията 2:1, която се използва от предишните семейства GPU на NVIDIA (която също е направена по-ефективна в Pascal). Като цяло, смисълът на делта-компресията се състои в това, да се открие групата от съседни пиксели, леко отличаващи се по цвят и да кодира цвета им във вид на опорни (референтни) стойности, премахвайки ги от последната (всъщност от делтата). В Pascal се появи алгоритъма 4:1, който работи на още по-тънки градиенти, както и комбинирания режим 8:1, позволяващ да се вземат два блока, сгъстени по схемата 4:1 и да се изобразят във вид на опорна стойност и делта между тях – което в крайна сметка осигурява осемкратна компресия на данните.
 

 
В сравнение с GeForce GTX 980 и GTX 1080, тези мерки осигуряват ефективно увеличение на ПСП от 20% на 40%, които се внасят от новия тип памет с краен резултат 60%. На скрийншотите по-долу от Project: CARS виолетовата покривка отбелязва пикселите, които са били подложени на компресия от страна на GPU от семействата Maxwell и Pascal.
 

 
Вече се запознахме с общите архитектурни характеристики на GeForce GTX 1080 и сега вече можем да преминем към по-специфичните функции. Освен подобрената производителност, която е предоставила по-прогресивната производствена норма и новият тип памет, Pascal внася маса нововъведения, които заслужават по-задълбочен преглед.
 
Simultaneous Multi-Projection
По-горе отбелязахме, че NVIDIA е внесла някои модификации в блока за обработка на геометрията в GPU. Сега PolyMorph Engine може да създава едновременно до 16 проекции (viewport’и), разполагайки ги произволно и фокусирайки ги върху една или две точки, изместени по хоризонталната ос една на друга. Конвертирането на данни се извършва единствено в „желязото“ и не води до намаляване на производителността.
 
А с помощта на SMP, драйверът на видеокартата може да получи информация за физическото разположение на множество екрани, за да проектира изображението за всеки от тях чрез собствен viewport, така че в крайна сметка функционално да се доближи до мултимониторното свързване за пълноценен „прозорец“.
 
Преработен SLI интерфейс
Докато AMD в конфигурациите от няколко GPU премина на синхронизация по PCI Express шината, то NVIDIA все още си използва в SLI отделен интерфейс. Въпреки това от публичното внимание се изплъзва фактът, че при достатъчно високи резолюции на екрана, GPU на NVIDIA също така обменя части от данните чрез PCI Express. Това означава, че във формата, която се използва в предходните архитектури на NVIDIA, SLI вече е изчерпал лимита на честотната си лента. Доколкото ни е известно, той е 1 GB/s, което вече не е достатъчно за обмена на кадри при резолюцията от 3840х2160 пиксела с честотата от 60 Hz.
 
Но вместо напълно да премине на PCI Express, в Pascal е преработен съществуващия интерфейс. Традиционно, видео картите на NVIDIA имат две SLI съединения, които работят едновременно за връзка с GPU и неговите съседи в тройна или четворна конфигурация, но за преноса на данни в двупроцесорната връзка се използва само един канал. Използването на два канала в тандем с GPU – най-очевидният начин за увеличаване на производителността, и в Pascal се е случило точно това.
 
NVIDIA също така е пуснала и специален мост, съществуващ в няколко версии с различна дължина, който притежава подобрени физически характеристики за работа на интерфейса при повишена от предишните 400 Mhz до 650 Mhz честота. По-рано пуснатите мостове също могат автоматично да се ускоряват при условие, че осигуряват достатъчно качествен сигнал. Особено подходящи за тази цел са твърдите мостове с подсветка, произвеждани от някои от производителите на видео карти. Впрочем, последните не разполагат с двоен конектор за свързване на две GPU, така че новият фирмен мост остава единственото решение, препоръчвано за резолюциите от клас 5К и мултимониторните конфигурации.
 

 
Естествено, системите с три и четири GPU не могат да използват двойна връзка. Освен това, NVIDIA официално се отказа от поддръжка на SLI с повече от две GPU в Pascal, тъй като мащабирането на производителността в последните исторически е доста ограничено. Въпреки, че за ентусиастите остава вратичка: от официалната уеб-страница на NVIDIA може да бъде свален файла Enthusiast Key, който след това да добавите във фърмуера на всяка видео карта, за да отключите тази опция.
 
NVIDIA също така коментира ситуацията с мулти-GPU поддръжката в DirectX 12. Има три режима на работа: MDA (Multi Display Adapter) и LDA (Linked Display Adapter) във вариациите Implicit и Explicit. Първият режим осигурява най-голяма гъвкавост, тъй като приложението самостоятелно насочва отделните GPU, дори и при различни характеристики и от различни производители.
 

 
Нови възможности за извеждане на изображението
NVIDIA разшири възможностите на отделния декодер, съвместим със стандарта HEVC (H. 265), който за първи път се появи в GeForce GTX 960. Pascal вече поддържа декодиране на видео потока с дълбочина на цвета 10/12 бита на канал, а също така се появи и възможност за кодиране в HEVC (също с 10-битов цвят).
 

 
Fast Sync
И още едно нововъведение, което Pascal получи на ниво драйвер: още един режим за вертикална синхронизация в допълнение към Adaptive Sync и G-Sync, които NVIDIA представи по–рано – Fast Sync. В същност, този режим не се различава от тройното буфериране, което присъства в API OpenGL, но липсва в DirectX.
 
Тройното буфериране е най-полезно за мониторите с честота на обновяване на екрана 50-60 Hz. За честотите от 120-144 Hz, както вече писахме в статията, е предназначен G-Sync, включващ и вертикалната синхронизация, която по принцип увеличава малко латентността, но Fast Sync я обира до минимум.
 
Ако се чудите, как Fast Sync може да се сравни с G-Sync (и неговия аналог Free Sync от AMD – това е чисто теоретичен въпрос, т. к. NVIDIA поддържа само свои вариант), то G-Sync намалява латентността в ситуация, когато GPU не успява да произведе нов кадър към момента на сканирането, а Fast Sync – напротив, намалява латентността, когато честотата на опресняване на кадрите в рендеринга е по-висока от честотата на обновяване на екрана. Освен това, тези технологии могат да работят съвместно.
 
Обобщение
От флагманския продукт, базиран на GPU с новата архитектура, се очаква той да надмине рекордите, поставени от предшествениците – как по линията на същия производител, така и на неговите конкуренти. Но тук се случи много по-важно събитие, защото GeForce GTX 1080 представлява първият отделен GPU на потребителския пазар, произведен по 16 нм стандарт – NVIDIA GP104. 
 
Втората важна особеност на GeForce GTX 1080 се състои в поддръжката на GDDR5X. Докато микросхемите от типа HBM остават прерогатив на GPU от горния ешелон, GDDR5X паметта осигурява пространство за разработване на по-компактни процесори с 256-битова и по-тесни шини на паметта. Въпреки, че NVIDIA е направила най-консервативния избор в честотния диапазон, който предлага стандарта GDDR5X, GTX 1080 е получил своята пропускателна способност, за която по-рано се изискваше 384 битова разрядност.
 
GP104 стана първият представител на архитектурата Pascal, с който масовия потребител се запозна, а GeForce GTX 1080 – това е изключително успешния старт на NVIDIA. В сравнение с GeForce GTX 980 Ti, новият флагман предлага средно с 32% по-висока производителност в рамките на съвсем друго топлоотделяне. Не по-малко впечатляващ е и честотния потенциал на GPU: дори в нормален режим, GTX 1080 обхваща честотата над 1,8 Ghz, а 2 Ghz – това е напълно постижима цел за овърклокинга при въздушно охлаждане.
 
Всъщност, новият флагман на NVIDIA е лишен от каквито и да било недостатъци от гледна точка на потребителя. Освен това GeForce GTX 1080 е един от най-успешните продукти на компанията от Санта Клара за последните години, което постави доста висока летва за всички бъдещи съперници и последователи.

ДОБАВИ КОМЕНТАР

avatar
  Абонирай се  
Извести ме за