Тестове и обзор на новите процесори Ryzen 5000 – на практика във всичко по-добри от Intel

33
2502

През последните три години AMD не престава да радва всички потребители, без изключение. Феновете на Advanced Micro Devices са доволни от високата производителност, а феновете на Intel – от падналите цени и от започването на все пак някакъв прогрес. Екипът на доктор Лиза Су след представянето на първите решения с архитектура Zen дотолкова подобри свята рожба, че постави доста по-високи цени на процесорите от серията Ryzen 5000 в сравнение с техните предшественици в началото на продажбите. Това е възможно само, ако си напълно уверен в своя продукт. А дали това е така – ще разберем в края на разгледаните по-долу тестове, а засега нека се спрем малко по-подробно на процесорната архитектура Zen 3.

Zen 3

Въпреки че архитектурата Zen претърпя кардинални промени още в Zen 2, компанията въобще не намали оборотите и само за една година извърши още една технологична революция без да сменя технологичния процес. Архитектурата Zen 3 е наистина сериозна стъпка напред, в рамките на която е реализиран 19% ръст на IPC, както и редица други нови неща.

Изображението по-горе е показва, че е водена на усърдна работа по много направления, за да се удовлетворят изискванията на всички потребители и особено на геймърите. Оптимизациите са засегнали всички елементи на конвейерите: размерът на специалният буфер за условните преходи (BTB) е увеличен двойно, значително е подобрена пропускателната способност на условните преходи, премахнат е ефектът на ‘мехурчето’ в предсказването на условните преходи и е намалена условната глоба за неправилното предсказване на преходите. Блоковете за изпълнение на процесорните инструкции, за тяхното зареждане и съхраняване, също имат редица подобрения, но за това ще стане дума по-долу.

CCD и йерархията на кешовете

Най-голямото нововъведение на архитектурата Zen 3 е променената структура на CCD (Core Complex Dies) модулите. Сега кристалът е монолитен и не включва както преди два CCX (CPU Complex) блока, които при предишните архитектури се свързваха чрез Infinity Fabric шината.

Благодарение на тези промени в процесорния дизайн, сега всяко ядро може директно да се обръща към L3 кеша без да се налага използването на Infinity Fabric шината, което значително е намалило латентността за достъп до данните. Въпреки това, латентността на кеша от трето ниво е увеличена от 39 на 46 такта. Основната причина за това е увеличеният капацитет на монолитната структура, а втората – увеличената работна честота на L3 кеша. Не се извършва предварителен подбор на данните, които постъпват в кеша от трето ниво – те просто се изместват от него в L2 кеша и това е дало отражение върху производителността.

Но в останалата йерархия на кешовете са направени някои промени.

L1-I и L1-D кеш паметите както преди са с капацитет по 32 KB с 8-канална асоциативност, като кеш паметта от второ ниво с размер 512 KB също има 8-канална асоциативност. Кешът за микроинструкциите не е променен и неговият капацитет в 4 KB.

Zen 3 поддържа до 64 пропускания на тактове между L2 и L3 на ядро и 192 между L3 и оперативната памет.

Кешът за инструкциите (L1-I) в циклите може да даде 32-байтов подбор, като в същото време кешът за данните (L1-D) допуска 3x 32-байтови зареждания и 2х 32 байтови съхранения на цикъл. Размерът на опашката на тези данни е увеличен от 48 на 64 значения.

Да отбележим, че това решение е характерно за повечето високо интензивни работни натоварвания, което в крайна сметка води до по-голям брой зареждания, отколкото записвания на данни.

Също така, Zen 3 може да зарежда два и да записва един 256-битов вектор на една операция при условие, че е осъществено обръщение към различни DC банки.

Буферът за преобразуване на адресите (DTLB) не е променен и си е останал 2 KB. AMD съобщава, че е подобрен предварителния подбор чрез промени в границите на страницата.

Модулът за избор на инструкция и предсказване на условните преходи

AMD заяви, че  в модула за избор на процесорна инструкция и за предсказване на преходите са направени редица оптимизации, с помощта на които подборът става по-бърз, особено за код с много условни преходи и с голям размер. Без съмнение това е една отлична новина за програмистите и за повечето геймърски енджини, понеже допълнителните оптимизации се поемат от процесора, а намесата на разработчиците значително се намалява.

Буферите на целите за условните преходи също са преработени. Таблицата от първо ниво на Zen 3 включва 1024 записа вместо 512, а от второ ниво – 6,5 хиляди записа вместо 7 хиляди. Масивът за косвени адреси е увеличен с 1000 записа до максимум 1500 записа. Всичките тези промени взети заедно дават възможност на процесора по-бързо да възстановява изпълнителния конвейер след неправилно предсказан условен преход.

Поредността на микрооперациите се формира от 4 декодирани инструкции на такт или от осем инструкции взети от кеша за микрооперациите. По този начин става възможно планирането но до шест микроинструкции за един такт.

Друго интересно нововъведение е метод за борба с ‘мехурчетата’ в предсказанията. Във всички процесори Ryzen се използва регистърът на програмния брояч за определяне текущата инструкция, която се взима от конвейера и едновременно с това се предотвратява вземането на нови инструкции. Когато дадена инструкция на етап декодиране е спряна, значението в регистъра на програмния брояч и самата инструкция се запазват за да се предотврати възникването на нежелани промени. Тези значения се запазват дотогава, докато инструкцията предизвикваща конфликт, не бъде изпълнена. Това събитие често се нарича ‘мехурче’ по аналогия с мехурчетата въздух в парното или във веригата на водното охлаждане. Когато се използва буфериране от подобен тип, този ефект е незначителен.

В Zen 3 модулът Integer има осем изпълнителни порта, към които са включени четири ALU (аритметико-логически устройства), три AGU (блокове за генериране на адреси) и един BRU (модулът за вземане на решения, за извършване на преходи и за извикване на подпрограми).

AGU модулът както преди може да подава три микроинструкции за такт към файла на регистрите. Регистерният файл малко е увеличен – от 180 на 192 записа.

Направени са промени и в модула за работа с числа с плаваща запетая. AMD заяви, че сега се използва значително по-голям паралелизъм и са намалени вътрешните латентности. Същото важи и при работата с цели числа

И още, операцията за умножение и натрупване (FMAC) се изпълнява с един цикъл по-бързо. Добавени са двата нови модула F2I и STORE F2I, които се използват за преобразуване на веществените значения в целочислени, както и за записа на тези числа. За съжаление AMD не съобщи с колко се увеличава производителността от всяко едно нововъведение. Но в тестовете всичко става ясно.

IOD и овърклока на оперативната памет

Това е единственият кристал, в който не са направени архитектурни промени.

Когато имаме конфигурация от само един чиплет, скоростта на запис е точно половината от скоростта на четене, също както е при архитектурата Zen 2. Да напомним че това не е недостатък – повечето приложения използват по-активно операциите за четене, отколкото операциите за запис. Изключения са само някои специализирани тестове. Може да се види и че тук ситуацията напомня на йерархията на кешовете – три четения и два записа за един такт. Тоест процесорната архитектура е балансирана навсякъде.

Конфигурациите с два чиплета предлагат пълноценна скорост на запис. Тук няма особени промени.

Благодарение на по-високата честота на ядрата и реорганизацията на CCX, латентността на достъпа до DRAM е намалена почти с 10 наносекунди и в повечето случаи е около 55 наносекунди при използване на оперативна памет честота 3800 MHz и CAS 16. Контролерът на паметта не е променян и не е усъвършенстван.

Безопасността

Безопасността на данните винаги е била основен приоритет на компанията AMD и както мнозина знаят, именно процесорите Ryzen никога не са получавали обновявания по безопасността, с които да се намали тяхната производителност. Но въпреки това Advanced Micro Devices продължава да подобрява безопасността и сега е добавила поддръжката на CET във всички процесори с микроархитектура Zen 3.

CET технологията е разработена за защита от неправомерно използване на легитимен програмен код с помощта на атаки за прихващане на управлението, които широко се използват в голям клас вредоносни програми. CET предлага на разработчиците на софтуер две ключови възможности за защита от хакерски програми, които се опитват да прихванат потока на управление: косвено проследяване на преходите и сенчест стек. Косвеното проследяване на преходите осигурява непряка протекция на тези преходи, с което се осигурява защита от атаките с използване на извиквания и преходи в софтуера (JOP/COP). Сенчестият стек осигурява защита на адреса на връщане от подпрограма, за да си осигури протекция от ROP  атаките.

Precision Boost 2

Както показа практиката със CTR, технологията Precision Boost 2 не демонстрира особена ефективност дори и при процесорите с архитектура Zen 2, понеже нямаше интелигентен подход към увеличаването на честотата спрямо захранващото напрежение. В това отношение AMD не даде информация дали се използва нов заводски метод за търсене на най-удачните ядра които да са максимално пригодни за този автоматичен овърклок.

Що се отнася до стандартно динамичен овърклок, към днешен ден той работи великолепно и в повечето случай неговите значения дори превишават маркетинговите числа.

Безопасното напрежение и други препоръки

Към днешен ден потребителите са интересуват какво напрежение трябва да се използва и кое напрежение е безопасно. Според излязлата миналата седмица информация, при игрите и малките приложения значението на CPU VID може да достига до 1,5 V и това е в реда на нещата. При тежки натоварвания максималното значение на CPU VID не трябва да превишава 1,35 V. При престой това напрежение може да бъде в диапазона от 0,2 до 1,45 V, което съответства на значенията P-state P2 и P1 (слаб boost).

Подаденото напрежение от 1,45 V съвсем не означава че всички ядра ще получат именно това напрежение. Повечето от тях могат да бъдат в икономичния C6 режим или в някое друго С-състояние. Друг важен момент е скоростта на промяна на ефективната честота и CPU VID, което става в рамките на около една милисекунда. Това означава, че стартираният HWinfo или Ryzen Master вижда около 1/1000 от всичко което се случва в системата.

Сега управлението на захранването на процесора става с помощта на стандартните планове на захранването в операционната система Windows 10. При това, някои Ryzen ядра с архитектура Zen 3 прекарват в хибернация повече време и вече ги няма температурните пикове. Да напомним че Windows 10 задължително трябва да е с майското обновяване 2004, иначе може да има проблеми с ускоряването на честотата и при режимите с икономия на електрическа енергия.

При новите процесори максималната допустима температура е 95 градуса по Целзий за чиповете с TDP 65 W и и 90 градуса при TDP 105 W.


Край на първа част. Във втората част ще разгледаме представените 4 модела процесори Vermeer, ще се спрем на тестовете на чиповете AMD Ryzen 9 5950X и AMD Ryzen 9 5900X и ще видим как се представят новите процесори на AMD в игрите.

4.5 4 гласа
Оценете статията
Абонирай се
Извести ме за
guest
33 Коментара
стари
нови оценка
Отзиви
Всички коментари