fbpx
3.9 C
София

Процесорната архитектура Zen 4: нововъведения и възможности – втора част

Най-четени

Даниел Десподов
Даниел Десподовhttps://www.kaldata.com/
Новинар. Увличам се от съвременни технологии, информационна безопасност, спорт, наука и концепцията Internet of Things.

В първата част се спряхме на платформата АМ5 и започнахме разглеждането на архитектурата Zen 4, за която излезе голямо количество нова информация.

Архитектурата Zen 4

Технологичният процес N5 PPA осигурява ръст на производителността с около 15% в сравнение с предишния N7 или намаляване на консумацията с 30%. Но новата технология осигурява и 1,8 пъти по-висока плътност на транзисторите в кристала. Именно благодарение на новия технологичен процес процесорите Ryzen вече могат стабилно да работят с тактова честота над 5 GHz при многоядрен и многонишков режим.

AMD не са забравили и за едноядреното натоварване. Новата архитектура предлага директно от опаковката честота от 5,7 GHz за едно ядро и възможност за подобряване до впечатляващите 5,8 GHz. Компанията специално подчерта, че новото поколение процесори предлагат 29% ръст на едноядрената производителност в сравнение с чиповете от предишното поколение. Въпреки че вече на практика всички игри и дори управлението на RGB подсветката използват многоядрена работа, този станал вече митичен параметър продължава да се споменава.

Компанията обръща специално внимание на енергийната ефективност, постигната с помощта на новия технологичен процес. Според тази информация, Zen 4 има с 49% по-висока производителност спрямо Zen 3 или консумира с 62% по-малко електрическа енергия при една и съща със Zen 3 производителност.

Постигнатото си има своята цена. Нивото на максималния TDP е нараснало от 105 на 170 W. Площта на ядрото, включително L2 кеш паметта е 3,84 мм², което е с около 18% по-малко в сравнение с площта от около 4,11 мм² при Zen 3 със 7 нанометров технологичен процес. Това означава, че отделяната топлина е нараснала с от 1,25 вата на квадратен милиметър до 1,92 вата на квадратен милиметър. Според спецификациите, максималната температура на кристала си е останала 95 °C.  Това означава, че при използване на новите Zen 4 процесори на максимална изчислителна мощност, все пак ще е необходимо добро охлаждане.

Новите чиплети и йерархията на кешовете

В йерархията на кешовете има известни промени.

Кеш паметта за индтрукции и данни L1-I и L1-D както преди е с обем 32 KB с 8-канална асоциативност, а кеш паметта от второ ниво е увеличена до 1024 KB, също с 8-канална асоциативност, което е двойно повече в сравнение с предишните процесори на AMD. Този подход дава около 1% прираст на IPC, а това е много важно при интензивните натоварвания, особено в сървърния сегмент.

Кешът на инструкциите (L1-I) за един цикъл  на микрооперациите може да осъществи 32-байтови зареждания, като в същото време кешът за данни от първо ниво (L1-D) допуска 3x 32-байтови зареждания и 2х 32-байтови записа на цикъл. Опашката за запис не е променена, но опашката за четене и зареждане на данните в увеличена от 72 на 88 позиции. Буферът за транслиране на адресите (TLB) на L2 кеша е увеличен с 50% и сега е с размер 3 KB.

Да отбележим, че тези промени сериозно повишават производителността при алгоритмите с много висока интензивност, при които се използва повече четене, отколкото запис на данни.

Достъпът на съседните процесорни ядра до L3 кеша се осъществява без използването на шината Infinity Fabric и тук промени няма. Но латентността на L3 кеша е увеличена от 46 на 50 такта. Основната причина за това е нарасналия обем на цялата монолитна структура и увеличените тактови честоти на L3 кеша.

Изпълнителният модул и предсказването на преходите

Изпълнителният модул почти няма промени. Той разполага със същите 4х целочислени блока за прогнозиране и 2х блока за прогнози при използването на естествени числа. Регистърният файл с общо предназначение е увеличен от 192 на 224 позиции, а регистърният файл за работа с естествени числа е увеличен от 160 на 192 записа.

Условната ширина на контейнера е останала същата и сега той може за един цикъл да изпълнява 10 целочислени и 6 веществени микрооперации.

Буферите на процесорните ядра са увеличени, а опашката за процесорните инструкции е увеличена с 25%.

Zen 4 архитектурата позволява на модула за прогнозиране на преходите за един цикъл на микрооперациите едновременно да обработва две разклонения вместо едно, както бе досега. Едновременно с това са увеличени буферите за условните разклонения (BTB) за L1 и L2 кешовете. Кешът за микрооперациите е увеличен от 4 на 6,75 KB. Като резултат броят на извършваните микрооперации е нараснал от 8 на 9 за един цикъл.

Всичко това при Zen 4 е направено , за да може конвейерът на инструкциите да бъда максимално натоварен, без да има латентности и престой.

AVX-512 инструкциите и хардуерното ускорение на невронните мрежи

Преди време Линус Торвалдс твърде критично се изказа по отношение на разширения набор от процесорни команди Intel AVX-512 (Advanced Vector Extensions). Според Торвалдс, по това време Intel безполезно „троши“ транзисторния бюджет на своите процесори, създавайки някакви нови „магически“ инструкции, които стават само за тестове и за показването на някакво хипотетично превъзходство пред конкуренцията. В резултат от това Intel започна да блокира AVX-512 чрез производителите на дънни платки. Но ето че  в наши дни AMD силно набляга именно върху тези инструкции. Защо?

Подобно на своите предшественици, AVX-512 инструкциите са предназначени за ускоряване работата на приложенията, използващи мултимедийните инструкции в работата на някои специфични алгоритми. така например, AVX и AVX2 се използват за ускоряване конвертирането на видео, в емулаторите на конзоли, за размиване на фона в снимките и видеата и други подобни операции.

Новите процесорни инструкции веднага предлагат значително ускорение при кодирането на видео с HEVC формат. Но AMD подчертаха, че тези инструкции са най-подходящи за дълбоко машинно обучение и за алгоритмите с елементи на изкуствен интелект, както и за различните техники за мащабирането на изображения.

Втората причина за въвеждането на AVX-512 процесорните инструкции в десктоп сегмента идва от сървърните архитектури. Именно при сървърите започна ефективното използване на AVX-512 за научни пресмятания, моделиране, виртуализация и други интензивни алгоритми. Това е един много приятен бонус в десктоп сегмента, върху който AMD специално акцентират.

IOD и iGPU

Кристалът, осигуряващ входно/изходните комуникации IOD (I/O die) сега се произвежда чрез 6 нанометров технологичен процес, а не чрез 12 nm, както бе преди. Новото сега е, че в него е интегрирано графично ядро с архитектура RDNA2 и вече се поддържа PCIe 5.0 стандарта.

Благодарение на новия технологичен процес, площта на кристала не е нараснала и е останала 125 мм², въпреки че сега в него има интегрирана графика.

Интегрираният графичен ускорител поддържа AV1 декодиране, H.264 и HEVC кодиране и декодиране. Изображението може да се извежда както чрез DisplayPort 2.0 портовете с пропускателна способност 40 Gb/s, чрез HDMI 2.1, както и през USB Type-C порта, който работи като преходник към DisplayPort.

IOD кристалът има видео модул (VCN), както и модул за дисплеи, каквито познаваме в Ryzen 6000. Въпреки че всичките процесори Ryzen 7000 имат интегрирана графика, AMD заяви, че ще произвежда и нови APU с архитектура Zen 4, с много по-мощни iGPU.

В сега представените чипове, интегрираната графика предлага само 2 CU (Compute Unit), работещи с тактова честота 2,2 GHz, която не претендира да бъде конкурент за мощните хибридни процесори. Но това е много приятен бонус са потребителите, които нямат нужда от допълнителна видеокарта и използват своя компютър предимно за работа.

Компанията обръща внимание на това, че IOD е с много висока енергийна ефективност, понеже в него са използвани технологиите от мобилните Ryzen 6000.

Контролерът за работа с паметта е незначително усъвършенстван и се състои от два сдвоени контролера, всеки от които се грижи за своя си канал. Това дава възможност за работа с бърза оперативна памет с честота около 3000 MHz без използването на някакви скъпи решения.

AMD добавя, че вътрешната шина Infinity Fabric е оптимизирана, но се се съобщават подробности. Предполага се, че са отстранени архитектурните проблеми, забелязани при Zen 3. Един от тях бе, че ако FCLK прехвърли 1800 MHz, тази шина започва да работи в динамичен режим с резки честотни пикове. Предстоящите независими тестове със сигурност ще покажат какви точно са промените.

Една от най-важните особености на процесорите Ryzen 7000 е възможността за работа с 6000 MHz DDR5 оперативна памет. Това е много интересно и ще очакваме експерименталното потвърждение на тази особеност.

AMD EXPO

AMD EXPO е поддръжката на профили за овърклок на DDR5 оперативната памет. Те са директен отговор на профилите на паметта на Intel (XMP), които отдавна са неразделна част от почти всички DDR5 комплекти. 

Оперативната памет може да има няколко AMD EXPO профила и преминаването от един към друг може да става както от UEFI, както и чрез Ryzen Master директно в операционната система. Това е уникална особеност, понеже XMP може да се избира само през UEFI.

AMD обещава до 11% увеличаване на производителността чрез различните JEDEC настройки.

Безопасността

Много важен момент. AMD не е забравила за потребителската безопасност и е добавила нови разширения и подобрения във виртуализацията; премахнати са и възможностите за хакване чрез спекулативно изпълнение на процесорните инструкции.

Изводи

Новите процесори от фамилията Ryzen 7000, базирани на Zen 4 архитектурата и произвеждани чрез 5 нанометров технологичен процес, могат да оправдаят очакванията и на най-придирчивите потребители.

Zen 4 дава не само безпрецедентно високо ниво на производителността в игрите, но я дава и на съвсем поносима цена, която е на нивото на чиповете на AMD от предишното поколение. 

Потребителят получава и много приятен бонус във вид на интегрирана графика, която поддържа най-новите стандарти за кодиране и декодиране на видео и на извеждане изображенията на екрана. Отделна похвала заслужава АМ5 платформата, която запазва съвместимостта с охладителите от предишната АМ4, добавя поддръжката на DDR5 оперативната памет, както и на PCI Express 5.0 стандарта с цялото обилие от портове за използването на най-разнообразна периферия. Планът на компанията Advanced Micro Devices да осигури женен цикъл на новата платформа до 2025+ година явно ще зарадва потребителите, които не обичат и не харесват честата смяна на дънната платка. Цената засега е сравнително висока, но се очаква още през следващите няколко месеца значително да падне.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

0 Коментара
Отзиви
Всички коментари

Нови ревюта

Ревю на новата Need for Speed: Unbound: спираща дъха надпревара в отворен свят

Великанът на състезателните игри се завръща с поредното си превъплъщение. Обещавайки напълно преработен модел на управление и с разработчика на Burnout Criterion зад волана,...

Подобни новини