fbpx
15.3 C
София

Руският процесор Елбрус 8С: архитектура и особености

Оригиналът е на RiddleRider

Най-четени

Даниел Десподов
Даниел Десподовhttps://www.kaldata.com/
Ежедневен автор на новини. Увличам се от съвременни технологии, оръжие, информационна безопасност, спорт, наука и концепцията Internet of Things.

Разработката на руския процесор Елбрус 8С започва в края на 2011 година. Той се базира на дизайна на чипа от предишно поколение Елбрус 4С, но е с преработени структурни елементи, включително процесорните ядра, подсистемата за работа с паметта и входно-изходния модул. Първите инженерни екземпляри на този чип излязоха през 2014 година, а неговото серийно производство стартира през 2016 година.

Технически характеристики

  • Процесорна архитектура: Елбрус
  • Брой процесорни ядра: 8
  • Кеш от второ ниво: 8х512 KB
  • Кеш от трето ниво: 16 MB
  • Работна честота: 1,3 GHz
  • Производителност: около 250 гигафлопа
  • Контролер на паметта: DDR3-1600
  • Брой контролери на паметта: 4
  • Поддръжка на многопроцесорни системи: до 4 Елбрус процесора
  • Скорост на данните между процесорите: 3 дуплексни канала с 16 GB/s всеки от тях
  • Технологичен процес: 28 нанометра

Вътрешна структура

Елбрус 8С е типичен чип с общо назначение, поставен в BGA корпус с 2028 контактни площадки и с габаритни размери 43х59 мм.

Процесорът е проектиран от руски специалисти и се произвежда чрез 28-нанометров технологичен процес в заводите на тайванската компания TSMC и съдържа два милиарда и седемстотин и тридесет милиона транзистора.

Под капачката можем да видим кристала, с поставената върху него термична паста, както и SMD компонентите на подложката.

Площта на кристала възлиза на 330 416 квадратни милиметра.

Ако махнем кристала от подложката ще видим металния слой, съединяващ отделните области на чипа с BGA топчетата-конектори на подложката. Както при всички съвременни процесори всеки контакт изпълнява някаква собствена функция, като редица от тях предимно подават захранване към цялата повърхност на чипа.

В горния десен ъгъл на кристала се вижда стария логотип на корпорацията МЦСТ, наименованието и годината на производство на процесора.

След като се премахне горния метален слой се вижда първоначалният вид на чипа:

 

Този кристал включва 8 процесорни ядра с архитектура Елбрус от четвърто поколение с тактова честота до 1300 MHz, като всяко едно от тях може да извършва до 25 операции за един такт в скаларен и до 41 операции за един такт във векторен режим.

Ядрата са съединени с общата кеш памет от трето ниво с капацитет 16 MB, която има разпределена структура и е разделена на 8 независими банки (от Б0 до Б7). Характерна особеност на този процесор е че всяко ядро има достъп до всички банки.

Ядрата и банките на общата кеш памет са обединени във възли, които при Елбрус 8С се наричат кварти, включващи по две ядра и две банки във всеки един от тези Quart-и. Квартите са съединени с двупосочен буферен пръстен.

Контролерът на системния обмен SIC изпълнява функциите за достъп до паметта и до входно-изходния модул. Той включва и всички контролери за бързите интерфейси на процесора.

SIC има четири контролера за каналите на SDRAM DDR3-1600 оперативна памет с максимална пропускателна способност 51,2 гигабайта в секунда. Процесорът може да адресира до 64 GB оперативна памет.

SIC включва и 3 контролера за дуплексните канали за обмен на данни при системи с няколко процесора Елбрус 8С с пропускателна способност 8 GB/s и в двете посоки. Възможно е обединяването на до 4 процесора в една обща компютърна система с кохерентна обща оперативна памет до 256 GB.

SIC разполага и с дуплексен входно-изходен канал с пропускателна способност 8 GB/s и в двете посоки, който е съвместим с южния мост.

Според спецификациите тактовата честота на процесора Елбрус 8С достига 1,3 GHz, а тиковата производителност възлиза на 250 гигафлопа при изчисления с единична точност (FP32) и 125 гигафлопа при изчисленията с двойна точност (FP64).

Ядрото

При разработването на процесорното ядро на Елбрус 8С за основа е взето ядрото на чипа от предишно поколение Елбрус 4C. За повишаване производителността на ядрото е увеличена тактовата честота и броят на едновременно изпълняваните аритметични операции с плаваща запетая.

 

Самото ядро включва два клъстъра. Всеки клъстър съдържа три аритметико логически канала, локален блог на регистровия файл (RF), локален блок за запис на данните в L1 кеша и модул за подготовка на операндите и получаване на резултатите. ALC каналите имат отделни модули за извършване на целочислени аритметични операции и операции с плаваща запетая. Целочислените аритметични операции се извършват във всичките шест канала на двата клъстъра. Скаларните обръщения към паметта при четенето на данни се изпълняват от ALC 0, 2, 3 и 5, а при запис – от ALC 2 и 5. Операциите с плаваща запетая от типа събиране и умножение, включително и тези с три операнда, се изпълняват от ALC 0, 1, 3 и 4, а делението се извършва единствено от ALC 5.

 

Увеличаването на броя едновременно изпълнявани аритметични операции с плаваща запетая е постигнато чрез добавянето в ALC 2 и 5 възможност за изпълняване на операциите събиране и умножение с плаваща запетая.

В резултат от тези подходи производителността на ядрото е повишена почти 2,5 пъти при увеличаване на неговата площ едва с 3,2%.

Частната, локална кеш памет на ядрото е наследена от процесора Елбрус 4С, но има някои промени. Както и при предишното поколение, използва се отделна кеш памет от първо ниво  (L1) за процесорните инструкции с капацитет 128 KB  и 64 KB за данните. Кеш паметта от второ ниво (L2) съхранява както кода, така и данните.

Поради технологичните ограничения за площта на кристала и новите особености на йерархиите размерът на L2 кеша е намален до 520 KB, без да са правени каквито и да било други промени.

MAU (Memory Access Unit) устройството, което е съединено с изхода на L2 кеша, управлява обмена на информация на процесорното ядро с останалите модули на чипа и е разработено изцяло отново с цел повишаване на работната честота и мащабируемостта, както и за оптимизиране на взаимодействието на ядрото с L3 кеша.

Паметта и входно-изходния модул

Подсистемата на паметта осигурява кохерентен достъп на процесорните ядра и външните устройства до оперативната памет. Както и кеш паметта, тя играе изключително важна роля в постигането на необходимата производителност, особено за програмите Memory-Bound. В сравнение с процесора от предишно поколение, в новия Елбрус 8С е удвоен броят на процесорните ядра и по този начин съответно е нараснало натоварването на паметта. За да не стане подсистемата на паметта тясното място на процесора, броят на каналите за работа с DDR3-1600 е увеличен до четири, с което се осигурява максимална пропускателна способност от 51,2 GB/s и възможност за поставяне на до 64 GB оперативна памет.

Процесорът включва и три работещи на физическо ниво PCI Express контролера с дуплексни канали за обмен на информация с процесора и пропускателна способност 8 GB/s и в двете посоки. С помощта на тези канали е възможно съвместното обединяване на до 4 процесора в cache coherent NUMA система с обща кохерентна RAM.

Функциите за реален достъп до паметта изпълнява локалния контролер на системните обмени SIC local. Освен това той е и глобалният възел за осигуряване поредността на заявките и запитванията в многопроцесорните системи с обща памет.

 

Банките кеш памет от трето ниво са фиксирани към отделните клъстъри: всяка двойка контролери на паметта обслужва най-близките четири банки L3 кеш.

Достъпът на ядрата до външните устройства и конфигурационните регистри, както и достъпът на външните устройства до оперативната памет чрез DMA се осъществяват от SIC global контролера.

Комутация на връзките

Схемата за комутация на процесора е разделена на две нива: ядрата с L3 кеша и SIC – също с L3 кеша. На първото ниво е реализирана връзката на всяко процесорно ядро с останалите седем ядра и осемте банки кеш памет от трето ниво.

Самата схема има разпределена структура и се състои от четири Quart модула. В квартата са включени две ядра и по две банки общата кеш памет, които са свързани с централизирания комутатор L3 Com.

На второ ниво е реализирана връзката между банките L3 кеш и SIC. Всяка кварта е свързана със съответната двойка контролери на паметта. Самата комутация се осъществява на два етапа – между двете банки в квартата и между двете кварти в SIC local. Сумарната пикова пропускателна способност на връзките между четири кварти възлиза на 166 GB/s и в двете посоки.

Във връзка с увеличаването площта на кристала и използвания 28 нанометров технологичен процес се е наложило решаването на редица проблеми, които не са директно свързани с постигането на висока производителност. На първо място е проблемът с отделяната топлина. За нейното намаляване при престой на едно или няколко ядра е разработен механизъм за тяхното динамично изключване, което се извършва от операционната система. Измерването на температурата на кристала се осъществява от осем термични сензора, поставени в различни точки на кристала.

 

Нека да се вгледаме в общия дизайн на кристала в процесора Елбрус 8С:

Руското производство

Има много спорове относно това, как може този процесор да се счита за руски след като се произвежда в заводите на тайванска компания?

На територията на Русия има две известни на широката общественост фаблес компании. Фаблес (Fabless) означава, че съответната компания не разполага със собствени производствени мощности, които да отговарят на технологичните изисквания на произвежданата от тях продукция.  Същият подход прилага и AMD, която през 2009 година обособи своето полупроводниково производство в отделна компания – Global Foundries. По същия начин работят и NVidia, Qualcomm, MediaTek, – нещо, което е добре известно. Единственият процесор на МЦСТ, който се произвежда на територията на Русия, е Елбрус 2СМ. Той се произвежда в завода Микрон в Зеленоград чрез 90 нанометров технологичен процес. Пределът на този завод е 2 ядра и 300 MHz. В завода Микрон се произвеждаха и 65 nm чипове, но имаше големи проблеми с различните стадии на експониране, а броят на годните кристали бе твърде малък. В началото на предишното десетилетие държавата е очаквала нова литографска апаратура, но наложените санкции спряха този процес. По принцип всеки процесор се състои от многобройни модули, логика и шаблони, които се предоставят от други компании. Такава е световната практика.

В крайна сметка имаме ситуация, при която сегашната руска електроника изцяло се определя от наложените санкции. По този начин се получава така, че бъдещето на руската микроелектроника е пряко свързано с Китай – Поднебесната е единствената надежда за заобикаляне на западните санкции. Но това може да доведе до зависимост от китайските технологии.

 


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Предишна новинаIceCream Image Resizer 2.12
Следваща новинаAcronis True Image Home 2021 Build 39287
Абонирай се
Извести ме за
guest
49 Коментара
стари
нови
Отзиви
Всички коментари

Нови ревюта

Подобни новини