суперкомпютри

Августовският ъпдейт на Red Hat за заобикаляне на хардуерната уязвимост Spectre 1.1, предизвика срив в работата на файловата система Lustre.

Първи за проблема съобщиха специалистите на Станфордския компютърен център. Те съобщиха, че грешката се проявява във файловата система LustreNet. Това е реализация на Lustre върху InfiniBand, използваща RDMA за високоскоростно прехвърляне на файлове и метаданни. Грешката се оказа катастрофална – суперкомпютрите не могат дори да направят ping към самите себе си. Изобщо не може да става дума за формиране на файлови системи или за обмен на данни с другите възли.

Като временно решение, Red Had препоръчва да се направи връщане към Linux ядрото версия 3.10.0-862.11.5.el7. По всичко личи, че грешката ще се окаже в RDMA, на която се базира Lustre.

Представителят на Red Hat Кристофър Робинсън (Christopher Robinson) съобщи за портала The Register, че грешката ще бъде оправена във версия 3.10.0-862.13.1 на ядрото, която в момента се тества. При екстрена необходимост за използване на суперкомпютъра, трябва да се търси помощ от Red Hat Global Support Services, които вече предлагат работещи решения.

Lustre е разпределена файлова система с масов паралелизъм, използвана в на практика всички мащабни клъстърни изчисления.

Отдалечения пряк достъп до паметта (RDMA) е хардуерно решение, осигуряващо директен достъп до паметта на друг компютър.

0 0 глас
Оценете статията
Абонирай се
Извести ме за
guest
3 Коментара
стари
нови оценка
Отзиви
Всички коментари