Августовският ъпдейт на Red Hat за заобикаляне на хардуерната уязвимост Spectre 1.1, предизвика срив в работата на файловата система Lustre.
Първи за проблема съобщиха специалистите на Станфордския компютърен център. Те съобщиха, че грешката се проявява във файловата система LustreNet. Това е реализация на Lustre върху InfiniBand, използваща RDMA за високоскоростно прехвърляне на файлове и метаданни. Грешката се оказа катастрофална – суперкомпютрите не могат дори да направят ping към самите себе си. Изобщо не може да става дума за формиране на файлови системи или за обмен на данни с другите възли.
Като временно решение, Red Had препоръчва да се направи връщане към Linux ядрото версия 3.10.0-862.11.5.el7. По всичко личи, че грешката ще се окаже в RDMA, на която се базира Lustre.
Представителят на Red Hat Кристофър Робинсън (Christopher Robinson) съобщи за портала The Register, че грешката ще бъде оправена във версия 3.10.0-862.13.1 на ядрото, която в момента се тества. При екстрена необходимост за използване на суперкомпютъра, трябва да се търси помощ от Red Hat Global Support Services, които вече предлагат работещи решения.
Lustre е разпределена файлова система с масов паралелизъм, използвана в на практика всички мащабни клъстърни изчисления.
Отдалечения пряк достъп до паметта (RDMA) е хардуерно решение, осигуряващо директен достъп до паметта на друг компютър.