Отвориха кода на SQL енджина BlazingSQL, използващ графичните карти за ускорение

2
397

Сорс кодът на SQL енджина BlazingSQL, който може да използва изчислителната мощност на видеокартите при обработка на информацията, вече е отворен. BlazingSQL не е пълноценна СУБД, а се позиционира като енджин за анализ и обработка на големи масиви от данни, който предлага производителност на нивото на Apache Spark. Сорс кодът е написан на програмния език Python и се разпространява под Apache 2.0 лиценза.

BlazingSQL е подходящ за извършването на единични аналитични заявки в масиви от данни с големина десетки гигабайти, записани в табличен формат. Това могат да бъдат журнални данни, статистиката на NetFlow и т.н. BlazingSQL може да извършва запитвания в raw файлове в CSV и Apache Parque формат, намиращи се в мрежовите и облачните файлови системи, като например HDSF и AWS S3. Използва се директното прехвърляне на информацията в паметта на графичната карта. Благодарение на разпаралелването на операциите в ядрата на графичния процесор и благодарение на бързата буферна памет, изпълнението на заявките в BlazingSQL става до 20 пъти по-бързо в сравнение с Apache Spark.

Паралелната работа с помощта на GPU се извършва с участието на компанията NVIDIA. Предлагат се програмните библиотеки RAPIDS с отворен код, които дават възможност за създаването на приложения за анализ и обработка на данните, които изцяло се извършват с помощта на графичния процесор.

2
ДОБАВИ КОМЕНТАР

avatar
1 Коментари
1 Отговори на коментарите
0 Последователи
 
Коментарът с най-много реакции
Най-горещият коментар
  Абонирай се  
нови стари оценка
Извести ме за
RB3301
RB3301

А линк към сорс кода?