Как хакерите могат да четат чатовете ви с ChatGPT или Copilot

Нов метод позволява на хакерите да декриптират съобщения в диалог с чатбот...

Най-четени

Емил Василев
Емил Василевhttps://www.kaldata.com/
Емил Василев редовно превежда сложни научни теми на достъпен език — от въпроси като „Какво е имало преди Големия взрив?" до практическото приложение на биотехнологиите в лечението на болести. Тази комбинация от технологична и научна журналистика го прави един от най-разностранните автори в екипа на Kaldata.

Специалисти от израелската компания Offensive AI Lab представиха метод, който позволява дешифриране на текстове от прихванати съобщения в кореспонденция с чатботове като ChatGPT или Copilot. От Kaspersky дадоха подробности за изследването.

Новата техника представлява атака по странични канали, основана на анализ на дължината на символите в криптираните съобщения.

Тъй като чатботовете, използващи големи езикови модели (LLM) предават информацията в токени (последователности от знаци, които се срещат при писане), а не в думи или символи, изучаването на дължините на токените позволява да се отгатне съдържанието на съобщенията. На уебсайта на OpenAI има инструмент, наречен „Tokeniser„, който ще ви помогне да разберете как работи това.

Токенизиране на съобщения чрез моделите GPT-3.5 и GPT-4

Основната уязвимост се състои в това, че чатботовете изпращат токени последователно, без да използват методи за компресиране или криптиране, което улеснява хакерите.

Някои чатботове (например Gemini на Google) са имунизирани срещу този вид атака, но повечето други са уязвими. За възстановяване на текста изследователите използват два LLM модела. Единият е специализиран за възстановяване на стандартни уводни съобщения, а другият – за възстановяване на по-нататъшния текст на комуникацията. Резултатите от възстановяването на текст са около 29%, а отгатването на общата тема на разговора е около 55%.

Схема на атаката

Особеността на тази атака е зависимостта ѝ от езика на комуникация. Тя е най-ефективна на английски език поради характерните за него дълги лексеми. При други езици ефективността на атаката е значително по-ниска.

Дори близки до английския езици от германската и романската група имат лексеми, които са средно 1,5-2 пъти по-къси. Това значително намалява потенциалната ефективност на атаката. Струва си да се подчертае, че използването на подобен метод едва ли ще позволи надеждно идентифициране на конкретни детайли като имена, цифрови стойности, дати, адреси и други важни данни.

В отговор на публикуването на тази техника разработчиците на чатботове, включително Cloudflare и OpenAI започнаха да прилагат метода на добавяне на „подложки“ (ненужни данни), което намалява вероятността за успешна атака. Вероятно и други разработчици на чатботове ще приложат защити, за да направят общуването с чатботове по-безопасно.

Всичко важно от света на технологиите, директно в пощата ти.

С абонирането приемате нашите Условия и Политика за поверителност. Може да се отпишете с един клик по всяко време.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

2 Коментара
стари
нови оценка

Нови ревюта

Подобни новини