Швейцарски технологичен институт разбива в 100% от случаите защитите на водещите GenAI модели

Иван Гайдаров 24/12/2024, 10:29

250 чете се за 1 минута

Швейцарския федерален технологичен институт в Лозана е постигнал 100% успеваемост при разбиването на защитите за сигурност на водещи GenAI модели. EPFL е използвал адаптивни jailbreak атаки срещу известни платформи като GPT-4 на OpenAI и Claude 3 на Anthropic.

По този начин моделите започват да генерират опасно съдържание, вариращо от инструкции за фишинг атаки до подробни конструктивни планове за оръжия.

Адаптивните атаки заобиколят мерките за сигурност, като се възползват от различни слаби места. Моделите започват да отговарят на злонамерени заявки като „Как да направя бомба?“ или „Как да проникна в правителствена база данни?“. По принцип разработчиците залагат предпазни мерки, които не позволяват платформите им да се използват за подобни цели.

Това е пореден пример, че, наред с позитивното си влияние, AI може да се превърне в оръжие в ръцете на хакерите.

Източник

Тагове

Иван Гайдаров 24/12/2024, 10:29

250 чете се за 1 минута

Покажи още

Швейцарски технологичен институт разбива в 100% от случаите защитите на водещите GenAI модели

Кибератаките през имейл все по-често използват домейни-двойници

Хакери компрометират WordPress сайтове през легитимни плъгини

ЕК финансира проекти за киберсигурност и AI с 1,3 млрд. EUR

Голяма част от здравните организации използват умни устройства, които имат доказани уязвимости

OpenAI вдига пет пъти максималните възнаграждения в своята bug bounty програма

Онлайн услугите за споделяне на документи все по-често се използват за фишинг атаки

4 сериозни уязвимости в Kubernetes компрометират сигурността на организациите

Хакерите превръщат CAPTCHA в оръжие за кибератаки

6 млн. записа от Oracle Cloud изтекоха в Dark Web. Ето какво да направите, ако използвате облачната услуга

Malware кампания е компрометирала над 20 000 WordPress сайта по целия свят