Новооткрита уязвимост в ChatGPT разкрива пропуските в защитата на AI системите

Иван Гайдаров 29/10/2024, 17:06

303 чете се за 1 минута

Новооткрита уязвимост позволява заобикаляне на защитните механизми на ChatGPT с помощта на шестнайсетично кодирани инструкции. Откритието, направено чрез bug bounty програмата за откриване на грешки в сигурността 0Din, повдига сериозни въпроси относно сигурността на AI системите.

Новата jailbreaking тактика позволява на потребителите да заобиколят вградените ограничения на ChatGPT чрез кодиране на злонамерени инструкции. В демонстрация на Марко Фигероа, мениджър по сигурността на AI в Mozilla, ChatGPT е накаран да генерира експлойт код на Python за известна уязвимост. Това обикновено е забранено от системата.

Изследователят разкрива и втора техника, използваща емоджита за заобикаляне на защитите. Чрез специално форматирана заявка системата е подведена да създаде инструмент за SQL инжекция.

„Този пробив демонстрира нуждата от по-усъвършенствани мерки за сигурност в AI моделите, особено по отношение на кодирането“, коментира Фигероа пред CybersecurityNews.

OpenAI, компанията зад ChatGPT, е реагирала бързо и въпросните уязвимостите вече са отстранени. Този случай обаче подчертава нуждата от усъвършенствани функции за защита на AI платформите, включително подобрена контекстуална осведоменост и по-стабилни механизми за филтриране.

Организациите, от своя страна, трябва да останат бдителни и да следят най-новите разработки в областта на атаките, базирани на AI, за да се предпазят от тези нови заплахи.

Източник

Тагове

Иван Гайдаров 29/10/2024, 17:06

303 чете се за 1 минута

Покажи още

Новооткрита уязвимост в ChatGPT разкрива пропуските в защитата на AI системите

Кибератаките през имейл все по-често използват домейни-двойници

Хакери компрометират WordPress сайтове през легитимни плъгини

ЕК финансира проекти за киберсигурност и AI с 1,3 млрд. EUR

Голяма част от здравните организации използват умни устройства, които имат доказани уязвимости

OpenAI вдига пет пъти максималните възнаграждения в своята bug bounty програма

Онлайн услугите за споделяне на документи все по-често се използват за фишинг атаки

4 сериозни уязвимости в Kubernetes компрометират сигурността на организациите

Хакерите превръщат CAPTCHA в оръжие за кибератаки

6 млн. записа от Oracle Cloud изтекоха в Dark Web. Ето какво да направите, ако използвате облачната услуга

Malware кампания е компрометирала над 20 000 WordPress сайта по целия свят