Смертельная Тройка Безопасности ИИ

1

Prompt injection позволяет вставить вредоносные команды в запрос к языковой модели через конкатенацию строк.

2

Смертельная тройка включает три элемента: доступ к приватным данным, возможность внешней коммуникации и использование недоверенного контента.

3

Популярные векторы атак: SQL-подобные инъекции с командами и Markdown-эксфильтрация для кражи данных.

4

Обычные методы защиты (дополнительные подсказки или ИИ-сканирование) не дают абсолютной гарантии безопасности.

5

Удаление любого одного из элементов смертельной тройки (например, запрет эксфильтрации) эффективно предотвращает атаки.

6

Передовые подходы (например, CaMeL и паттерны ограничения действий) минимизируют риски после получения недоверенного ввода.

7

Протокол MCP усложняет безопасность, так как смешивание серверов с тремя элементами смертельной тройки возлагает ответственность на пользователей.