исследование 3 июня 2026

OWASP Top 10 для LLM: разбор угроз и контрмер

OWASP Top 10 для LLM-приложений — это перечень самых критичных рисков, специфичных для систем на больших языковых моделях: от внедрения вредоносных инструкций в промпт до утечки чувствительных данных и злоупотребления полномочиями автономного агента. Это не «ещё один список уязвимостей», а карта угроз для нового класса систем, где граница между данными и командами размыта, а поведение модели вероятностно. **Если коротко:** классический периметр (WAF, сетевой экран, контроль доступа) не закрывает LLM-специфичные риски. Нужны отдельные контрмеры — валидация ввода и вывода, изоляция полномочий, контроль источников данных обучения и человек в контуре для опасных действий. Ниже разбираем ключевые категории OWASP Top 10 для LLM и контрмеры к ним, а сравнить поставщиков guardrails и AI Security можно в [рейтинге AI и LLM Security](/rating/ai-llm-security).

7 мин. чтения Блоки данных: 6 Позиции: не продаются

Короткий вывод

security context

Визуальный контекст исследования

Изображение помогает быстро считать тему материала: инфраструктура, данные, доступы и контрольные точки, которые важно проверить перед выбором решения.

Тематическое фото для исследования: OWASP Top 10 для LLM: разбор угроз и контрмер — Тематическая иллюстрация к исследованию: OWASP Top 10 для LLM: разбор угроз и контрмер. Brett Sayles / Pexels

shortlist

Рейтинги подрядчиков по теме исследования

Если после чтения нужен короткий список исполнителей, начните с профильных рейтингов cyber-index.ru: в них видны компании, кейсы, интервью, категории экспертизы и доверительный индекс.

NGFW, UTM и межсетевые экраны Next-generation firewalls, UTM, классические межсетевые экраны и шлюзы защиты периметра. WAF и API Security Web Application Firewall, защита API, анализ трафика приложений и блокировка атак на веб-сервисы. EPP, EDR, XDR и антивирусная защита Защита рабочих станций и серверов, EPP, EDR, XDR, антивирусная защита, расследование и реагирование на конечных точках. SIEM и log management Сбор, нормализация, хранение и корреляция событий безопасности, SIEM и управление журналами. Threat Intelligence Данные о киберугрозах, индикаторы компрометации, профили атакующих и аналитика угроз. PAM Privileged Access Management: контроль, изоляция, аудит и ротация привилегированных доступов. DLP Data Loss Prevention: предотвращение утечек данных, контроль каналов передачи и расследование инцидентов.

cluster

Соседние исследования по теме

Материалы того же направления помогают собрать единый shortlist: сравните подходы, критерии выбора и подтверждения по смежным задачам ИБ.

Рейтинг решений AI Security и LLM Security 2026Рейтинг решений AI Security и LLM Security 2026: критерии сравнения, ориентир по российски... Как выбрать платформу AI Security и guardrails для LLMКак выбрать платформу AI Security и guardrails для LLM: критерии выбора, сравнение вариант... AI TRiSM и LLM Security: как защитить модели от prompt injectionAI TRiSM и LLM Security — объясняем простыми словами: суть, как работает и на что смотреть...

methodology

Как проверять выводы исследования

Используйте материал как основу для shortlist: сопоставьте выводы с профилями компаний, связанными рейтингами, кейсами, интервью клиентов и источниками. Если в статье есть список источников, начинайте проверку с него; если источников мало, дополнительно запросите у подрядчика методику, baseline и примеры работ.

Почему для LLM нужен отдельный список угроз

Традиционные методики (OWASP Top 10 для веб-приложений, ASVS) описывают мир, где код, данные и команды разделены. В LLM-приложениях это разделение исчезает: модель получает на вход текст, в котором инструкции разработчика, контекст из базы знаний и данные от пользователя перемешаны в одном потоке. Атакующему достаточно «уговорить» модель словами — не нужны эксплойты памяти или SQL-инъекции в привычном виде.

Добавьте к этому вероятностную природу вывода (один и тот же промпт даёт разные ответы), непрозрачность модели и моду на автономных агентов с доступом к инструментам — и получится поверхность атаки, которую старые контроли не покрывают. Именно поэтому OWASP Foundation ведёт отдельный проект **Top 10 для LLM-приложений**: он систематизирует риски и даёт разработчикам общий язык для их обсуждения и приоритизации.

OWASP Top 10 для LLM: коротко о сути

Категорий риска 10

Полный перечень — на owasp.org

Ведущий риск Prompt Injection

Внедрение инструкций через ввод и данные

Что ломается граница «данные/команды»

Модель не отличает контекст от приказа

Главный принцип защиты эшелонированность

Валидация ввода + вывода + изоляция полномочий

Ключевые категории рисков и как они работают

Ниже — разбор основных категорий из перечня OWASP. Это не замена первоисточнику: точные формулировки и нумерацию сверяйте на [странице проекта OWASP](https://owasp.org/www-project-top-10-for-large-language-model-applications/), поскольку список периодически пересматривается. Цель — показать суть каждой угрозы и направление контрмеры.

Риск OWASP для LLM	Суть угрозы	Ключевая контрмера
Внедрение в промпт (Prompt Injection)	Атакующий через ввод или внешние данные подменяет инструкции модели, обходя ограничения	Разделение системных и пользовательских инструкций, фильтрация ввода, изоляция недоверенного контента
Небезопасная обработка вывода (Insecure Output Handling)	Ответ модели без проверки попадает в браузер, shell, SQL или другой компонент и выполняется	Экранирование и валидация вывода, обращение с ответом модели как с недоверенным вводом
Отравление данных обучения (Training Data Poisoning)	В обучающую/дообучающую выборку попадают вредоносные данные, искажающие поведение модели	Контроль происхождения данных, проверка источников, песочница и валидация датасетов
Отказ в обслуживании модели (Model DoS)	Ресурсоёмкие запросы исчерпывают вычисления и бюджет, делая сервис недоступным или дорогим	Лимиты на длину ввода и контекст, rate limiting, квоты и мониторинг потребления
Уязвимости цепочки поставок (Supply Chain)	Скомпрометированные сторонние модели, датасеты, плагины и библиотеки несут скрытые риски	Проверка и подпись артефактов, SBOM, оценка поставщиков моделей и компонентов
Утечка чувствительных данных (Sensitive Information Disclosure)	Модель раскрывает в ответах персональные данные, секреты или внутреннюю информацию из контекста	Очистка обучающих и контекстных данных, фильтрация вывода, минимизация передаваемого контекста
Небезопасный дизайн плагинов (Insecure Plugin Design)	Плагины принимают непроверенные параметры и дают модели избыточный доступ к действиям	Строгая типизация и валидация входов плагинов, минимальные права, подтверждение операций
Чрезмерные полномочия агента (Excessive Agency)	Автономный агент получает слишком широкие права/инструменты и совершает опасные действия	Принцип наименьших привилегий, ограничение набора инструментов, человек в контуре
Чрезмерное доверие к выводу (Overreliance)	Люди принимают галлюцинации и ошибки модели за истину без проверки	Маркировка ИИ-ответов, проверяемые источники, контроль критичных решений человеком
Кража модели (Model Theft)	Несанкционированный доступ или экстракция параметров приводит к утечке проприетарной модели	Контроль доступа к весам, мониторинг аномальных запросов, защита инфраструктуры хранения

Где сосредоточена сложность защиты по категориям

Усреднённая редакционная оценка трудоёмкости контрмер по классам рисков на основе открытых материалов OWASP. Это не измерение реальной частоты атак и не заменяет threat-моделирование вашего приложения.

Внедрение в промпт (Prompt Injection) 90 /100

90 /100

Чрезмерные полномочия агента (Excessive Agency) 85 /100

85 /100

Отравление данных обучения 80 /100

80 /100

Утечка чувствительных данных 75 /100

75 /100

Уязвимости цепочки поставок 70 /100

70 /100

Небезопасная обработка вывода 60 /100

60 /100

Чрезмерное доверие к выводу 55 /100

55 /100

Контрмеры: что работает на практике

Защита LLM-приложения строится эшелонированно — ни одна мера не закрывает риск целиком. Базовый набор, который стоит закладывать в архитектуру с самого начала:

- **Обращайтесь с выводом модели как с недоверенным вводом.** Любой ответ перед передачей в браузер, shell, базу данных или другой сервис экранируйте и валидируйте — это снимает целый класс рисков небезопасной обработки вывода. - **Изолируйте недоверенный контент в промпте.** Разделяйте системные инструкции и пользовательские/внешние данные, помечайте источник, не давайте модели исполнять команды из данных RAG напрямую. - **Минимизируйте полномочия агента.** Давайте ровно тот набор инструментов и прав, что нужен задаче; опасные операции — через подтверждение человеком (human-in-the-loop). - **Контролируйте данные и цепочку поставок.** Проверяйте происхождение датасетов и сторонних моделей/плагинов, ведите учёт компонентов, подписывайте артефакты. - **Фильтруйте чувствительные данные на входе и выходе.** Минимизируйте контекст, очищайте PII и секреты, не передавайте модели больше, чем нужно для ответа. - **Наблюдаемость и лимиты.** Логирование запросов и ответов, rate limiting, квоты на контекст и токены против отказа в обслуживании и аномального поведения.

Чек-лист защиты LLM-приложения по OWASP

Валидация ввода фильтруйте и нормализуйте пользовательский ввод, помечайте недоверенные данные в промпте.

Валидация вывода экранируйте ответ модели перед передачей в браузер, shell, SQL или другой компонент.

Изоляция полномочий давайте агенту минимальный набор инструментов и прав под конкретную задачу.

Человек в контуре подтверждение оператором для необратимых и опасных действий.

Контроль данных обучения проверяйте происхождение датасетов, изолируйте и валидируйте новые источники.

Защита от утечек очищайте PII и секреты в контексте и выводе, минимизируйте передаваемый контекст.

Цепочка поставок оценивайте сторонние модели, плагины и библиотеки, ведите учёт компонентов.

Лимиты и мониторинг rate limiting, квоты на токены, логирование и алерты на аномалии.

Сверка с актуальным OWASP регулярно сверяйте контроли с текущей версией списка на owasp.org.

Как внедрить контрмеры: 5 шагов

01 Моделирование угроз
Опишите потоки данных приложения, точки ввода, источники RAG и набор инструментов агента — соотнесите их с категориями OWASP для LLM.
02 Базовая гигиена
Закройте «дешёвые» риски: валидация вывода, лимиты, очистка чувствительных данных, разделение системных и пользовательских инструкций.
03 Изоляция полномочий
Сократите права агента и плагинов до минимума, опасные действия выведите через подтверждение человеком.
04 Контроль данных и поставки
Зафиксируйте проверку источников данных обучения и сторонних моделей/компонентов, подпись и учёт артефактов.
05 Наблюдаемость и проверка
Внедрите логирование, алерты и регулярное тестирование (включая prompt injection), периодически сверяйтесь с актуальным списком OWASP.

Как мы оцениваем поставщиков AI Security

cyber-index.ru не продаёт места в рейтинге. Поставщики решений AI Security и guardrails для LLM сравниваются по проверяемым сигналам: подтверждённые внедрения и кейсы, отзывы клиентов, внешняя репутация, специализация, прозрачность и свежесть данных. Поэтому статью стоит читать в связке с [рейтингом AI и LLM Security](/rating/ai-llm-security): здесь — карта угроз и контрмер, там — сравнение конкретных компаний по подтверждённым фактам.

Следующий шаг

Разобрались с картой угроз — переходите к выбору решений: **[рейтинг AI и LLM Security →](/rating/ai-llm-security)**. Полезно прочитать рядом: [AI TRiSM и LLM Security: защита от prompt injection](/research/ai-trism-llm-security-osnovy), [как выбрать платформу AI Security и guardrails](/research/kak-vybrat-ai-security-platformu) и [рейтинг решений AI Security 2026](/research/reyting-ai-llm-security-2026).

Частые вопросы

Что такое OWASP Top 10 для LLM?

Это перечень десяти самых критичных рисков безопасности, специфичных для приложений на больших языковых моделях, который ведёт OWASP Foundation. Он систематизирует угрозы — от внедрения в промпт до утечки данных и чрезмерных полномочий агента — и даёт разработчикам общий язык для их оценки. Актуальную версию смотрите на owasp.org.

Чем prompt injection отличается от обычной инъекции?

В классических инъекциях (SQL, командных) атакующий ломает синтаксис кода. В prompt injection нет «кода» в привычном смысле: модель не отличает инструкции разработчика от данных, и злоумышленник управляет ею обычным текстом — через ввод или подменённый внешний контент, например в источниках RAG.

Защищает ли WAF или сетевой экран от рисков OWASP для LLM?

Частично и косвенно. Периметровые средства не понимают семантику промпта и вывода модели, поэтому не закрывают prompt injection, утечку данных или злоупотребление полномочиями агента. Нужны отдельные LLM-специфичные контрмеры: валидация ввода/вывода, изоляция полномочий, контроль данных.

Что такое чрезмерные полномочия агента (Excessive Agency)?

Это риск, когда автономному ИИ-агенту дают слишком широкий доступ к инструментам и действиям. При ошибке или манипуляции он способен совершить необратимые операции — удалить данные, отправить деньги, изменить настройки. Контрмера — принцип наименьших привилегий и подтверждение опасных действий человеком.

С чего начать защиту LLM-приложения?

С моделирования угроз: опишите потоки данных и сопоставьте их с категориями OWASP. Затем закройте базовую гигиену (валидация вывода, лимиты, очистка чувствительных данных) и сократите полномочия агента. Сравнить готовые платформы guardrails можно в рейтинге AI и LLM Security.

verification

Источники и метод проверки

source Единый реестр российского ПО Минцифры России source Государственный реестр сертифицированных средств защиты информации ФСТЭК России source OWASP Top 10 для LLM-приложений OWASP Foundation

Рейтинг AI и LLM Security Сравнить поставщиков по подтверждённым сигналам AI TRiSM и LLM Security: как защитить модели от prompt injection Как выбрать платформу AI Security и guardrails для LLM Рейтинг решений AI Security и LLM Security 2026