Разработчики: | ИТМО (научно-образовательная корпорация), Napoleon IT (Наполеон Айти) |
Дата премьеры системы: | 2025/02/04 |
Технологии: | TMS - Test Management System, Речевые технологии |
Основные статьи:
- Распознавание речи (технологии, рынок)
- Речевые технологии: на пути от распознавания к пониманию
- Чат-боты (Chat-bot) Виртуальные собеседники
2025: Представление фреймворка для тестирования чат-ботов на уязвимости
Студенты ИТМО разработали фреймворк для тестирования чат-ботов на уязвимости с точностью 89%.
Фреймворк LLAMATOR, разработанный в рамках лаборатории AI Security Lab,
предупреждает выдачу противоречивой информации, чувствительных данных иМихаил Белошапка, «Далее»: Тенденция укрупнения IT-рынка продолжится
В отличие от других решений на рынке, LLAMATOR не просто проверяет систему на устойчивость к внешним атакам единичными запросами, а ведет с ней полноценные автоматизированные диалоги, подбирая и улучшая атакующую стратегию на основе ответов системы. Фреймворк умеет тестировать модели как на английском, так и на русском языке и поддерживает широкий спектр тестов — от простых промпт-инъекций до глубокой проверки на галлюцинации и некорректные генерации.
Одна из главных сложностей заключалась в создании модели, способной
реалистично имитировать человеческое взаимодействие. Мы провели множество экспериментов с подбором атакующей модели и ее системного промпта — нам удалось добиться 89%-ой точности выявления уязвимостей с помощью подхода LLM-as-a-Judge, — отметил Тимур Низамов, один из разработчиков решения LLAMATOR. |
Фреймворк поставляется по freemium-модели: его исходный код открыт, но команда разработчиков может провести комплексный аудит безопасности чат-ботов и AI-систем по запросу компании. LLAMATOR интегрируется с различными платформами, включая Web, REST API, Telegram, WhatsApp и другие.
В ближайшее время планируется масштабировать решение для тестирования мультиагентных AI-систем и систематической коммерческой эксплуатации. Уже на февраль 2025 года ведутся переговоры о технологическом и методологическом сотрудничестве с потенциальными клиентами и крупными AI-вендорами.
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (45)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
SteadyControl (18)
Naumen (Наумен консалтинг) (15)
Другие (201)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Naumen (Наумен консалтинг) (3)
Voice Systems Robotics (VSR, VS Robotics) (3)
SteadyControl (2)
Другие (14)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
Группа компаний ЦРТ (Центр речевых технологий) (8)
SteadyControl (6)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
Naumen (Наумен консалтинг) (4)
Другие (29)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (18, 47)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
SteadyControl (1, 23)
SteadyControl HoReCa (1, 23)
Другие (392, 220)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl (1, 3)
SteadyControl HoReCa (1, 3)
Voice Systems Robotics (VSR, VS Robotics) (1, 3)
Другие (12, 16)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl (1, 7)
SteadyControl HoReCa (1, 7)
Другие (18, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Сбербанк (3, 5)
SteadyControl HoReCa (1, 5)
SteadyControl (1, 5)
Ростелеком (2, 4)
Другие (25, 42)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
SteadyControl Система контроля и управления персоналом - 23
BSS Digital2Speech - 21
Voice2Med Система распознавания речи в медицине - 14
Naumen Erudite - 13
Другие 208
МТТ VoiceBox - 11
BSS Digital2Speech - 6
SteadyControl Система контроля и управления персоналом - 3
Naumen Erudite - 3
VS Robotics: VS Робот-оператор - 3
Другие 14
МТТ VoiceBox - 9
SteadyControl Система контроля и управления персоналом - 7
BSS Digital2Speech - 6
EXpress Защищенный корпоративный мессенджер - 6
SmartLogger II - 4
Другие 23
SteadyControl Система контроля и управления персоналом - 5
BSS Digital2Speech - 4
EXpress Защищенный корпоративный мессенджер - 4
Napoleon IT отзывы - 3
Сбер: GigaChat - 3
Другие 33
Подрядчики-лидеры по количеству проектов
Тест АйТи (Test IT) (6)
1С-ИжТиСи (1)
Performance Lab (Перфоманс Лаб) (1)
Positive Technologies (Позитив Текнолоджиз) (1)
Системный софт (Сиссофт, SysSoft) (1)
Другие (2)
Данные не найдены
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Тест АйТи (Test IT) (2, 6)
Positive Technologies (Позитив Текнолоджиз) (4, 1)
Мобильные ТелеСистемы (МТС) (2, 1)
Performance Lab (Перфоманс Лаб) (2, 1)
Gurock Software (1, 1)
Другие (43, 2)
Positive Technologies (Позитив Текнолоджиз) (1, 1)
1С-ИжТиСи (1, 1)
Мобильные ТелеСистемы (МТС) (1, 1)
Другие (0, 0)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
Test IT TMS (Test Management System) - 6
1С:Автоматическое тестирование конфигураций - 1
PT BlackBox - 1
Performance Lab Boomq Enterprise - 1
Gurock Software TestRail - 1
Другие 2
1С:Автоматическое тестирование конфигураций - 1
МТС: Ocean Облачная платформа - 1
PT BlackBox - 1
Другие 0