Разработчики: | T-Bank AI Research (Центр искусственного интеллекта Т‑Банка) |
Дата премьеры системы: | апрель 2025 г |
Отрасли: | Информационные технологии |
История
2025: Создание продукта
Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод под названием SAE Match, который позволяет понять механизмы принятия решений искусственного интеллекта (ИИ) и увидеть причины формирования тех или иных заключений в процессе вычисления. Об этом 10 апреля 2025 года сообщили представители исследовательской группы из Москвы.
Как сообщили в T-Bank AI Research, с помощью нового метода можно отслеживать, как ИИ генерирует ответы, и своевременно корректировать их. Это первый шаг к созданию более прозрачных, точных и понятных алгоритмов, что является критически важным при внедрении искусственного интеллекта в такие сферы, как медицина, финансы и безопасность.
Метод SAE Match относится к области интерпретируемости искусственного интеллекта, основная цель которой — сделать работу ИИ более прозрачной и понятной для человека. Это позволит отслеживать, как модель обрабатывает информацию, почему она принимает определенные решения, и в дальнейшем повышать точность ответов.Гид TAdviser по российским производителям гражданских БПЛА: 20 наиболее заметных игроков рынка
Современные языковые модели (LLM) состоят из нескольких слоев, каждый из которых использует результат предыдущего. Таким образом модель стремится улучшить свои предсказания от слоя к слою. Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. До настоящего времени не существовало метода, позволяющего проследить, как концепции трансформируются от слоя к слою.
SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений. Эксперименты на различных моделях продемонстрировали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, что делает поведение ИИ более предсказуемым и понятным.