Логотип
Баннер в шапке 1
Баннер в шапке 2

SAE Match

Продукт
Разработчики: T-Bank AI Research (Центр искусственного интеллекта Т‑Банка)
Дата премьеры системы: апрель 2025 г
Отрасли: Информационные технологии

История

2025: Создание продукта

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод под названием SAE Match, который позволяет понять механизмы принятия решений искусственного интеллекта (ИИ) и увидеть причины формирования тех или иных заключений в процессе вычисления. Об этом 10 апреля 2025 года сообщили представители исследовательской группы из Москвы.

Как сообщили в T-Bank AI Research, с помощью нового метода можно отслеживать, как ИИ генерирует ответы, и своевременно корректировать их. Это первый шаг к созданию более прозрачных, точных и понятных алгоритмов, что является критически важным при внедрении искусственного интеллекта в такие сферы, как медицина, финансы и безопасность.

В России разработали новый метод для понимания решений, принимаемых искусственным интеллектом

Метод SAE Match относится к области интерпретируемости искусственного интеллекта, основная цель которой — сделать работу ИИ более прозрачной и понятной для человека. Это позволит отслеживать, как модель обрабатывает информацию, почему она принимает определенные решения, и в дальнейшем повышать точность ответов.Гид TAdviser по российским производителям гражданских БПЛА: 20 наиболее заметных игроков рынка 9.4 т

Современные языковые модели (LLM) состоят из нескольких слоев, каждый из которых использует результат предыдущего. Таким образом модель стремится улучшить свои предсказания от слоя к слою. Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. До настоящего времени не существовало метода, позволяющего проследить, как концепции трансформируются от слоя к слою.

SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений. Эксперименты на различных моделях продемонстрировали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, что делает поведение ИИ более предсказуемым и понятным.



СМ. ТАКЖЕ (1)