Разработчики: | Московский физико-технический институт (МФТИ), ИППИ РАН (Институт проблем передачи информации РАН им. А. А. Харкевича) |
Дата премьеры системы: | 2025/01/21 |
Технологии: | Data Quality - Качество данных |
Основная статья: Управление качеством данных
2025: Представление алгоритма hRFTC
Предложенный объединённой научной группой из МФТИ и ИППИ РАН алгоритм под названием hybrid Random Forest Traffic Classifier (hRFTC) позволяет эффективно определять тип передаваемых данных, даже если они зашифрованы с использованием последних технологий. Для анализа его эффективности была собрана база данных шифрованного трафика шести стран Северной Америки, Европы и Азии. Доказанное качество классификации — 94,6%. Об этом МФТИ сообщил 21 января 2025 года.
С увеличением объёма шифрованного интернет-трафика задача определения типа передаваемых данных становится всё более сложной. Протокол Transport Layer Security (TLS) обеспечивает защиту данных, однако новая версия протокола — Encrypted ClientHello (ECH) — скрывает ключевые метаданные, такие как Server Name Indication (SNI), что затрудняет процесс ранней классификации трафика (eTC). Это может негативно сказаться на качестве обслуживания в сетях, так как правильная классификация трафика необходима для эффективного управления ресурсами.
Этот алгоритм использует не только открытые параметры TLS ECH, но и статистические признаки трафика, такие как размеры пакетов и интервалы между их приходами. Такой подход позволил существенно увеличить точность распознавания данных с 38,4% до 96,4% по метрике F-score. «Трансформация 2.0». Опыт роста технологической зрелости ритейлера «Лента» представлен на TAdviser SummIT
Как отмечает один из авторов проекта, студент базовой кафедры МФТИ в ИППИ РАН Антон Курапов, разработанный алгоритм может быть использован на промежуточных сетевых узлах для повышения качества обслуживания.
Наш алгоритм hRFTC превзошёл лучшие существующие классификаторы и может быть использован на промежуточных сетевых узлах для повышения качества обслуживания. С другой стороны, мы выявили оставшиеся утечки приватности шифрованного трафика, которые необходимо устранить в будущих версиях протоколов защиты транспортного уровня, — продолжил Антон Курапов. |
На январь 2025 года командой лаборатории беспроводных сетей ведётся исследование по устранению этих утечек приватности с помощью рандомизации открытых параметров, а также изменения длин первых пакетов потока и отправки дополнительных фиктивных пакетов.
Подрядчики-лидеры по количеству проектов
Datareon (Датареон) (272)
Axelot (Акселот) (148)
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
АйТи Про (IT Pro) (18)
Другие (525)
Datareon (Датареон) (41)
Axelot (Акселот) (32)
Софрос (Sofros) (2)
Теком (2)
Яндекс (Yandex) (2)
Другие (40)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Datareon (Датареон) (1, 419)
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (3, 236)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
АйТи Про (IT Pro) (1, 18)
TData (ТДата) (5, 8)
Другие (56, 54)
Datareon (Датареон) (1, 71)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 2)
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
Теком (1, 2)
Informatica (1, 1)
Другие (3, 3)
Datareon (Датареон) (1, 57)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
АйТи Про (IT Pro) (1, 1)
Мобильные ТелеСистемы (МТС) (1, 1)
Дата-Центр Автоматика (1, 1)
Другие (1, 1)
Datareon (Датареон) (1, 31)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
Теком (1, 3)
TData (ТДата) (1, 2)
Ростелеком (1, 2)
Другие (1, 1)
Распределение систем по количеству проектов, не включая партнерские решения
Datareon Platform - 419
Deductor - 226
HFLabs Фактор - 28
HFLabs Единый клиент - 23
АйТи Про: BI.Qube - 18
Другие 80
Datareon Platform - 71
HFLabs Единый клиент - 2
Loginom Аналитическая платформа - 2
Теком: Orbox - 2
RT.MDM Решение для построения системы управления НСИ - 1
Другие 3