МФТИ и ИППИ РАН: hybrid Random Forest Traffic Classifier (hRFTC)

Продукт
Разработчики: Московский физико-технический институт (МФТИ), ИППИ РАН (Институт проблем передачи информации РАН им. А. А. Харкевича)
Дата премьеры системы: 2025/01/21
Технологии: Data Quality - Качество данных

Основная статья: Управление качеством данных

2025: Представление алгоритма hRFTC

Предложенный объединённой научной группой из МФТИ и ИППИ РАН алгоритм под названием hybrid Random Forest Traffic Classifier (hRFTC) позволяет эффективно определять тип передаваемых данных, даже если они зашифрованы с использованием последних технологий. Для анализа его эффективности была собрана база данных шифрованного трафика шести стран Северной Америки, Европы и Азии. Доказанное качество классификации  — 94,6%. Об этом МФТИ сообщил 21 января 2025 года.

С увеличением объёма шифрованного интернет-трафика задача определения типа передаваемых данных становится всё более сложной. Протокол Transport Layer Security (TLS) обеспечивает защиту данных, однако новая версия протокола — Encrypted ClientHello (ECH) — скрывает ключевые метаданные, такие как Server Name Indication (SNI), что затрудняет процесс ранней классификации трафика (eTC). Это может негативно сказаться на качестве обслуживания в сетях, так как правильная классификация трафика необходима для эффективного управления ресурсами.

Этот алгоритм использует не только открытые параметры TLS ECH, но и статистические признаки трафика, такие как размеры пакетов и интервалы между их приходами. Такой подход позволил существенно увеличить точность распознавания данных с 38,4% до 96,4% по метрике F-score.  «Трансформация 2.0». Опыт роста технологической зрелости ритейлера «Лента» представлен на TAdviser SummIT 23.8 т

Как отмечает один из авторов проекта, студент базовой кафедры МФТИ в ИППИ РАН Антон Курапов, разработанный алгоритм может быть использован на промежуточных сетевых узлах для повышения качества обслуживания.

«
Наш алгоритм hRFTC превзошёл лучшие существующие классификаторы и может быть использован на промежуточных сетевых узлах для повышения качества обслуживания. С другой стороны, мы выявили оставшиеся утечки приватности шифрованного трафика, которые необходимо устранить в будущих версиях протоколов защиты транспортного уровня, —  продолжил Антон Курапов.
»

На январь 2025 года командой лаборатории беспроводных сетей ведётся исследование по устранению этих утечек приватности с помощью рандомизации открытых параметров, а также изменения длин первых пакетов потока и отправки дополнительных фиктивных пакетов. 



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год

  Datareon (Датареон) (272)
  Axelot (Акселот) (148)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
  АйТи Про (IT Pro) (18)
  Другие (525)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Софрос (Sofros) (2)
  Теком (2)
  Яндекс (Yandex) (2)
  Другие (40)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (8)
  Яндекс.Облако (Yandex Cloud) (3)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (50)

  Datareon (Датареон) (19)
  Axelot (Акселот) (8)
  Софрос (Sofros) (3)
  Теком (3)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3)
  Другие (68)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год

  Datareon (Датареон) (1, 419)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (3, 236)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
  АйТи Про (IT Pro) (1, 18)
  TData (ТДата) (5, 8)
  Другие (56, 54)

  Datareon (Датареон) (1, 71)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Теком (1, 2)
  Informatica (1, 1)
  Другие (3, 3)

  Datareon (Датареон) (1, 57)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
  АйТи Про (IT Pro) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Дата-Центр Автоматика (1, 1)
  Другие (1, 1)

  Datareon (Датареон) (1, 31)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
  Теком (1, 3)
  TData (ТДата) (1, 2)
  Ростелеком (1, 2)
  Другие (1, 1)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2022 год
2023 год
2024 год

  Datareon Platform - 419
  Deductor - 226
  HFLabs Фактор - 28
  HFLabs Единый клиент - 23
  АйТи Про: BI.Qube - 18
  Другие 80

  Datareon Platform - 71
  HFLabs Единый клиент - 2
  Loginom Аналитическая платформа - 2
  Теком: Orbox - 2
  RT.MDM Решение для построения системы управления НСИ - 1
  Другие 3

  Datareon Platform - 57
  Теком: Orbox - 1
  Дата-Центр Автоматика: Data-Track Цифровая платформа - 1
  HFLabs Единый клиент - 1
  АйТи Про: BI.Qube - 1
  Другие 2

  Datareon Platform - 31
  Теком: Orbox - 3
  HFLabs Единый клиент - 2
  RT.DataGovernance Инструмент документирования данных - 2
  МТС DataOps Platform - 1
  Другие 1