Разработчики: | Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) |
Дата премьеры системы: | 2024/06/20 |
Технологии: | ИБ - Биометрическая идентификация, Речевые технологии |
2024: Создание модели ASR
Почти 80% качества автоматического распознавания казахского языка добилась компания BSS, всего за 3 месяца собрав собственную модель ASR (Automatic Speech Recognition). Об этом разработчик сообщил 20 июня 2024 года.
Технология ASR необходима для распознавания устной речи клиентов, которые обращаются к виртуальному ассистенту с запросами. Чтобы оперативно обучить модель в условиях отсутствия исходных данных, разработчики использовали реальные диалоги на казахском языке, содержащие релевантную для заказчика лексику. Аналитики BSS тщательно транскрибировали 10 часов аудиоматериалов, перенеся корректно их в текстовый режим.
Параллельно из открытых источников были собраны готовые речевые корпуса длительностью 1500 часов. На основе этих данных была обучена первая базовая версия модели, качество распознавания устной речи которой составило 70%. Затем базовая модель ASR была дообучена транскрибированными аналитиками 10-часовыми аудиоматериалами. После второй итерации модель показала качество в 80% на целевых запросах клиентов. На июнь 2024 года разработчики BSS запускают новый цикл обучения ASR, чтобы улучшить показатель распознавание устной речи.
Команда BSS осуществила переход модели ASR с архитектуры Conformer на ZIP-Former.
«Это позволило ускорить ASR в 3 раза и повысить качество распознавания речи на 5%. Также благодаря переходу на более производительную архитектуру реакция бота сокращается на 200-500 мс, что повышает естественность диалога с клиентами, — сказал Александр Крушинский. |
Подрядчики-лидеры по количеству проектов
Биолинк Солюшенс (BioLink Solutions) (134)
Прософт Биометрикс (ProSoft Biometrics) (74)
Индид, Indeed (ранее Indeed ID) (45)
VisionLabs (ВижнЛабс) (34)
Группа компаний ЦРТ (Центр речевых технологий) (31)
Другие (454)
Прософт Биометрикс (ProSoft Biometrics) (11)
VisionLabs (ВижнЛабс) (7)
Группа компаний ЦРТ (Центр речевых технологий) (5)
РекФэйсис (4)
Талмер (Talmer) (4)
Другие (52)
Индид, Indeed (ранее Indeed ID) (6)
ВидеоМатрикс (Videomatrix) (2)
Goodt (Гудт) (2)
NDBC - ЭнДиБиСи (ранее НТТ ДАТА Бизнес Солюшнс, itelligence Россия, Ителлидженс) (2)
VisionLabs (ВижнЛабс) (2)
Другие (21)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Биолинк Солюшенс (BioLink Solutions) (9, 140)
Прософт Биометрикс (ProSoft Biometrics) (18, 84)
VisionLabs (ВижнЛабс) (26, 50)
Индид, Indeed (ранее Indeed ID) (1, 45)
Группа компаний ЦРТ (Центр речевых технологий) (14, 39)
Другие (361, 308)
Прософт Биометрикс (ProSoft Biometrics) (7, 11)
VisionLabs (ВижнЛабс) (2, 8)
Группа компаний ЦРТ (Центр речевых технологий) (2, 6)
РекФэйсис (2, 4)
Ростелеком (4, 3)
Другие (23, 31)
Индид, Indeed (ранее Indeed ID) (1, 6)
Goodt (Гудт) (1, 3)
ABC Solutions (Эй Би Си Солюшенс) (1, 3)
VisionLabs (ВижнЛабс) (2, 2)
ВидеоМатрикс (Videomatrix) (1, 2)
Другие (9, 9)
Сбербанк (3, 8)
Индид, Indeed (ранее Indeed ID) (1, 7)
VisionLabs (ВижнЛабс) (3, 6)
Shenzhen Chainway Information Technology (1, 6)
АйТи Бастион (1, 3)
Другие (6, 6)
Сбербанк (1, 5)
Shenzhen Chainway Information Technology (1, 2)
Goodt (Гудт) (1, 1)
Voca-Tech (Вока-Тек) (1, 1)
Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
Другие (3, 3)
Распределение систем по количеству проектов, не включая партнерские решения
BioLink BioTime - 123
Indeed Access Manager (Indeed AM) - 45
BioLink FingerPass - 45
Biosmart Studio - 36
СКУД BioSmart - 27
Другие 431
VisionLabs Luna - 5
VisionLabs Thermo (ранее VisionLabs Termo) - 5
Voice2Med Система распознавания речи в медицине - 4
Biosmart Studio - 4
BioSmart PV‑WTC Терминал - 4
Другие 42
Indeed Access Manager (Indeed AM) - 6
Goodt (Ранее ZoZo RCAM, Revenue&Costs Assurance Management) - 3
Vmx SILA: HSE - 2
Наносемантика NLab Speech - 1
Стоп Шоплифтер (Stop Shoplifter) - 1
Другие 9
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (44)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
SteadyControl (18)
Naumen (Наумен консалтинг) (15)
Другие (191)
Группа компаний ЦРТ (Центр речевых технологий) (5)
SteadyControl (4)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
Voice Systems Robotics (VSR, VS Robotics) (2)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
Другие (17)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Voice Systems Robotics (VSR, VS Robotics) (3)
Naumen (Наумен консалтинг) (3)
Мегапьютер Интелидженс (Megaputer Intelligence) (2)
Другие (14)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
SteadyControl HoReCa (1, 23)
SteadyControl (1, 23)
Другие (353, 210)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SteadyControl HoReCa (1, 4)
SteadyControl (1, 4)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Другие (9, 13)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl HoReCa (1, 3)
Voice Systems Robotics (VSR, VS Robotics) (1, 3)
Naumen (Наумен консалтинг) (1, 3)
Другие (12, 16)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl HoReCa (1, 7)
SteadyControl (1, 7)
Другие (17, 29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl HoReCa (1, 5)
SteadyControl (1, 5)
СалютДевайсы (ранее SberDevices) (2, 4)
Сбербанк (2, 4)
Другие (20, 33)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
SteadyControl Система контроля и управления персоналом - 23
BSS Digital2Speech - 21
Voice2Med Система распознавания речи в медицине - 14
Naumen Erudite - 13
Другие 199
BSS Digital2Speech - 5
SteadyControl Система контроля и управления персоналом - 4
Voice2Med Система распознавания речи в медицине - 4
3i TouchPoint Analytics - 2
МТТ VoiceBox - 2
Другие 11
МТТ VoiceBox - 11
BSS Digital2Speech - 6
VS Robotics: VS Робот-оператор - 3
SteadyControl Система контроля и управления персоналом - 3
Naumen Erudite - 3
Другие 14