Разработчики: | Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) |
Дата премьеры системы: | 2024/06/20 |
Технологии: | ИБ - Биометрическая идентификация, Речевые технологии |
2024: Создание модели ASR
Почти 80% качества автоматического распознавания казахского языка добилась компания BSS, всего за 3 месяца собрав собственную модель ASR (Automatic Speech Recognition). Об этом разработчик сообщил 20 июня 2024 года.
Технология ASR необходима для распознавания устной речи клиентов, которые обращаются к виртуальному ассистенту с запросами. Чтобы оперативно обучить модель в условиях отсутствия исходных данных, разработчики использовали реальные диалоги на казахском языке, содержащие релевантную для заказчика лексику. Аналитики BSS тщательно транскрибировали 10 часов аудиоматериалов, перенеся корректно их в текстовый режим.
Параллельно из открытых источников были собраны готовые речевые корпуса длительностью 1500 часов. На основе этих данных была обучена первая базовая версия модели, качество распознавания устной речи которой составило 70%. Затем базовая модель ASR была дообучена транскрибированными аналитиками 10-часовыми аудиоматериалами. После второй итерации модель показала качество в 80% на целевых запросах клиентов. На июнь 2024 года разработчики BSS запускают новый цикл обучения ASR, чтобы улучшить показатель распознавание устной речи.
Команда BSS осуществила переход модели ASR с архитектуры Conformer на ZIP-Former.
«Это позволило ускорить ASR в 3 раза и повысить качество распознавания речи на 5%. Также благодаря переходу на более производительную архитектуру реакция бота сокращается на 200-500 мс, что повышает естественность диалога с клиентами, — сказал Александр Крушинский. |
Подрядчики-лидеры по количеству проектов
Биолинк Солюшенс (BioLink Solutions) (134)
Прософт Биометрикс (ProSoft Biometrics) (74)
Индид, Indeed (ранее Indeed ID) (45)
VisionLabs (ВижнЛабс) (34)
Группа компаний ЦРТ (Центр речевых технологий) (31)
Другие (452)
Прософт Биометрикс (ProSoft Biometrics) (11)
VisionLabs (ВижнЛабс) (7)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Талмер (Talmer) (4)
РекФэйсис (4)
Другие (52)
Индид, Indeed (ранее Indeed ID) (6)
VisionLabs (ВижнЛабс) (2)
ВидеоМатрикс (Videomatrix) (2)
Goodt (Гудт) (2)
NDBC - ЭнДиБиСи (ранее НТТ ДАТА Бизнес Солюшнс, itelligence Россия, Ителлидженс) (2)
Другие (21)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Биолинк Солюшенс (BioLink Solutions) (9, 140)
Прософт Биометрикс (ProSoft Biometrics) (18, 84)
VisionLabs (ВижнЛабс) (26, 50)
Индид, Indeed (ранее Indeed ID) (1, 45)
Группа компаний ЦРТ (Центр речевых технологий) (14, 39)
Другие (360, 307)
Прософт Биометрикс (ProSoft Biometrics) (7, 11)
VisionLabs (ВижнЛабс) (2, 8)
Группа компаний ЦРТ (Центр речевых технологий) (2, 6)
РекФэйсис (2, 4)
Ростелеком (4, 3)
Другие (23, 31)
Индид, Indeed (ранее Indeed ID) (1, 6)
Goodt (Гудт) (1, 3)
ABC Solutions (Эй Би Си Солюшенс) (1, 3)
VisionLabs (ВижнЛабс) (2, 2)
ВидеоМатрикс (Videomatrix) (1, 2)
Другие (9, 9)
Сбербанк (3, 8)
Индид, Indeed (ранее Indeed ID) (1, 7)
VisionLabs (ВижнЛабс) (3, 6)
Shenzhen Chainway Information Technology (1, 6)
АйТи Бастион (1, 3)
Другие (6, 6)
Сбербанк (1, 5)
Shenzhen Chainway Information Technology (1, 2)
Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
Goodt (Гудт) (1, 1)
Voca-Tech (Вока-Тек) (1, 1)
Другие (2, 2)
Распределение систем по количеству проектов, не включая партнерские решения
BioLink BioTime - 123
BioLink FingerPass - 45
Indeed Access Manager (Indeed AM) - 45
Biosmart Studio - 36
СКУД BioSmart - 27
Другие 430
VisionLabs Luna - 5
VisionLabs Thermo (ранее VisionLabs Termo) - 5
Biosmart Studio - 4
BioSmart PV‑WTC Терминал - 4
Voice2Med Система распознавания речи в медицине - 4
Другие 42
Indeed Access Manager (Indeed AM) - 6
Goodt (Ранее ZoZo RCAM, Revenue&Costs Assurance Management) - 3
Vmx SILA: HSE - 2
РекФэйсис: VxFaces - 1
Smart Meal Service: Lunch fastPass Робот-кассир - 1
Другие 9
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (44)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
SteadyControl (18)
Naumen (Наумен консалтинг) (15)
Другие (191)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
SteadyControl (4)
Voice Systems Robotics (VSR, VS Robotics) (2)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
Другие (17)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Naumen (Наумен консалтинг) (3)
Voice Systems Robotics (VSR, VS Robotics) (3)
Мегапьютер Интелидженс (Megaputer Intelligence) (2)
Другие (14)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
SteadyControl (1, 23)
SteadyControl HoReCa (1, 23)
Другие (350, 210)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SteadyControl (1, 4)
SteadyControl HoReCa (1, 4)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Другие (9, 13)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Naumen (Наумен консалтинг) (1, 3)
SteadyControl (1, 3)
SteadyControl HoReCa (1, 3)
Другие (12, 16)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl (1, 7)
SteadyControl HoReCa (1, 7)
Другие (17, 29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl (1, 5)
SteadyControl HoReCa (1, 5)
СалютДевайсы (ранее SberDevices) (2, 4)
Сбербанк (2, 4)
Другие (20, 33)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
SteadyControl Система контроля и управления персоналом - 23
BSS Digital2Speech - 21
Voice2Med Система распознавания речи в медицине - 14
Naumen Erudite - 13
Другие 199
BSS Digital2Speech - 5
SteadyControl Система контроля и управления персоналом - 4
Voice2Med Система распознавания речи в медицине - 4
МТТ VoiceBox - 2
Neuro.net Голосовой робот - 2
Другие 11
МТТ VoiceBox - 11
BSS Digital2Speech - 6
SteadyControl Система контроля и управления персоналом - 3
Naumen Erudite - 3
VS Robotics: VS Робот-оператор - 3
Другие 14