Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
Разработчики: | OpenAI |
Дата премьеры системы: | март 2023 г. |
Отрасли: | Информационные технологии |
Технологии: | Роботы Сервисные, Средства разработки приложений |
Содержание |
2024: Используемая в больницах модель OpenAI оказалась подвержена галлюцинациям
Используемая в больницах модель OpenAI оказалась подвержена галлюцинациям.
Генеративные модели искусственного интеллекта склонны к генерации некорректной информации. Удивительно, но эта проблема затронула и область автоматической транскрипции, где модель должна точно воспроизводить аудиозапись. Инженеры-программисты, разработчики и ученые серьезно обеспокоены расшифровками Whisper от OpenAI, сообщили 28 октября 2024 года в "Хайтек+" со ссылкой на Associated Press.
Исследователь из Мичиганского университета обнаружил галлюцинации в восьми из десяти аудиозаписей. Инженер по машинному обучению, изучивший более 100 часов транскрипций Whisper, нашел ошибки более чем в половине из них. А разработчик сообщил, что обнаружил вымышленные сведения почти во всех 26 000 транскрипциях, созданных им с помощью Whisper.
Ученые из Корнельского университета, Университета Вашингтона и других учреждений обнаружили, что Whisper «галлюцинирует» примерно в 1% случаев, придумывая целые предложения во время пауз в записях. Исследователи отмечают, что паузы особенно часто встречаются при речи людей с афазией. Иногда выдуманные ИИ фразы содержат агрессию и расизм, а иногда — бессмыслицу.
Галлюцинации включали вымышленные медицинские термины или фразы, которые можно было бы ожидать от видео на YouTube, например, «Спасибо за просмотр!». Сообщается, что OpenAI использовала для расшифровки более 1 млн часов видео на YouTube для обучения GPT-4.
Все это создает серьезные риски, поскольку Whisper применяется в медицинских учреждениях. Так, Whisper используется компанией Nabla в качестве инструмента медицинской транскрипции. По ее оценкам, модель расшифровала 7 млн разговоров с врачами. Более 30 000 докторов и 40 систем здравоохранения используют ИИ-инструмент. Сообщается, что Nabla знает о галлюцинациях Whisper и «решает эту проблему».Павел Бобу, Cloud Networks: В 2024 году больше всего запросов было на ИБ-консалтинг
Представитель OpenAI заявил, что компания постоянно совершенствует свои модели, уделяя особое внимание снижению частоты появления некорректных результатов. Вместе с тем, компания подчеркивает, что использование модели Whisper в областях, где ошибки могут привести к серьезным последствиям, не рекомендуется.
![]() | Мы благодарим исследователей за то, что они поделились своими открытиями, — заявили в OpenAI[1]. | ![]() |
2023: Анонс системы преобразования речи в текст
1 марта 2023 года компания OpenAI представила интерфейс прикладного программирования (API) для системы Whisper, которая дебютировала в сентябре 2022-го.
Whisper представляет собой интеллектуальный инструмент преобразования речи в текст, обученный на 680 000 часов многоязычных и «многозадачных» данных, собранных из интернета. Система способна корректно воспринимать произношение с акцентом, идентифицировать фоновые шумы, а также технический жаргон. Как заявляет OpenAI, решение может «надёжно» транскрибировать речь на нескольких языках, а также осуществлять перевод с этих языков на английский. Однако у Whisper есть свои ограничения, особенно в области предиктивной расшифровки. Кроме того, качество работы Whisper различается для разных языков.
Благодаря появлению Whisper API сторонние разработчики смогут интегрировать эту нейросеть в свои приложения. Поддерживается работа с файлами в различных форматах, включая M4A, MP3, MP4, MPEG, MPGA, WAV и WEBM. Стоимость использования модели Whisper large-v2 составляет $0,006 в минуту. Полученный текст затем может использоваться в других приложениях на основе нейросетей.
![]() | Мы выпустили инструмент, но на самом деле этого было недостаточно, чтобы вся экосистема разработчиков строилась вокруг него. Whisper API — это та же большая модель, которую вы можете получить с открытым исходным кодом, но мы максимально оптимизировали её. Это намного быстрее и очень удобно, — приводит TechCrunch слова президента и председателя правления OpenAI Грега Брокмана (Greg Brockman). | ![]() |
Отмечается, что Whisper API уже используется участниками проекта Speak — приложения на основе искусственного интеллекта для изучения иностранных языков. В частности, с применением API будет создан «новый сопутствующий ИИ-продукт».[2]
Примечания
Подрядчики-лидеры по количеству проектов
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Подрядчики-лидеры по количеству проектов
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)