Разработчики: | Google DeepMind (DeepMind Technologies) |
Дата премьеры системы: | февраль 2022 г |
Отрасли: | Информационные технологии |
Технологии: | Средства разработки приложений |
Содержание |
2023: Выход AlphaCode 2 на базе нейросети Gemini Prо
6 декабря 2023 года исследовательская лаборатория искусственного интеллекта Google DeepMind анонсировала нейросеть AlphaCode 2, созданную специально для генерации программного кода. Система, как утверждается, способна эффективно решать задачи программирования, связанные со сложной математикой и теоретической информатикой.
В основу AlphaCode 2 положена ИИ-модель Gemini Pro. По данным Google, в рамках соревнований по программированию на платформе Codeforces при использовании языков Python, Java, C++ и Go новая нейросеть показала более высокие результаты, чем 85% участников. Для сравнения, AlphaCode первого поколения при выполнении аналогичных задач превзошла 50% участников состязания.
AlphaCode 2 поддерживает динамическое программирование — метод, который предусматривает решение сложных задач путем их разбиения на набор более простых. Как отмечает DeepMind, нейросеть знает не только, когда следует реализовать эту стратегию, но и где именно ее можно использовать. В случае оригинальной версии AlphaCode динамическое программирование вызывало определенные сложности.
В процессе выполнения поставленного задания AlphaCode 2 использует «модель политик», предусматривающую генерацию нескольких вариантов кода для каждой задачи. Образцы кода, не соответствующие описанию проблемы, отсеиваются, тогда как алгоритм кластеризации группирует «семантически схожие образцы кода», чтобы избежать избыточности. Далее инструмент оценки выбирает лучшее решение для каждого из 10 крупнейших кластеров кода.
Вместе с тем существуют трудности. Нейросеть AlphaCode 2 требует большого количества проб и ошибок, слишком дорога для масштабного использования и во многом зависит от возможности отфильтровывать явно плохие образцы кода.[1]
2022: Запуск ИИ-системы
В начале февраля 2022 года входящая в Google компания DeepMind представила ИИ-систему под названием AlphaCode, которая, как утверждают ее создатели, способна писать программный код «не хуже среднего разработчика».
В качестве доказательств этих слов команда DeepMind обнародовала результаты соревнования с участием людей. Искусственный интеллект оказался среди 54% лучших программистов-людей. Результат является значительным шагом вперед в области автономного программирования, говорят в DeepMind.
Задачи в соревнованиях несколько отличаются от задач, с которыми может столкнуться программист при создании коммерческого приложения. Они более самодостаточны и требуют более широкого знания, как алгоритмов, так и теоретических концепций в области компьютерных наук. Некоторые решения можно назвать очень специализированными головоломками, которые сочетают в себе логику, математику и знания в области программирования.
В одном задании, в котором тестировалась ИИ-система AlphaCode заключалась в том, что участникам предлагалась найти способ превратить одну строку случайных повторяющихся букв S и T в строку из тех же букв, используя ограниченный набор входных данных. Участники турнира не могут, например, просто вводить новые буквы, а вместо этого должны использовать команду backspace, которая удаляет несколько букв в выходной строке. Десять из этих задач были переведены в буквенный код в точно таком же формате, в каком они даны людям. Затем AlphaCode сгенерировал большее количество возможных ответов и отсеял их, запустив код и проверив результат так же, как это сделал бы человек.
Весь процесс происходит автоматически, без отбора лучших образцов человеком. Я могу с уверенностью сказать, что результаты AlphaCode превзошли мои ожидания! Изначально я был настроен скептически, потому что даже в простых соревновательных задачах часто требуется не только реализовать алгоритм, но и придумать его. ИИ-системе удалось выступить на уровне многообещающего нового конкурента, - сказал соавтор AlphaCode Юджиа Ли (Yujia Li). |
ИИ-система решила 10 задач, над которыми также работали 5 тыс. пользователей сайта Codeforces. Технология заняла первое место с 54,3% правильных ответов ответов. По оценкам DeepMind, это дает системе рейтинг Codeforces в 1238, что ставит ее в число 28% лучших пользователей, которые участвовали в конкурсе на сайте с 2016 года. [2][3]
Примечания
Подрядчики-лидеры по количеству проектов
Солар (ранее Ростелеком-Солар) (46)
Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
Форсайт (11)
Бипиум (Bpium) (10)
Axiom JDK (БеллСофт) ранее Bellsoft (10)
Другие (389)
Солар (ранее Ростелеком-Солар) (8)
Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
Консом групп, Konsom Group (КонсОМ СКС) (2)
ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
IFellow (АйФэлл) (2)
Другие (30)
Солар (ранее Ростелеком-Солар) (10)
Форсайт (3)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
КРИТ (KRIT) (2)
Cloud.ru (Облачные технологии) ранее SberCloud (2)
Другие (13)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Солар (ранее Ростелеком-Солар) (2, 48)
Microsoft (41, 47)
Oracle (49, 26)
Hyperledger (Open Ledger Project) (1, 23)
IBM (33, 18)
Другие (594, 304)
Солар (ранее Ростелеком-Солар) (1, 8)
Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
Microsoft (4, 3)
Oracle (2, 3)
SAP SE (2, 2)
Другие (16, 19)
Солар (ранее Ростелеком-Солар) (1, 11)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
Форсайт (1, 3)
Сбербанк (1, 2)
Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
Другие (9, 9)
Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
Солар (ранее Ростелеком-Солар) (1, 6)
Мобильные ТелеСистемы (МТС) (1, 4)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
Форсайт (1, 3)
Другие (14, 24)
Мобильные ТелеСистемы (МТС) (2, 3)
Unlimited Production (Анлимитед Продакшен, eXpress) (1, 3)
Солар (ранее Ростелеком-Солар) (1, 3)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
Naumen (Наумен консалтинг) (1, 1)
Другие (12, 12)
Распределение систем по количеству проектов, не включая партнерские решения
Solar appScreener (ранее Solar inCode) - 48
Hyperledger Fabric - 23
Windows Azure - 20
FIS Platform - 15
Форсайт. Мобильная платформа (ранее HyperHive) - 12
Другие 324
Solar appScreener (ранее Solar inCode) - 8
FIS Platform - 4
Siemens Xcelerator - 2
Парадокс: MES Builder - 2
Турбо X - 2
Другие 22
Solar appScreener (ранее Solar inCode) - 11
BSS Digital2Go - 3
Форсайт. Мобильная платформа (ранее HyperHive) - 3
Cloud ML Space - 2
Nexign Microservices Framework - 1
Другие 8