2015/02/17 00:00:00

Предикативная (предиктивная) аналитика
Predictive Analytics

Дальнейшее развитие мирового рынка бизнес-анализа пойдет по пути активного освоения advanced (продвинутой) аналитики, в том числе предикативного (предиктивного) анализа, построения симуляторов и вариативных моделей.

Каталог BI-решений и проектов доступен на TAdviser.

Содержание

Что такое предикативная (предиктивная) аналитика?

Предикативная или прогностическая аналитика (Predictive analytics) - это прежде всего множество методов статистики, анализа данных и теории игр, которые используются для анализа текущих и исторических данных/событий для прогноза данных/событий в будущем.

Наиболее известный способ использования прогностической аналитики – это применение скоринговых моделей для оценки платежеспособности клиента при выдаче кредитов в банке. Любая скоринговая модель строится на исторических данных, и если в прошлом, какая-либо группа клиентов была уличена в несвоевременном гашении кредитов, а вы по каким-либо характеристикам схожи с этой группой, то скорее всего в выдаче кредитов вам откажут.

Однако это не все области, где применяется предикативная аналитика, ее можно применять для разработки продуктов, для выбора потенциальной аудитории, для выбора следующего продукта, который вы можете предложить клиенту (Next Best Offer) и множестве других.Метавселенная ВДНХ 3.3 т

Родственным по отношению к предикативной аналитике является понятие data mining, так как предикативная аналитика использует частично подобные методы. Центральной же сущностью предиктивной аналитики является задача определение предиктора или нескольких предикторов (параметров или сущностей, которые влияют на прогнозируемое событие). Например, страховые компании выделяю такие предикторы, как возраст, стаж вождения при определении страховой премии. Множество этих предикторов образует модель предиктивной аналитики, которая предсказывает определенное событие в будущем с какой-то степенью вероятности.

Аналитики Gartner полагают, что дальнейшее развитие мирового рынка бизнес-анализа пойдет по пути активного освоения advanced (продвинутой) аналитики, в том числе предикативного анализа, построения симуляторов и вариативных моделей. Возможность к построению таких моделей в 2013 году в Gartner назвали 15 обязательным блоком корпоративных BI-платформ.

Аналитика класса advanced использует статистику, описательные и предикативные инструменты data mining (разведки данных), симуляторы и оптимизационные средства. Конечная цель применения всех этих инструментов – принятие решений, решение бизнес-задач и идентификация возможностей для составления наилучших прогнозов, выявления процессов, паттернов и прочих закономерностей.

Чтобы предикативный анализ был успешным, в Forrester рекомендуют четко следовать следующим стадиям: постановка цели, получение данных из различных источников, подготовка данных, создание предикативной модели, оценка модели, внедрение модели, мониторинг эффективности модели.

Схема внедрения инструментов предикативного анализа


Forrester Research, 2013

Области применения

В отличии от data discovery средства предикативной аналитики адресованы специалистам, поэтому не применяются столь широко. По данным Gartner за 2012 год, только 13% пользователей BI широко задействуют средства предикативного анализа. Менее 3% используют такие методы как математическое моделирование, симуляторы и оптимизацию.

Эксперты считают, что не стоит ждать массовых внедрений в этой области, но тренд будет постепенно меняться. Причина тому – появление феномена больших данных, который подталкивает организации к поиску новых средств обработки информации. В Gartner считают, что те компании, которые будут применять продвинутую аналитику к большим данным, будут расти на 20% быстрее конкурентов.

По мнению Эрика Сигеля (Eric Siegel), эксперта по предикативному анализу, изложенному в его одноименной книге «Predictive Analytics»[1], область применения предикативного анализа в действительности весьма широка. Он приводит 10 наиболее распространенных примеров:

  • Директ маркетинг: задача состоит в повышении числа откликов путем интеграции данных о клиентах из различных веб и социальных источников. Компании могут определять эффективность промо кампаний, разделяя потенциальных клиентов по сегментам, местоположению или каналам доставки.
  • Предикативный таргетинг рекламы: любой рекламодатель хочет знать, какое сообщение является наиболее эффективным. Рекламу можно демонстрировать наилучшим образом онлайн, основываясь на подобии кликов, причем клиенты только выиграют от подачи более релевантного контента.
  • Выявление мошеннических схем: средства предикативного анализа позволяют минимизировать использование мошенниками фальшивых схем страхования, получения кредита и тому подобное.
  • Управление инвестиционными рисками: средства предикативного анализа позволяют оценить потенциал того или иного стартапа или другого актива. Метод может использоваться компаниями и для выбора партнера, кандидата на покупку или даже вендора.
  • Удержание клиентов: предикативный анализ позволяет рассчитать поведение клиентов, а также учесть негативные факторы, влияющие на их решения.
  • Рекомендательные сервисы: пользователям можно рекомендовать товары или контент на основе данных о предыдущих просмотрах, интересах или анализа комментариев в Twitter.
  • Образование: средства предикативной аналитики могут использоваться для обеспечения более эффективных методик преподавания.
  • Политические кампании: моделирование процесса голосования.
  • Системы принятия решения в медицине: предикативный анализ может на основании множества факторов выявить склонность пациентам к заболеваниям типа сахарного диабета, астмы и других болезней, связанных с образом жизни.
  • Страхование и ипотечное кредитование: точное определение разумной суммы покрытия в каждом страховом случае.

Торговля

Прогнозирование потребительского спроса и планирование акций[2]

  • Прогнозирование ежедневного потребительского спроса на уровне магазин/товар на 28 дней
  • Прогнозирование акционного спроса
  • Учет товарного замещения (каннибализации) во время акций
  • Учет изменений в цене, сезонного изменеия спроса
  • Учет температуры и погодных условий по городам расположения магазинов, размерам магазинов и пр.
  • Прогнозирование для новых товарных позиций, новых магазинов
  • Учет открытий конкурентов

Выведение значимых товарных позиций для покупателей (Key Value Item Analysis)

  • Выделение товаров имеющих непропорционально большое влияние на восприятие покупателей
  • Выявив эти товарные позиции ритейлер может влиять на потребительское восприятие адаптировав свою ценовую стратегию
  • Используя агрессивную ценовую стратегию, ритейлеры могут влиять на трафик, общее представление о ценах, прибыльность, долю рынка и пр.

Оптимизация регулярной и акционной цены

  • Рекомендации по оптимальной цене
  • Учет ограничений по выкладке, марже, обороту, поставкам и пр.
  • Расчет эластичности цены
  • Рекомендации по временным ценам для ускорения продаж
  • Прямые предложения для клиентов
  • Многоканальные продажи

Сегментирование покупателей

  • Поведенческая и маркетинговая сегментация,
  • Целенаправленные маркетинговые кампании
  • Анализ потребительской корзины,
  • Рекомендации по товарам
  • Перекрестные продажи и повышение уровня продаж,
  • Стратегия наилучшей альтернативы,
  • Предотвращение оттока клиентов путем расчета потребительского риска

Выделение групп покупателей со схожими поведенческими характеристиками путем многомерного анализа данных
Customer Segmentation, Behavioral Targeting, Churn Prevention

  • Повышение конверсии по акциям путем формирования целевых групп (сегментов) покупателей для направленных акций
  • Повышения прибыльности путем рекомендаций по уровню скидок для различных целевых групп покупателей
  • Повышение лояльности путем раннего выявления покупателей с наибольшей вероятностью ухода и последующих действий (акций)

Предиктивная аналитика на производстве

  • Анализ и прогнозирование влияния воздействий факторов на параметры продукции
  • Прогнозирование отказов оборудования - переход от обслуживания по регламенту к обслуживанию по состоянию
  • Прогнозирование производства продукции и потребления энергии и ресурсов
  • Онлайн упреждающие оповещения о будущих внештатных ситуациях


Для промышленных предприятий, где требуется обработка и понимание огромного количества данных и есть высокие риски при принятии решений, предсказательная аналитика имеет особое значение[3].

Данные о протекании технологического процесса не всегда используются эффективно, в то время как их можно использовать для оптимизации операционных процессов и повышения технико-экономических показателей производства. Оптимизацию можно выполнить на любом типе производства с серьезным уровнем автоматизации, организованным сбором и длительным хранением информации. Для этого успешно применяются интеллектуальные системы, которые могут проанализировать состояние технологического процесса в реальном времени, спрогнозировать дальнейшее протекание процесса, определить уровень оптимальности и, при необходимости, изменить управляющие параметры или дать рекомендации диспетчеру. Для решения данных задач с помощью средств машинного обучения создается предиктивная математическая модель технологического процесса. Она анализирует входные параметры, в реальном времени выдает прогноз протекания процесса и предложения по его оптимизации. Эта модель объединяется с АСУТП, MES и ERP-системами предприятия.

Еще одна задача для предиктивных алгоритмов – это техническое обслуживание и ремонт оборудования. В основном, предприятия используют базовые механизмы контроля, предоставленные производителями оборудования. Но потенциал этих средств ограничен, поскольку они не позволяют проанализировать дополнительные факторы, влияющие на состояние оборудования, и заранее спрогнозировать критическую ситуацию. Таким образом, сотрудники отдела технического обслуживания получают множество данных, но не знают, как эти данные связаны между собой. В итоге реакция от ремонтных служб следует только после отказа оборудования, что ведет за собой простои, и, следовательно, дополнительные расходы. Прогнозная аналитика средствами машинного обучения и искусственного интеллекта проводит непрерывный анализ больших данных, выполняет визуализацию данных о состоянии оборудования на текущий момент и прогнозирует сценарии возникновения отказов оборудования. В результате сокращаются внеплановые простои, оптимизируются работы по ТОРО, уменьшается время техобслуживания, а управляющий персонал получает углубленный анализ причин отказов оборудования.

Мировой рынок

Прогноз Transparency Market Research 2017 года в 2019й

Рынок предикативной аналитики достигнет $6,5 млрд к 2019 году, согласно прогнозу Transparency Market Research[4] от ноября 2013 года. По мнению аналитиков этой компании, рост рынка управляется такими драйверами как увеличение спроса на пользовательскую аналитики и интеллектуальный софт для информационной безопасности и защиты от фрода. Отдельное отмечается бурное развитие сегменте облачных решений для предикативного анализа[5].

Для сравнения, по итогам 2012 года, по данным той же фирмы, мировой рынок систем для предикативного анализа составил в объеме $2,08 млрд, а среднегодовой его прирост в период с 2013 по 2019 год составит 17,8%.

Наиболее востребована предикативная аналитика в отраслях, работающих с конечными потребителями, таких как банковские и финансовые сервисы, страхование, госсектор, фармацевтика, телеком и ИТ, ритейл. На эти сегменты пришлось 71,8% объема внедрений в 2012 году. На протяжении прогнозного периода максимальная доза проектов придется на банковский сектор, финансовые сервисы, страхование. Впрочем, наиболее быстро число проектов будет расти в рознице и на производстве.

Аналитики отмечают, что рост случаев мошенничества, неплатежей, угрозы несоответствия многочисленным правилам и регламентам вынуждают бизнес все чаще обращаться к предикативному анализу с целью построения футуристических моделей, позволяющих принимать превентивные меры по отношению к неблагоприятным событиям.

Такие разные типы программного обеспечения как системы пользовательской аналитики, аналитики информационной безопасности и управлениям кампаниями составили около 50% рынка предикативной аналитики в 2012 году. Эти решения используются для оптимизации организационных процессов в продажах и маркетинге, управления клиентами и каналами продаж, финансового и риск менеджмента и так далее.

Среди региональных рынков крупнейшим рынком систем предикативного анализа будет Северная Америка, причем здесь спрос на прогнозные решения придет со стороны компаний, активно решающих вопросы работы с большими данными (big data). Именно поэтому в скором времени на аренду предикативной аналитики выйдет все ключевые вендоры решений для big data, включая SAS Institute, SAP, Oracle, IBM, Microsoft, Teradata и Tableau Software.

Рынок при этом остается во многом поделен между крупнейшими игроками: на первую пятерку поставщиков пришлось 80% объема рынка в 2012 году. Среди других заметных игроков отмечаются Fair Isaac, Tibco, Information Builders, Alteryx, Qlik (QlikTech) и MicroStrategy.

Системы прогнозной аналитики

Forrester 2017 год
Forrester 2013 год

Open source системы предикативного анализа:

  • KNIME
  • Orange
  • Python
  • R
  • RapidMiner
  • Weka

Коммерческие системы предикативного анализа:

Лидеры на рынке предикативного анализа в области больших данных

По данным исследования Forrester Wave[6] за 2013 год, лидерами на рынке решений предикативного анализа в области больших данных являются SAS, SAP и IBM. Также довольно сильна экспертиза Tibco, Oracle, StatSoft и KXEN, тогда как перспективными вендорами являются Angoss, Revolution Analytics и Salford Systems.

См.также

Business Intelligence, BI (мировой рынок)

Тенденции развития мирового рынка BI

Business Intelligence (рынок России)

CPM (мировой рынок)

Большие данные (Big Data) мировой рынок

Big Data - Каталог систем и проектов

Self-Service BI

Визуализация данных

Cloud/SaaS BI

Open Source BI

Примечания