Применение прогнозной аналитики для предотвращения оттока клиентов

Заказчик

Лидер мировой ИT-индустрии, производитель и поставщик аппаратного и программного обеспечения, ИТ-сервисов и консалтинговых услуг.

Цели проекта

Одной из важнейших задач для заказчика является построение долгосрочных партнерских отношений с клиентами и повышение их лояльности, чему в значительной степени способствует возможность оперативного реагирования на проблемы, возникающие у клиентов в ходе эксплуатации широкой линейки аппаратного и программного обеспечений, произведенных заказчиком.

В числе основных целей проекта — построение прогнозной (статистической) модели, позволяющей из огромного числа ежедневно поступающих жалоб заблаговременно выявить те, которые могут привести к возникновению «критических» ситуаций. В этом случае появляется возможность превентивно реагировать на них, задействовав дополнительные ресурсы для оперативного решения проблемы, и избежать наступления реальной «критической» ситуации.

Краткое описание проекта

Любые математически обоснованные прогнозы строятся на обработке исторических данных (выборке). Например, для построения прогнозной (статистической) модели возможности наступления «критических» ситуаций для накопителя информации, одного из продуктов компании-заказчика, была создана выборка с историческими данными — с жалобами за последние три года. По статистике, из 1000 жалоб, пришедших за день по накопителям информации, «критическими» станут менее 10 случаев. В выборку вошли как обычные («легкие») жалобы, так и жалобы, которые переросли в «критическую» ситуацию.

В итоговой выборке присутствуют 3 уровня данных (входных переменных):

  • Характеристика текущей поломки (ее срочность, давность открытия, количество потраченного времени на решение и многое другое)
  • Характеристика устройства, на котором произошла поломка (как часто приходили жалобы за последние полгода, какой срочности они были и прочее)
  • Характеристика клиента, на устройстве которого произошла поломка (как часто от этого клиента приходят жалобы, какой они срочности и прочее).

Данные в выборке являются историческими, то есть по каждой жалобе известен финальный исход: возникла «критическая» ситуация или нет. В одном из столбцов итоговой выборки отражается характеристика жалобы – так называемая зависимая переменная, которую нужно предугадать по значениям остальных полей (входных переменных). Зависимая переменная в данном случае принимает два значения: «1» – соответствует «критической» жалобе, а «0» – статусу «хороший» клиент.

На основании данной выборки строится статистическая модель, алгоритм которой и определяет, какие комбинации значений входных переменных приводят к значениям «1» и «0» зависимой переменной. Исходя из ситуации для построения модели могут использоваться различные статистические и Data Mining алгоритмы: логистическая регрессия, деревья решений, нейронная сеть и многие другие. Помимо прочего, для улучшения точности прогнозирования применяются алгоритмы анализа неструктурированных данных (текстовой информации), которые анализируют первичное текстовое описание жалобы клиентом, выделяя ключевые слова и фразы, что, в конечном счете, улучшает точность прогнозирования.

Результаты проекта

Построенная прогнозная (статистическая) модель заблаговременно обнаруживает порядка 83% всех «критических» жалоб и распознает «критическую» ситуацию с запасом для реагирования в среднем в 4-5 дней. То есть служба поддержки располагает временем, достаточным для оперативного реагирования на «выбранную» моделью жалобу и предотвращения наступления «критической» ситуации. Это позволяет существенно сократить риск возникновения «критических» ситуаций и значительно повысить уровень лояльности клиентов.