Любовь клиентов в цифрах Предсказательные модели шоппинг-клуба LeBoutique. Успехи и поражения. Руппельт Александр BI аналитик Содержание: • 1. Большие данные и рок-н-ролл в Украине и LeBoutique • 2. Ассоциативные правила. • 3. Рекомендационная система • 4. Прогноз Churn rate BigData, Machine Learning, Rock’ n’ roll BigData Sex Machine Learning Drugs Rock ’n’ roll Rock’n’roll Цели компании и использование ML Заработать больше Хорошие отношения с клиентами Дело жизни Быстрая продажа Сделать мир лучше Победа над конкурентами и другие... Ассоциативные правила Ресурс: http://www.saedsayad.com/association_rules.htm Ассоциативные правила. Результаты Retail – {Пиво} {Подгузники} или {Пиво, Хлеб} {Молоко} Другое (предсказание выживших Титаника) – {Класс = 3, Пол = Мужской} {Живой=Нет} Алгоритмы: http://www-users.cs.umn.edu/~kumar/dmbook/dmslides/chap6_basic_association_analysis.pdf Системы рекомендаций Ресурс: https://en.wikipedia.org/wiki/Collaborative_filtering Рекомендационные системы. Цель: На основе доступных данных автоматически подбирать товары/услуги для клиента, оставляя у него ощущение магии Функции: - Найти нужный товар - Продать более дорогой товар, или часто/редко продаваемый - Завлечь клиента «поискать» Рекомендационные системы. TF-IDF Значимость термина n Частота термина n в документе d Уникальность термина n в корпусе документов LeBoutique. Рекомендации до: LeBoutique. Рекомендации после: Прогноз оттока клиентов (Churn Rate) Модель client id feature1 feature2 … churn? 1 x1 A 1 2 x2 B 0 3 x3 A 0 4 x4 B 1 ----- ----- ----- ----- ----- Churn rate. Перемога чи Зрада? Проблемы и вопросы • 1. Точность. Какая устроит? • 2. Поиск golden feature • 3. Имплементация. Алгоритмы • • • • 1. Линейная регрессия 2. Кластеризация 3. Support Vector Machine 4. CART и Random Forest Спасибо за внимание! Отдельное спасибо: BigDataConf.com.ua Команде LeBoutique и Юлии Шиловой Паше Левчуку и Сергею Брылю в Анталии) Маме Преподавателю по PowerPoint в университете