Интернет-статистика для владельцев сайтов Алексей Тутубалин «Ашманов и Партнеры» lexa@lexa.ru Задачи семинара Получить ответы на вопросы: Зачем нужна интернет-статистика ? Какие параметры аудитории и посещаемости сайта можно оценить ? Откуда берутся данные для анализа ? Какие возможности представлены на рынке ? Как относиться к получаемым данным ? Примеры решения практических задач. Цели и задачи решаемые средствами интернет-статистики Цель: оценка эффективности интернетсредств как инструментов решения конкретных задач бизнеса. Задачи: Общая оценка аудитории Оценка качества аудитории Оценка эффективности мероприятий по рекламе и продвижению сайта Технический аудит сайта Изучение аудитории сайта Посещаемость: аудитория, ее устойчивость, активность посетителей, их региональное распределение, сравнение с конкурентами. Источники посетителей: поисковые системы (и поисковые слова), каталоги, партнерские программы, реклама. Детальное изучение посещаемости сайта. Целевая аудитория Целевые посетители: сколько их, что они делают на сайте ? Целевые посетители: откуда они ? Эффективность рекламных кампаний Эффективность поискового трафика Эффективность партнерских программ Технические параметры Нормально ли работает сайт: Нет ли перегрузки ? Нет ли «периодов молчания», когда не работал провайдер Нет ли висячих ссылок Интернет-статистика: параметры и термины Суммарные данные о посещаемости сайта Просмотры страниц («хиты», загрузки) Пользовательские сессии Аудитория сайта: сколько новых посетителей, сколько постоянных, «ядро аудитории» Характеристики аудитории Географическое распределение Активность Параметры и термины (продолжение) Источники посетителей Ссылающиеся сайты, ссылающиеся URL Распределение источников посетителей по группам (поисковые системы, каталоги, прочие) и внутри групп Поисковые запросы по которым приходят посетители Активность посетителей на сайте Какие документы популярны Точки входа, точки выхода Пути пользователей по сайту Целевая аудитория Целевая аудитория выделяется по действиям на сайте. В порядке убывания качества клиента: Покупка Помещение товара в корзину Просмотр «контактов» / «как проехать» Заполнение формы запроса, подписка на рассылку Чтение описания товара, получение каталога Повторный заход на сайт Просмотр определенного количества страниц на сайте Просмотр одной страницы на сайте Не пришел на наш сайт Анализ целевой аудитории Выделение целевых посетителей Анализ данных по целевой аудитории: Кто они Что делают на сайте помимо целевого действия Анализ источников целевой аудитории: Откуда приходят целевые посетители Сколько это стоит в расчете на посетителя Сравнимость и устойчивость результатов Результаты измерений (подсчетов) не очень точные, разумно ожидать отклонений в 10-20% от «истины» Ошибки примерно постоянны во времени Сравнивать можно если сравнивается одно и то же Все результаты подчиняются обычным статистическим закономерностям: Случайные отклонения пропорциональные корню из величины Систематические ошибки одного знака и меняются не очень сильно Источники данных: что происходит при обращении пользователя к сайту WWW.SITE.RU сс о о ппрр а ЗЗа еетт в ООттв Запись в журнал Запись в журнал запрос В навигационной строке или переход по ссылке http://www.site.ru Клиент ответ WWW.SITE2.RU Запись в журнал Что оказывается в журналах (logфайлах) Обязательные данные: Дата и время обращения IP-адрес клиента Запрошенный клиентом URL Дополнительные данные: Версии программ у клиента Откуда перешли по ссылке (referer) Дополнительные технические параметры Пример: 62.205.178.34 [17/Jun/2005:00:06:52 +0400] "/apache-talk/msg05126.html HTTP/1.1" 12854 "http://www.yandex.ru/yandsearch?rpt=rad&text=RFC1945" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; .NET CLR 1.1.4322)" "ruid=0000000142B1DAE9000092EA03030F02" Подсчет пользователей Считают не пользователей, а их браузеры При первом посещении выдается идентификатор (cookie), при последующих обращениях браузер возвращает этот идентификатора на сайт, где он записывается в журнал Проблемы: Cookie теряются (их фильтруют, удаляют, просто теряют) В результате: невысокая точность, завышенное количество «новых» посетителей, несовместимость данных по посетителям для разных систем статистики. Где накапливаются исходные данные Журнальные файлы образуются: На самом сайте На сервисах-счетчиках – если на сайте установлен код(ы) счетчика(ов) Пути получения обработанных данных: Самостоятельный анализ Использование сервисов-счетчиков Требования к системе анализа Поддержка российской специфики: Набор отчетов: Знание каталогов, рейтингов, поисковых систем Знание кодировок русского языка для правильного показа поисковых запросов Базовые отчеты (аудитория, посещаемые страницы) дают все системы Фильтрация данных по критериям – необходима для анализа целевой аудитории и есть далеко не везде Подробный отчет о поведении пользователей (пути по сайту, детальный отчет по пользователю) важен только для сайтов с небольшой посещаемостью Надежность Скорость работы Cамостоятельный анализ: за и против За: Данные накапливаются, данные за прошлые периоды можно повторно обработать Нет утечки данных на сторону Часть отчетов можно получить только этим способом Более точные данные Против Большие стартовые расходы: требуется установка, настройка (и, возможно, покупка) программного обеспечения Часть отчетов (например, сравнение с конкурентами) получить невозможно Счетчики: за и против За: Быстрый и недорогой старт Часть отчетов (сравнение аудиторий, соцдем) можно получить только этим путем Против: Потенциальная утечка данных о посещаемости Данные не накапливаются, доступны только отчеты, набор которых определен владельцем счетчика Счетчики замедляют доступ клиентов к сайту Ниже точность Российские статистические сервисы Обзор возможностей приведен в материалах семинара Лидеры Liveinternet (RAX), Spylog. В случае RAX придется регулярно сохранять данные (цена бесплатности) Smartlog – новая система с необычными возможностями Ошибки пользователей счетчиков Установка многих счетчиков Потери данных (около 5% на каждом следующем счетчике) Замедляется доступ к сайту Установка в подвале страницы Установка не на все страницы сайта Путаница в терминологии Проблемы счетчиков Нельзя учесть заходы поисковых роботов Роботы не загружают картинки и поэтому не считаются Способы учета роботов, предлагаемые сервисами – опасны для сайта Неустойчивость работы счетчиков и их провайдеров Перегрузка систем статистики: учет не всех просмотров страниц Анализаторы журнальных файлов Обзор приведен в материалах Выводы: Бесплатные решения хороши только ценой Webtrends – мировой лидер, однако дорог и ориентирован в первую очередь на онлайнпродажи Российские лидеры: Flexolyzer, система статистики Bitrix. Заключение Оптимальное решение зависит от бюджета (разового и постоянного) Чем больше трафик сайта, тем выгоднее самостоятельный анализ данных Даже при самостоятельном анализе данных, счетчики интересны для Сравнения себя с конкурентами Анализа аудитории