![](/.s/t/944/7.jpg) |
|
Головна » 2011 » Березень » 14 » Сегментація даних
|
«Не сегментувати дані - це злочин проти людяності» Авінаш Кошик
Усереднення - це те, чого потрібно боятися найбільше. Можна, звичайно, підсумовувати статистику від користувачів, що прийшли з рекламних оголошень, зі статистикою від випадкових відвідувачів; складати відвідування з усіх міст та країн; розглядати «середню температуру по лікарні, включаючи морг», як у популярному анекдоті. Однак, у такому разі корисних даних ви отримаєте мінімум, і висновки, які ви з них зробите, швидше за все, будуть неправильними.
Перед початком роботи забудьте, будь ласка, все, що ви знаєте про своїх користувачів. Вам належить аналізувати неупереджені дані статистики, і дві речі можуть перешкодити вам: спроби використати свої власні судження про користувачів і бажання створити «усереднений портрет» для всієї вашої аудиторії. Все навпаки: чим більше різних портретів, різних груп ви побачите, тим більше ви дізнаєтеся про те, як догодити кожної з цих груп.
Сегментація можлива за будь-якими параметрами, які система веб-аналітики запам'ятовує при показі сторінки. Наприклад: За регіоном За адресами сайтів, з яких прийшов користувач Для тих, хто побачив ваш сайт в пошуковій системі - за запитом, який допоміг йому знайти його Для тих, хто прийшов з рекламного оголошення - за оголошеннями і рекламним майданчикам За першою побаченої користувачем сторінці За технічними можливостями комп'ютера і інтернет-з'єднання користувача По тому, приходив чи користувач на ваш сайт раніше За діям користувача на сайті.
Ось простий приклад того, як працює сегментація. Ви - власник інтернет-магазину, і вас, звичайно ж, хвилює, яким чином можна збільшити його прибутковість. Ви заходите на Google Analytics і бачите таку картину:
![Сегментація даних Сегментація даних](http://novini.at.ua/src=%22http://pix.am/ciM6.png%22/)
Це усереднені дані по всім користувачам. Вони можуть представляти інтерес тільки в динаміці - їх коливання є сигналом про те, що ситуація змінилася і треба провести додаткове розслідування. Але справжні одкровення чекають нас далі, в глибині, там, де дані сегментовані за всіма можливими параметрами.
Зайдемо, наприклад, у розділ «Зміст». У ньому зручно користуватися пунктом «Зміст по заголовках», тому що в списку відразу ж зрозуміло (якщо на сайті коректні теги title), про якій сторінці йдеться:
![Сегментація даних Сегментація даних](http://novini.at.ua/src=%22http://pix.am/cSFh.png%22/)
Ми тільки що сегментували відвідування по сторінках, які відкривали користувачі. Тут цікавого вже більше. Ми можемо побачити: Які сторінки відвідують найчастіше (Перегляди сторінок) На яких найчастіше затримуються (Середня тривалість перегляду сторінки) Скільки відсотків відвідувачів, що почали перегляд сайту з цієї сторінки, не перейшли на іншу, а відразу закрили сайт (Показник відмов) Скільки відсотків відвідувачів закінчили перегляд сайту на цій сторінці (% виходів).
Зверніть увагу, що точність підрахунку параметра залежить від кількості зібраних даних. Наприклад, показавши сторінку 10 разів і отримавши 2 відмови, ми не можемо з точністю стверджувати, що показник відмов складає 20%: зібравши більше статистики, ми зможемо уточнити результат, і реальна цифра зможе відмовитися як 10%, так і 30%. В якості першого наближення можна вважати, що коливання значення становлять плюс-мінус корінь з вимірюваної величини. Так що, наприклад, коливання відвідуваності від 90 до 110 користувачів не говорять про системну зміну величини. Системні зміни іноді видно на око, але на це не варто покладатися; для точних вимірювань, оскільки звичайні системи статистики не дозволяють будувати лінії тренду, можна або завантажити статистику в Excel, або брати великі інтервали вимірювань. Більш точну формулу для підрахунку достовірності даних я наведу пізніше.
З цим пов'язана одна проблема, яка заважає користуватися Google Analytics: при спробі відсортувати сторінки за показниками наверх виходять найбільш непопулярні:
![Сегментація даних Сегментація даних](http://novini.at.ua/src=%22http://s55.radikal.ru/i147/1103/f9/4a6f4c849e8f.png%22/)
Зрозуміло, чому це відбувається, але ці дані марні: у них нульова точність. У залежності від кількості сторінок, ключових слів або інших сегментів боротися з цим можна по-різному, я, чесно кажучи, не знаю методу краще, ніж експортувати таблицю з сортуванням за спаданням показів в Excel, потім відрізати від неї «довгий хвіст» і сортувати по інших полях.
Зрозуміло, навіщо це потрібно: особливий інтерес представляють ті сегменти, для яких один з цих параметрів незвичайний: помітно більше або менше значення для інших сегментів. Зазвичай це відбувається з наступних причин:
Відмінність у трафіку: користувачі, які представляють даний сегмент, відрізняються від інших. Наприклад, для інтернет-магазина, що працює тільки на Москву, відвідувачі з Єкатеринбурга будуть нецільовими, і для них буде більше відмов, менше досягнення цілей і нижче глибина перегляду.
Відмінності в якості сторінок. Якщо сторінка ховає від користувача свій вміст і не допомагає йому зрозуміти, що можна зробити на сайті, не переконує його в тому, що потрібно йти далі, користувач з більшою ймовірністю буде втрачений для сайту. На заході persuasion design - ціла дисципліна, але про це пізніше.
Те, про що багато хто забуває, намагаючись спростити модель взаємодії користувача з сайтом - відповідність цілей користувача, зайшов на сторінку, і змісту сторінки. Типовою помилкою подібного роду є використання головної сторінки сайту в якості вхідної (landing page) для рекламних кампаній. Клікнувши по рекламному оголошенню, що обіцяє знижку на певний товар, користувач може опинитися на головній сторінці великого магазину. У цьому випадку велика вірогідність того, що він не захоче або не зможе знайти те, що вже чекав побачити. Подібна помилка відбувається і тоді, коли в спробах заманити більше відвідувачів рекламодавець пише на банері «знижка 25%!», А на вхідних сторінці сайту «забуває» про свою пропозицію.
Розмірковуючи в цих трьох категоріях, можна створювати гіпотези і перевіряти їх, збільшуючи важливі для сайту показники.
У наступних частинах ми поговоримо про складання плану аналізу, побудові припущень на основі статистики по кожному з основних параметрів та їх перевірки.
|
Переглядів: 576 |
Додав: w1zard
| Рейтинг: 0.0/0 |
|
|
Категорії розділу
Події
[3]
Тільки екстренні та надзвичайні новини
|
Світові події
[4]
Останні події, що трапились у світі.
|
Українські події
[8]
Події, які трапились в межах нашої державии, чи стосуються України
|
Бізнес
[3]
Новини та події із бізнес-світу
|
Наука і техніка
[3]
Новини, що трапились у світі науки або технічних досліджень
|
Спорт
[1]
Спортивні новини та досягнення
|
Культура та мистецтво
[2]
Новини культурного та художнього світу
|
Статистика
![](/stat/1739068980)
Онлайн всього: 5 Гостей: 5 Користувачів: 0
|