Как анализировать данные: базовое руководство

Эффективный анализ данных имеет важное значение для всех сотрудников, независимо от департамента и занимаемой должности. Умение выявлять и изучать скрытые тенденции — необходимый навык как для маркетолога, анализирующего окупаемость рекламных кампаний, так и для продакт-менеджера, просматривающего данные об использовании продукта.

К сожалению, многие компании испытывают затруднения со сбором, обработкой и анализом данных. Глобальный опрос Splunk показал, что 55% всех данных, собираемых компаниями, остаются необработанными и не используются. Иногда в компании даже не знают о сборе информации, в других случаях сотрудники просто не умеют анализировать данные.

76% руководителей считают, что обучение сотрудников анализу и обработке различных типов данных поможет решить проблему и компания сможет эффективно использовать информацию.

К счастью, анализ данных — навык, которому можно научиться. Чтобы понять, как анализировать данные, вам не нужно иметь ученую степень в области статистики или часами изучать учебные модули. Вместо этого мы составили данное руководство, чтобы помочь вам понять, как анализировать данные — очистка данных, выбор правильных инструментов анализа, анализ закономерностей и тенденций. Вы сможете получить ценные практические сведения и на их основании сделать точные выводы.

Определите цели

Поставьте перед собой конкретные цели еще до начала анализа данных. Если вы не имеете четкого представления, что ищете, то будете часами, ожидая момента озарения, просто смотреть в электронную таблицу или просматривать бесчисленные запросы в службу поддержки.

Цели зависят от того, в какой команде вы состоите, какие данные собираете и какую должность занимаете:

  • Команда финансового департамента анализирует расходы и ищет возможности экономии средств.
  • Команда маркетинга наблюдает за активностью потенциальных клиентов и ищет способы повысить конверсию за счет бесплатной пробной версии продукта.
  • Команда инженеров должна понимать, сколько клиентов пострадало в результате недавнего сбоя в системе, поэтому просматривает данные об использовании продукта.
  • Команда разработчиков продукта должна установить очерёдность разработки новых функций и исправлений ошибок, поэтому анализирует последние запросы в службу поддержки и выделяет среди них наиболее важные.

Цели будут влиять на то, какие именно данные вы собираете, какие инструменты анализа используете и какую полезную информацию в результате получите.

Очистите данные и удалите все ненужное

Ваш анализ данных будет настолько хорош, насколько хороши исходные данные. Если полученная информация фрагментарна, неточна или непоследовательна, то выводы в результате будут неполными или вводящими в заблуждение. Поэтому после сбора данных обязательно очистите их и убедитесь, что они непротиворечивы и не содержат повторяющуюся информацию.

Если вы работаете с небольшим объемом данных, вам может быть проще вручную очистить его в электронной таблице. Вот несколько простых вещей, которые вы можете сделать, чтобы очистить данные:

  • Добавьте в электронную таблицу строки заголовков, это упростит понимание информации.
  • Удалите повторяющиеся строки или столбцы, если у вас оказалось несколько копий одной и той же записи.
  • Если вы экспортировали данные, удалите строки или столбцы, которые не собираетесь использовать. Например, многие инструменты добавляют столбец «ID» или временные отметки, которые вам не нужны.
  • Стандартизируйте данные, чтобы числовые значения, такие как числа, даты или валюта, выражались в едином формате.

Если вы работаете с обширным массивом данных, намного сложнее очищать их вручную. Чтобы ускорить процесс, используйте инструменты для очистки данных, такие как OpenRefine или Talend. Они быстро убирают запутанную, противоречивую информацию и данные после их обработки готовы к следующему этапу анализа.

Внедрите стратегию управления данными, чтобы установить четкие принципы организации данных и сократить количество времени на процесс очистки в будущем. Вот несколько передовых методов управления данными:

  1. Разработайте стандартную процедуру, когда и как собирать данные.
  2. Утвердите стандартизированное соглашение по присвоению имён, чтобы уменьшить несоответствия.
  3. Если у вас автоматизирован процесс сбора данных, внимательно относитесь к любым некорректным данным. В случае сообщения об ошибке, изучите свои настройки, чтобы определить причину.
  4. Редактируйте и обновляйте данные, собранные в прошлом, чтобы они соответствовали вашим новым стандартам качества.

Очистка и стандартизация данных — важный подготовительный шаг к анализу. Этот этап снижает вероятность неправильных выводов, полученных на основе противоречивых данных, и повышает вероятность получить ценную и полезную информацию.

Создайте свой набор инструментов для анализа данных

Многие компании для хранения и анализа данных полагаются на Excel или другие инструменты для работы с электронными таблицами. Но существует множество других сервисов, которые помогут вам анализировать данные. Выбор инструмента зависит от двух вещей:

  1. Тип данных. Количественные данные часто переданы в числовой форме, что идеально подходит для их представления в электронных таблицах и инструментах визуализации. Но качественные данные, такие как ответы на анкеты, ответы на опросы, запросы в службу поддержки или сообщения в социальных сетях, неструктурированны, что затрудняет извлечение полезной информации в файл электронной таблицы. Для эффективного анализа качественных данных вам нужно их структурировать.
  2. Объем данных. Если вы анализируете небольшое количество данных один раз в неделю или в месяц, можно это делать вручную. Но чем больше данных вы обрабатываете, тем больше вероятность того, что придется инвестировать в инструменты для автоматизации процесса. Специализированные сервисы снизят вероятность человеческой ошибки и ускорят процесс анализа.

Вот несколько инструментов для анализа данных, которые будут полезным дополнением к вашему набору. Конечно, вы не будет использовать их все одновременно, так как каждый из них подходит для определенного типа данных.

  • Электронные таблицы, такие как Excel или Google Sheets — традиционные инструменты для изучения данных. Они отлично подходят для анализа небольших и средних объемов данных и не требуют глубоких технических знаний.
  • Инструменты бизнес-аналитики (BI) используют компании, которые собирают и анализируют большие объемы данных.
  • Инструменты прогнозного анализа используют алгоритмы машинного обучения и данные компании за прошедшие периоды. Они просчитывают, как изменения в рабочих процессах повлияют на результаты в будущем.
  • Инструменты моделирования данных показывают структуру и характер информационных потоков и их связь с различными бизнес-системами. Компании используют этот тип инструментов, чтобы увидеть, какие отделы хранят какие данные и как эти данные взаимодействуют.
  • Инструменты аналитики для конкретных департаментов используются командами для анализа данных с учетом специфики их функциональных обязанностей. Например, отдел кадров отслеживает множество данных о людях, такие как заработная плата, производительность и данные о назначениях, поэтому для HR-аналитики подходит сервис ChartHop. Он будет проще в использовании, чем электронная таблица.
  • Инструменты визуализации данных представляют информацию в виде диаграмм, графиков и других графических изображений, что упрощает выявление тенденций.

Выберите те инструменты, которые помогут быстро проанализировать данные и извлечь труднодоступную информацию.

Ищите закономерности и тенденции

Ваши данные очищены, и у вас в распоряжении множество инструментов — начинайте процесс анализа данных.

Сначала необходимо определить тенденции. Если большая часть данных в числовом формате, относительно легко отобразить закономерности на диаграммах или других средствах визуализации. Но если присутствуют неструктурированные данные, такие как электронные письма или заявки в службу поддержки, вам может понадобиться другой подход. Вот несколько методов анализа данных, которые можно попробовать в таком случае:

  • Анализ текста использует машинное обучение для извлечения информации из неструктурированных текстовых данных, таких как электронные письма, сообщения в социальных сетях, запросы в службу поддержки и обзоры продуктов. Этот метод обнаруживает и интерпретирует закономерности в неструктурированных данных. Примеры инструментов для анализа текста: Thematic, Re:infer
  • Анализ тональности текста использует машинное обучение и обработку естественного языка для обнаружения положительных или отрицательных эмоций в неструктурированных текстовых данных. Компании часто используют этот анализ, чтобы оценить восприятие бренда в сообщениях социальных сетей, в отзывах о продуктах и ​​в запросах службы поддержки. Примеры инструментов анализа тональности текста: IBM Watson, MonkeyLearn.
  • Тематический анализ использует обработку естественного языка для присвоения текстовым данным предварительно заданных тегов. Это полезно для организации и структурирования текстовых данных. Например, можно использовать тематический анализ для классификации отзывов службы поддержки, чтобы понять, какие направления вызывают у клиентов наибольшие проблемы. Примеры инструментов тематического анализа: Datumbox, MonkeyLearn.
  • Групповой анализ включает в себя изучение данных в группах похожих клиентов в определенные временные рамки. Вы можете отследить изменения в использовании продукта клиентами, которые подписались на извещения в один и тот же период времени. Примеры инструментов группового анализа: электронные таблицы, Looker

Выявляя закономерности, не думайте, что связь между двумя вещами всегда является причинно-следственной. Например, если вы наблюдаете значительное увеличение количества подписчиков в социальных сетях и параллельно рост числа подписок на извещения, то можете предположить, что все новые клиенты приходят из социальных сетей. Но если вы отследите данные в Google Analytics, то увидите, что очень мало людей посещают ваш сайт из социальных сетей, не говоря уже о подписке.

Предположение, что при связи между двумя вещами одна из них является причиной, называется ложной причинно-следственной связью, и это одна из самых распространенных ошибок при анализе данных. Часто есть еще один фактор, который и вызвал обнаруженную тенденцию. Поэтому найдите время, чтобы собрать достаточно информации и убедиться, что ваши выводы точны.

Сопоставьте текущие данные с прошлым периодом

Если вам сложно определить тенденции и закономерности, это может быть связано с тем, что вы обособленно рассматриваете данные. Вы не можете отследить тенденции, потому что все, что вы видите — это лишь часть чего-то большего. Вам не хватает связи с данными предыдущего периода.

Чтобы найти эту связь, сравните текущие данные с показателями прошлых периодов. Если это невозможно — например, вы просматриваете данные об использовании совершенно новой функции продукта или это ваш первый анализ — тогда взгляните на эталонные показатели вашей отрасли.

Поиск в Google по запросу «статистика работы [отдела]» или «статистика [отрасли] [отдела]» предоставит полезные контрольные показатели для различных компаний, отделов и отраслей. Тематические издания, а также исследования, представленные на конференциях, также являются хорошими источниками контрольных данных.

Например, Zendesk Benchmark позволяет компаниям сравнивать данные о работе службы поддержки клиентов со средними показателями по отрасли:

Zendesk Benchmarkэто возможность сравнить свои данные с контрольными, что поможет оценить эффективность вашей службы поддержки внутри отрасли.

Совет: если вы используете контрольные данные, может быть сложно найти компании такого же размера или уровня развития. Поэтому используйте цифры как ориентир, но не проводите прямое сравнение результатов.

Ищите данные, которые идут в разрез с вашими ожиданиями

Когда вы анализируете данные, то устанавливаете четкие цели и ожидания в отношении того, что хотите узнать и какую информацию ожидаете найти. Но это может привести к необъективности восприятия, когда вы с большей вероятностью заметите тенденции, которые подтверждают ваши существующие предположения или гипотезы.

Сохраняйте объективность, ищите тенденции или результаты, которые идут вразрез с вашими ожиданиями. Также ищите в необработанных данных выбросы. Эта практика поможет избежать избирательных выводов, которые подтверждают уже укоренившиеся убеждения.

Если вы обнаружите отклонения от нормы, изучите их глубже — здесь может быть простое объяснение. Например, ваша маркетинговая команда разослала информационное письмо, но вы не видите никакого трафика на веб-сайт. Возможно, они отправили его во внутренний тестовый список или забыли добавить UTM-параметры к ссылкам.

Также отслеживайте, насколько значительные выбросы влияют на конечные результаты. Они могут легко исказить средние значения — тогда вместо них необходимо отслеживать медиану. Она использует среднее значение числовых данных, поэтому выбросы искажают ее меньше. Возможно, понадобится полностью исключить выбросы из анализа.

Визуализируйте данные и интерпретируйте результаты

Часто легче понять и интерпретировать данные, когда они представлены визуально, а не в электронной таблице. Используйте Google Data Studio или Tableau для представления данных в виде диаграмм, графиков или других графических изображений, чтобы вы могли четко изложить результаты работы другим членам команды.

Если вы работаете с большими объемами данных, не пытайтесь одномоментно представлять слишком много информации. Зрители намного лучше воспринимают результаты анализа данных, если они будут показаны в простых диаграммах.

Следующие шаги: что делать после анализа данных

Нет смысла собирать и анализировать все эти данные, если вы ничего не делаете с полученной информацией. Используя результаты, вы можете:

  • Установить реальные цели и ключевые показатели эффективности (KPI) на основе текущих данных.
  • Улучшить качество обслуживания клиентов, так как анализ поможет понять потребности и поведение клиентов.
  • Расставить приоритеты в плане-графике развития вашего продукта на основе анализа использования продукта и запросов в службу поддержки.
  • Принимать более обдуманные и уверенные деловые решения, поскольку у вас будет четкое понимание того, что работает, а что нет.

Хотя анализ данных часто занимает много времени, важно помнить, что это не конечная цель. Вы анализируете данные, чтобы иметь возможность принимать обоснованные решения в будущем.

Давайте начнем работу

Заполните форму заявки или напишите в свободной форме. Так же мы отвечаем на телефон и в мессенджерах.