Следующий раздел: Статистический анализ данных

Вернуться в раздел: Исследовательский анализ данных

Вернуться в оглавление: Я.Практикум

Заключение

Поздравляем! Вы прошли длинный путь: от общего представления о данных до чёткого понимания, какие из них надёжные, а какие — нет. Научились проверять их на каждом этапе, смотреть типичные значения, выбросы и распределения.

Ключевая задача курса решена: вычислили, сколько времени водители тратят на заправку в каждой сети АЗС. Несмотря на довольно серьёзные проблемы в исходных данных, вы составили рейтинг станций и сформировали баг-репорт. Когда коллеги вернут очищенные данные, ваши выводы станут точнее, но методика уже есть!

Образовательные результаты

В начале курса вы ставили себе цели. Проверьте, удалось ли их достичь.

Вы научились:

  • строить графики различными методами: hist(), boxplot(), plot();
  • получать срезы данных;
  • выборочно менять значения методом where();
  • присваивать значения по индексам и строкам;
  • объединять данные методом join();
  • определять и интерпретировать взаимосвязи различных данных;
  • автоматизировать процесс построения графиков.

Вопросы для самопроверки

  • Какие инструменты для первичного знакомства с данными вы знаете?
  • Какими способами объединяют данные?
  • Какими методами изучают взаимосвязи величин?
  • Какие существуют способы получения среза данных и какой из них используется в различных случаях?
  • Как поменять значения выборочно?

Дополнительные материалы

Что дальше

Аналитик работает с большим количеством гипотез, которые проверяются статистическими методами. В специальных курсах мы расскажем, как статистика и теория вероятностей помогают решать задачи бизнеса.

Обратная связь

image Привет! На связи команда разработки курса «Специалист по Data Science».

Чтобы этот курс появился, а вам было интересно и удобно его проходить, потребовалась сплочённая работа многих людей. С кем-то из команды вы уже знакомы, например с кураторами, наставниками и преподавателями. За работу платформы и качество уроков отвечают отдельные специалисты. Расскажем о некоторых из них.

За развитием курса следит менеджер продукта. Вместе с экспертами он проводит исследования, чтобы программа соответствовала запросам работодателей. Поддерживать актуальность курса помогает и контент-продюсер, который проследит, чтобы новые материалы были качественными и появились вовремя.

Менеджер платформы отвечает за тренажёр и вместе с командой разработки проектирует новые функции. Команды контента и платформы регулярно получают отзывы от менеджера фидбэка, который собирает обратную связь от студентов. Отзывы помогают оперативно решать проблемы и улучшать продукт.

Работая с отдельными запросами, мы не всегда понимаем, что нужно сделать в первую очередь, а что — на время отложить. Поэтому мы хотим узнать о вашем опыте из первых рук.

Пожалуйста, ответьте на несколько вопросов. Будем благодарны за честные ответы.

Следующий раздел: Статистический анализ данных

Вернуться в раздел: Исследовательский анализ данных

Вернуться в оглавление: Я.Практикум