Следующий раздел: Статистический анализ данных
Вернуться в раздел: Исследовательский анализ данных
Вернуться в оглавление: Я.Практикум
Заключение
Поздравляем! Вы прошли длинный путь: от общего представления о данных до чёткого понимания, какие из них надёжные, а какие — нет. Научились проверять их на каждом этапе, смотреть типичные значения, выбросы и распределения.
Ключевая задача курса решена: вычислили, сколько времени водители тратят на заправку в каждой сети АЗС. Несмотря на довольно серьёзные проблемы в исходных данных, вы составили рейтинг станций и сформировали баг-репорт. Когда коллеги вернут очищенные данные, ваши выводы станут точнее, но методика уже есть!
Образовательные результаты
В начале курса вы ставили себе цели. Проверьте, удалось ли их достичь.
Вы научились:
- строить графики различными методами:
hist()
,boxplot()
,plot()
; - получать срезы данных;
- выборочно менять значения методом
where()
; - присваивать значения по индексам и строкам;
- объединять данные методом
join()
; - определять и интерпретировать взаимосвязи различных данных;
- автоматизировать процесс построения графиков.
Вопросы для самопроверки
- Какие инструменты для первичного знакомства с данными вы знаете?
- Какими способами объединяют данные?
- Какими методами изучают взаимосвязи величин?
- Какие существуют способы получения среза данных и какой из них используется в различных случаях?
- Как поменять значения выборочно?
Дополнительные материалы
- Книги:
- Уэс Маккинни «Python и анализ данных. 3-е издание»
- Материалы:
Что дальше
Аналитик работает с большим количеством гипотез, которые проверяются статистическими методами. В специальных курсах мы расскажем, как статистика и теория вероятностей помогают решать задачи бизнеса.
Обратная связь
Привет! На связи команда разработки курса «Специалист по Data Science».
Чтобы этот курс появился, а вам было интересно и удобно его проходить, потребовалась сплочённая работа многих людей. С кем-то из команды вы уже знакомы, например с кураторами, наставниками и преподавателями. За работу платформы и качество уроков отвечают отдельные специалисты. Расскажем о некоторых из них.
За развитием курса следит менеджер продукта. Вместе с экспертами он проводит исследования, чтобы программа соответствовала запросам работодателей. Поддерживать актуальность курса помогает и контент-продюсер, который проследит, чтобы новые материалы были качественными и появились вовремя.
Менеджер платформы отвечает за тренажёр и вместе с командой разработки проектирует новые функции. Команды контента и платформы регулярно получают отзывы от менеджера фидбэка, который собирает обратную связь от студентов. Отзывы помогают оперативно решать проблемы и улучшать продукт.
Работая с отдельными запросами, мы не всегда понимаем, что нужно сделать в первую очередь, а что — на время отложить. Поэтому мы хотим узнать о вашем опыте из первых рук.
Пожалуйста, ответьте на несколько вопросов. Будем благодарны за честные ответы.
Следующий раздел: Статистический анализ данных
Вернуться в раздел: Исследовательский анализ данных
Вернуться в оглавление: Я.Практикум