1. Предобработка данных

2. Проектная работа

 

Вернуться в раздел: "Предобработка данных".

1. Предобработка данных

Добро пожаловать на курс по предобработке данных.

Получаемые аналитиком данные не всегда соответствуют ожидаемому уровню качества. Человеческий фактор, ошибки системы или процесса выгрузки могут «испортить» их, то есть сделать непригодными для анализа.

На этом курсе вы научитесь оценивать, подходят ли данные для проверки гипотезы. Такая оценка — первое действие в алгоритме решения аналитических задач. Ваши цели:

  • узнать методы обработки пропусков;
  • научиться преобразовывать один тип данных в другой;
  • определять дубликаты и обрабатывать их различными способами;
  • понять, как разделять данные на категории.

Хотите проверить, достигли ли вы поставленных целей? Попробуйте объяснить далёкому от анализа человеку понятия и инструменты курса. Если получилось, значит вы усвоили материал и можете двигаться дальше.

В тренажёре вы решите кейсы от команды Яндекс.Маркета. На практике изучите методы и библиотеки, необходимые для ответа на аналитические вопросы.

В конце вас ожидает самостоятельный проект. В проекте вы познакомитесь с банковской аналитикой и проверите гипотезу того, что семейное положение и количество детей клиента влияет на вероятность возврата кредита в срок.

Этот курс средней сложности. Третья тема может показаться самой сложной — в ней много терминологии.

Знания из вводной части пригодятся вам для решения новых задач. Держите шпаргалки под рукой.

2. Проектная работа
 
Добро пожаловать на курс по предобработке данных.

Получаемые аналитиком данные не всегда соответствуют ожидаемому уровню качества. Человеческий фактор, ошибки системы или процесса выгрузки могут «испортить» их, то есть сделать непригодными для анализа.

На этом курсе вы научитесь оценивать, подходят ли данные для проверки гипотезы. Такая оценка — первое действие в алгоритме решения аналитических задач. Ваши цели:

  • узнать методы обработки пропусков;
  • научиться преобразовывать один тип данных в другой;
  • определять дубликаты и обрабатывать их различными способами;
  • понять, как разделять данные на категории.

Хотите проверить, достигли ли вы поставленных целей? Попробуйте объяснить далёкому от анализа человеку понятия и инструменты курса. Если получилось, значит вы усвоили материал и можете двигаться дальше.

В тренажёре вы решите кейсы от команды Яндекс.Маркета. На практике изучите методы и библиотеки, необходимые для ответа на аналитические вопросы.

В конце вас ожидает самостоятельный проект. В проекте вы познакомитесь с банковской аналитикой и проверите гипотезу того, что семейное положение и количество детей клиента влияет на вероятность возврата кредита в срок.

Этот курс средней сложности. Третья тема может показаться самой сложной — в ней много терминологии.

Знания из вводной части пригодятся вам для решения новых задач. Держите шпаргалки под рукой.

Вернуться в раздел: "Предобработка данных".

Следующий раздел: "ПД. Работа с пропусками".