Следующая тема:  САД. Комбинаторика

Вернуться в раздел: Статистический анализ данных

Вернуться в оглавление: Я.Практикум

 

В теме:

1.  Введение

2.  Описание проекта

Описание проекта

Кратко:
  • Продолжительность поездок округлена с помощью np.ceil() библиотеки numpy.
  • Помесячная выручка рассчитывается по формуле: (стоимость старта + стоимость одной минуты + стоимость подписки).
  • Вы можете использовать нормальную аппроксимацию биномиального распределения и cdf() для быстрой оценки.
  • Аналитик должен проанализировать данные о пользователях и их поездках.
  • Шаг 6: проверка гипотез, увеличение количества пользователей с подпиской, оптимизация расстояния поездок и помесячной выручки.
  • Шаг 7: акции с раздачей промокодов и оценка вероятности открытия push-уведомлений
 
Вы аналитик популярного сервиса аренды самокатов GoFast. Вам передали данные о некоторых пользователях из нескольких городов, а также об их поездках. Проанализируйте данные и проверьте некоторые гипотезы, которые могут помочь бизнесу вырасти.
 
Чтобы совершать поездки по городу, пользователи сервиса GoFast пользуются мобильным приложением. Сервисом можно пользоваться:
  • без подписки
    • абонентская плата отсутствует;
    • стоимость одной минуты поездки — 8 рублей;
    • стоимость старта (начала поездки) — 50 рублей;
  • с подпиской Ultra
    • абонентская плата — 199 рублей в месяц;
    • стоимость одной минуты поездки — 6 рублей;
    • стоимость старта — бесплатно.

Описание данных

В основных данных есть информация о пользователях, их поездках и подписках.
Пользователи — users_go.csv
 
   
user_id уникальный идентификатор пользователя
name имя пользователя
age возраст
city город
subscription_type тип подписки (free, ultra)
 
Поездки — rides_go.csv
 
   
user_id уникальный идентификатор пользователя
distance расстояние, которое пользователь проехал в текущей сессии (в метрах)
duration продолжительность сессии (в минутах) — время с того момента, как пользователь нажал кнопку «Начать поездку» до момента, как он нажал кнопку «Завершить поездку»
date дата совершения поездки
 
Подпискиsubscriptions_go.csv
 
   
subscription_type тип подписки
minute_price стоимость одной минуты поездки по данной подписке
start_ride_price стоимость начала поездки
subscription_fee стоимость ежемесячного платежа
 
 
Подсказка
import numpy as np
# каждое значение из столбца duration округляется с помощью «потолка»: 
rides_df['duration'] = np.ceil(rides_df['duration']) 
Помесячная выручка считается по формуле: (стоимость старта поездки × количество поездок) + стоимость одной минуты поездки × общая продолжительность всех поездок в минутах) + стоимость подписки.
 
Подсказка
 
Подсказка
 

Следующая тема:  САД. Комбинаторика

Вернуться в раздел: Статистический анализ данных

Вернуться в оглавление: Я.Практикум