При получении вами критического (красного) замечания по проекту, проведу правки.
Не можешь оплатить, тогда через "Помощь" запроси другую систему оплаты (Webmoney, Alipay, Telegram (USDT, TON)).
Описание проекта: телекоммуникации
Оператор связи «ТелеДом» хочет бороться с оттоком клиентов. Для этого его сотрудники начнут предлагать промокоды и специальные условия всем, кто планирует отказаться от услуг связи. Чтобы заранее находить таких пользователей, «ТелеДому» нужна модель, которая будет предсказывать, разорвёт ли абонент договор. Команда оператора собрала персональные данные о некоторых клиентах, информацию об их тарифах и услугах. Ваша задача — обучить на этих данных модель для прогноза оттока клиентов.
Описание услуг
Оператор предоставляет два основных типа услуг:
- Стационарную телефонную связь. Телефон можно подключить к нескольким линиям одновременно.
- Интернет. Подключение может быть двух типов: через телефонную линию (DSL, от англ. digital subscriber line — «цифровая абонентская линия») или оптоволоконный кабель (Fiber optic).
Также доступны такие услуги:
- Интернет-безопасность: антивирус (DeviceProtection) и блокировка небезопасных сайтов (OnlineSecurity);
- Выделенная линия технической поддержки (TechSupport);
- Облачное хранилище файлов для резервного копирования данных (OnlineBackup);
- Стриминговое телевидение (StreamingTV) и каталог фильмов (StreamingMovies).
Клиенты могут платить за услуги каждый месяц или заключить договор на 1–2 года. Возможно оплатить счёт разными способами, а также получить электронный чек.
Описание данных
Данные состоят из нескольких файлов, полученных из разных источников:
contract_new.csv
— информация о договоре;personal_new.csv
— персональные данные клиента;internet_new.csv
— информация об интернет-услугах;phone_new.csv
— информация об услугах телефонии.
Файл contract_new.csv
customerID
— идентификатор абонента;BeginDate
— дата начала действия договора;EndDate
— дата окончания действия договора;Type
— тип оплаты: раз в год-два или ежемесячно;PaperlessBilling
— электронный расчётный лист;PaymentMethod
— тип платежа;MonthlyCharges
— расходы за месяц;TotalCharges
— общие расходы абонента.
Файл personal_new.csv
customerID
— идентификатор пользователя;gender
— пол;SeniorCitizen
— является ли абонент пенсионером;Partner
— есть ли у абонента супруг или супруга;Dependents
— есть ли у абонента дети.
Файл internet_new.csv
customerID
— идентификатор пользователя;InternetService
— тип подключения;OnlineSecurity
— блокировка опасных сайтов;OnlineBackup
— облачное хранилище файлов для резервного копирования данных;DeviceProtection
— антивирус;TechSupport
— выделенная линия технической поддержки;StreamingTV
— стриминговое телевидение;StreamingMovies
— каталог фильмов.
Файл phone_new.csv
customerID
— идентификатор пользователя;MultipleLines
— подключение телефона к нескольким линиям одновременно.
Во всех файлах столбец customerID
содержит код клиента. Информация о договорах актуальна на 1 февраля 2020 года.
Данные также находятся в тренажёре, в папке /datasets/
.
План работы
Позади много пройденных уроков, вы уже выпускники! Уверены, что вы умеете выделять основные этапы работы и следовать намеченному плану. Тем не менее оставим вам краткий план, который вы сможете дополнить необходимыми, на ваш взгляд, нюансами.
Шаг 1. Загрузка данных
Загрузите данные и выполните их первичный осмотр.
Шаг 2. Исследовательский анализ и предобработка данных
Выполните исследовательский анализ каждого датафрейма и при необходимости выполните предобработку. Сделайте выводы об имеющихся признаках: понадобятся ли они для обучения моделей.
Шаг 3. Объединение данных
Объедините выбранные вами признаки в один датафрейм по ключу.
Шаг 4. Исследовательский анализ и предобработка данных объединённого датафрейма
Выполните исследовательский анализ объединённого датафрейма, визуализируйте распределения признаков и при необходимости выполните предобработку. Проведите корреляционный анализ. Напоминаем, что вы можете использовать не только имеющиеся признаки, но и генерировать новые.
Шаг 5. Подготовка данных
Выполните подготовку данных для обучения модели. Разделите данные на две выборки, при масштабировании и кодировании учитывайте особенности данных и моделей.
Шаг 6. Обучение моделей машинного обучения
Обучите как минимум две модели. Хотя бы для одной из них подберите как минимум два гиперпараметра.
Шаг 7. Выбор лучшей модели
Выберите лучшую модель и проверьте её качество на тестовой выборке.
Шаг 8. Общий вывод и рекомендации заказчику
Сделайте общий вывод о проделанной работе: опишите основные этапы работы, полученные результаты и дайте рекомендации для бизнеса.
Дорогой друг!
Я внимательно наблюдал за твоими действиями на сайте через вебвизор.
Если ты добрался до этой страницы, то скорее всего ты проходишь платное обучение на курсах.
Благодаря моим стараниям, целую главу ты можешь закрыть за сутки, а то и быстрее.
Думаю, что сэкономленное время, ты потратил с пользой, в то время как я сидел и пыхтел над заданиями.
Лучшая благодарность от тебя, это пожертвования на мой IT - проект.
Жертвуй столько, сколько не жалко, но и не скупись, чтобы было не стыдно.
Большое тебе спасибо, за твою благодарность!