Спринт 18/24 → Тема 5/5: Заключение → Урок 1/2

Кратко:
  • Курс «Машинное обучение для текстов» завершен.
  • Слушатели научились рассчитывать значения TF-IDF и создавать признаки из текстов с помощью модели BERT.
  • Были рассмотрены задачи обработки естественных языков и подходы к ним.
  • Для закрепления пройденных тем предложены дополнительные материалы.
  • Рекомендуются книги: Ф.Шолле | Глубокое обучение на Python и Б. Бенгфорт, Р. Билбро, Т. Охеда | Прикладной анализ текстовых данных на Python.
  • Также рекомендуются материалы: Хабр, Jay Alammar | Как и зачем применяют эмбеддинги в машинном обучении? и Хабр, Jay Alammar | Как модели используют механизм внимания для повышения скорости обучения?.
Заключение

Поздравляем! Курс «Машинное обучение для текстов» завершён.

Вы научились:

  • Рассчитывать значения TF-IDF.
  • Моделью BERT создавать признаки из текстов.
  • На текстах обучать модели машинного обучения.

Дополнительные материалы

Обработка естественных языков — это область с огромным количеством задач и подходов. В одном спринте мы не можем охватить все, поэтому составили список материалов. Если вы прочитаете следующие статьи, то закрепите пройденные темы и узнаете что-то интересное и новое.

Книги:

  • Ф.Шолле | Глубокое обучение на Python, Глава 6. Глубокое обучение для текста и последовательностей.
  • Б. Бенгфорт, Р. Билбро, Т. Охеда | Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка.

Материалы:

 

Спринт 18/24 → Тема 5/5: Заключение → Урок 2/2

Обратная связь

image

Привет! На связи команда разработки курсов «Специалист по Data Science».

Чтобы этот курс появился, а вам было интересно и удобно его проходить, потребовалась сплочённая работа многих людей. С кем-то из команды вы уже знакомы, например с кураторами, наставниками и преподавателями. За работу платформы и качество уроков отвечают отдельные специалисты. Расскажем о некоторых из них.

За развитием курса следит менеджер продукта. Вместе с экспертами он проводит исследования, чтобы программа соответствовала запросам работодателей. Поддерживать актуальность курса помогает и контент-продюсер, который проследит, чтобы новые материалы были качественными и появились вовремя.

Менеджер платформы отвечает за тренажёр и вместе с командой разработки проектирует новые функции. Команды контента и платформы регулярно получают отзывы от менеджера фидбэка, который собирает обратную связь от студентов. Отзывы помогают оперативно решать проблемы и улучшать продукт.

Работая с отдельными запросами, мы не всегда понимаем, что нужно сделать в первую очередь, а что — на время отложить. Поэтому мы хотим узнать о вашем опыте из первых рук.

Пожалуйста, ответьте на несколько вопросов. Будем благодарны за честные ответы.