Семестр 1. Введение в машинное обучение (Python) и Продвинутое машинное обучение (Python)
Дисциплина состоит из двух разделов:
- Раздел "Введение в машинное обучение (Python)" знакомит слушателей с видами машинного обучения, демонстрирует практические примеры решения задач при помощи методов машинного обучения с использованием языка программирования Python. Основное внимание уделяется решению задач регрессии, задачам классификации и кластеризации.
- Раздел "Продвинутое машинное обучение(Python)" знакомит слушателей с методами снижения размерности набора признаков и методами факторного анализа. Рассматривается метод опорных векторов и деревья принятия решений, ансамбли моделей, а также еще одна ветка машинного обучения — обучение с подкреплением.
Трудоемкость дисциплины: 3 зачетные единицы
Форма контроля: Экзамен
Семестр 2. Автоматическая обработка текстов и Социальные сети
Дисциплина состоит из двух разделов:
- Раздел знакомит слушателей с алгоритмами и инструментами для обработки текстов на естественном языке. После краткого введения в историю области рассматриваются подходы, работающие с языком на разных уровнях: от токенизации до синтаксического разбора. Основное внимание уделено подходам, которые работают с данными на основе машинного обучения. По окончании раздела студенты будут иметь представление о ландшафте методов современного автоматического анализа текста и опыт использования нескольких наиболее важных инструментов. В том числе pymorphy2, mystem, NLTK, scikit-learn, UDPipe и др.
- Раздел "Социальные сети" рассматривает виды социальных сетей, задачи анализа и классификации. Слушатели познакомятся с методами извлечения и агрегирования информации из социальных сетей. Научатся решать различного рода задачи, в том числе предложение друзей для пользователя, поиск негативных высказываний, поиск упоминаний компаний и людей.
Пререквизиты: умение работать с векторами и матрицами, представление о графах и распределениях. Умение программировать на языке Python (функции, циклы, операторы)
Трудоемкость дисциплины: 3 зачетные единицы
Форма контроля: Экзамен