Дисциплина состоит из трех модулей: «Введение в обработку и анализ данных», «Основы баз данных» и «Основы NoSQL систем».
Модуль «Введение в обработку и анализ данных» включает лекции о представлении данных, способах визуализации данных и разведочном анализе. Особое внимание уделяется анализу временных рядов, приемам сглаживания, определения трендов, построения моделей периодических временных рядов.
Модуль «Основы баз данных» посвящен организации современных баз данных. Подробно рассматриваются вопросы проектирования данных в реляционной модели, составление запросов на языке SQL.
Модуль «NoSQL-системы» освещает вопросы, связанные с организацией слабоструктурированных и неструктурированных данных. Слушатели знакомятся с технологиями, характерными для этих систем, их классификацией и учатся работать с наиболее популярными хранилищами: «ключ-значение», документными, колоночными и графовыми.
В ходе изучения дисциплины на продвинутом уровне студенты научатся создавать свои собственные хранилища данных, наполнять хранилища структурами для хранения и поддержки согласованности данных, писать эффективные запросы к данным и управлять механизмом транзакций. Для создания таких хранилищ будет доступен облачный сервис СУБД Postgres Pro Enterprise.
Трудоемкость дисциплины: 3 зачетные единицы
Язык реализации: русский
Форма контроля: Зачет по результатам выполнения онлайн-упражнений курса