Дисциплины на выбор:
Первичная обработка данных и Элементы статистики
Дисциплина состоит из двух разделов:
- Раздел "Первичная обработка данных" научит базовым приемам работы с данными – виды и источники данных, оценка и улучшение качества данных, преобразование и подготовка данных к разведочному анализу. Изучаются методы визуализации данных, описательные статистики, методы нормировки данных, построение целевых функций и работа с временными рядами. Рассматриваются современные методы хранения больших базы данных, проектирование данных в реляционной модели, составление запросов на языке SQL.
- Раздел "Элементы статистики" знакомит с практическими навыками статистической обработки данных, которые могут быть применены для решения аналитических задач и в личной, и в профессиональной сфере. Рассматриваются важнейшие понятия теории вероятностей, на которых основаны многие статистические конструкции и выводы. Повествуется о том, что такое случайное событие и случайная величина, обсуждается построение функции распределения и вычисление вероятности наступления различных событий, рассматриваются важнейшие распределения, встречающиеся в жизни на каждом шагу. Также приводятся примеры работы с выборкой и оценки важнейших параметров генеральной совокупности таких, как: математическое ожидание, дисперсия, плотность распределения, корреляция двух случайных величин, а также свойства этих оценок. Кроме того, студенты научатся построению доверительных интервалов для оценок параметров различных распределений: слушатели узнают, насколько оценки, полученные по выборке, точны, и пригодно ли их использовать в реальных задачах. В завершении рассматривается важнейшая задача проверки гипотез, где основное внимание обращается на критерии согласия.
Первичная обработка данных и Статистика на R
Дисциплина состоит из двух разделов:
- Раздел "Первичная обработка данных" научит базовым приемам работы с данными – виды и источники данных, оценка и улучшение качества данных, преобразование и подготовка данных к разведочному анализу. Изучаются методы визуализации данных, описательные статистики, методы нормировки данных, построение целевых функций и работа с временными рядами. Рассматриваются современные методы хранения больших базы данных, проектирование данных в реляционной модели, составление запросов на языке SQL.
- Раздел "Статистика на R" предлагает рассмотрение некоторых практических навыков статистической обработки данных с использованием языка программирования R, которые могут быть применены для решения аналитических задач и в личной, и в профессиональной сфере. В разделе рассматриваются важнейшие понятия теории вероятностей, на которых основаны многие статистические конструкции и выводы. Повествуется о том, что такое случайное событие и случайная величина, обсуждается построение функции распределения и вычисление вероятности наступления различных событий, рассматриваются важнейшие распределения, встречающиеся в жизни на каждом шагу. Также приводятся примеры работы с выборкой и оценки важнейших параметров генеральной совокупности таких, как: математическое ожидание, дисперсия, плотность распределения, корреляция двух случайных величин, а также свойства этих оценок. Кроме того, студенты научатся построению доверительных интервалов для оценок параметров различных распределений: слушатели узнают, насколько оценки, полученные по выборке, точны, и пригодно ли их использовать в реальных задачах. В завершении рассматривается важнейшая задача проверки гипотез, где основное внимание обращается на критерии согласия.
Хранение больших данных и Элементы статистики
Дисциплина состоит из двух разделов:
- Раздел "Хранение больших данных" научит организовывать хранение больших данных с помощью реляционных СУБД и NoSQL хранилищ. Изучаются методы проектирования структур данных, языки запросов к данным и приемы обработки структурированных и слабоструктурированных данных.
- Раздел "Элементы статистики" предлагает рассмотрение некоторых практических навыков статистической обработки данных, которые могут быть применены для решения аналитических задач и в личной, и в профессиональной сфере. В разделе рассматриваются важнейшие понятия теории вероятностей, на которых основаны многие статистические конструкции и выводы. Повествуется о том, что такое случайное событие и случайная величина, обсуждается построение функции распределения и вычисление вероятности наступления различных событий, рассматриваются важнейшие распределения, встречающиеся в жизни на каждом шагу. Также приводятся примеры работы с выборкой и оценки важнейших параметров генеральной совокупности таких, как: математическое ожидание, дисперсия, плотность распределения, корреляция двух случайных величин, а также свойства этих оценок. Кроме того, студенты научатся построению доверительных интервалов для оценок параметров различных распределений: слушатели узнают, насколько оценки, полученные по выборке, точны, и пригодно ли их использовать в реальных задачах. В завершении рассматривается важнейшая задача проверки гипотез, где основное внимание обращается на критерии согласия.