Data science: Основы анализа данных (ДПО)

Преподаватель: Рогальский Андрей Владиславович
Кафедра: Цифровая кафедра НОИ «Институт Медицинских Технологий»
Должность: Руководитель проекта «Цифровая кафедра» МГМСУ

Лекций: 29

Объем программы, часов: 250

ОПИСАНИЕ ДИСЦИПЛИНЫ

Данная программа адресована специальностям и направлениям подготовки, не отнесенным к ИТ-сфере.

Обучение на программе позволит вам повысить профессиональный уровень в области ведения аналитической деятельности посредством использования современных инструментов сбора, подготовки, обработки и анализа больших объемов разнородных данных, а также разработки стратегии и рекомендаций для сферы здравоохранения.

В результате прохожения программы вы приобретете компетенции, необходимые для выполнения нового вида профессиональной деятельности в области информационных технологий: «Создание и применение технологий больших данных».

Получаемая квалификация: Специалист по анализу больших данных с использованием существующей в организации методологической и технологической инфраструктуры.

ПРОГРАММА ДИСЦИПЛИНЫ

Модуль 1. Основы анализа (40 ак. часов) - завершается промежуточной аттестацией

Тема 1.1. Основы анализа. Выборки

Тема 1.2. Основы статистики

Тема 1.3. Основы анализа. Корреляция и регрессия

Тема 1.4. Основы анализа. Алгоритмы и прогнозирование

Тема 1.5. Визуализация в Студии данных (Yandex DataLens, сбор информации, отчётность и составление прогнозов)

 

Модуль 2. SQL и получение данных (40 ак. часов) - завершается промежуточной аттестацией

Тема 2.1. СУБД. Введение в SQL

Тема 2.2. Создание и удаление таблиц. Ограничение значений данных

Тема 2.3. Ввод, удаление и изменение данных. SQL – запросы

Тема 2.4. Сложные запросы.

Тема 2.5. Представления. Оконная функция.

Тема 2.6. Проектирование баз данных.

 

Модуль 3. Python для анализа данных (50 ак. часов) - завершается промежуточной аттестацией

Тема 4.1. Основы системы управления версиями Git. Основы Python.

Тема 4.2. Библиотека pandas.

Тема 4.3. Библиотека numpy.

Тема 4.4. Основы парсинга.

 

Модуль 4. Метрики данных (20 ак. часов) - завершается промежуточной аттестацией

Тема 3.1. Метрики данных, используемые в здравоохранении (Типы данных, их отличия и особенности. Модели медицинских данных (FHIR, стандарт HL). Продуктовые метрики данных).

Тема 3.2. Когортный анализ.

 

Модуль 5. Статистика в Python (40 ак. часов) - завершается промежуточной аттестацией

Тема 5.1. Визуализация в Python. Методы визуализации данных. Практикум по matplotlib.

Тема 5.2. Дескриптивная статистика и разведочный анализ данных в Python. Корреляция. Практикум по SciPy.

Тема 5.3. A/B тестирование.

Тема 5.4. Работа с временными рядами в Python.

 

Модуль 6. Машинное обучение (50 ак. часов) - завершается промежуточной аттестацией

Тема 6.1. Введение в машинное обучение. Обучение с учителем/без учителя.

Тема 6.2. Библиотека Scikit-learn.

Тема 6.3. NoSQL-подход к работе с большими данными.

Тема 6.4. Кластеризация

Тема 6.5. Большие данные. Hadoop и Spark

Тема 6.6. Анализ больших данных. PySpark

 

Для доступа к лекциям, видео и текстовым материалам - Вам необходим личный кабинет учащегося.

«Клиническая медицина и медицинские технологии»
16-17 мая 2023 года форум университетской науки – 2023