Преподаватель: Рогальский Андрей Владиславович Кафедра: Цифровая кафедра НОИ «Институт Медицинских Технологий» Должность: Руководитель проекта «Цифровая кафедра» МГМСУ
Лекций: 29
Объем программы, часов: 250
Data science: Основы анализа данных (ДПО)
Преподаватель: Рогальский Андрей Владиславович Кафедра: Цифровая кафедра НОИ «Институт Медицинских Технологий» Должность: Руководитель проекта «Цифровая кафедра» МГМСУ
Лекций: 29
Объем программы, часов: 250
Данная программа адресована специальностям и направлениям подготовки, не отнесенным к ИТ-сфере.
Обучение на программе позволит вам повысить профессиональный уровень в области ведения аналитической деятельности посредством использования современных инструментов сбора, подготовки, обработки и анализа больших объемов разнородных данных, а также разработки стратегии и рекомендаций для сферы здравоохранения.
В результате прохожения программы вы приобретете компетенции, необходимые для выполнения нового вида профессиональной деятельности в области информационных технологий: «Создание и применение технологий больших данных».
Получаемая квалификация: Специалист по анализу больших данных с использованием существующей в организации методологической и технологической инфраструктуры.
Модуль 1. Основы анализа (40 ак. часов) - завершается промежуточной аттестацией
Тема 1.1. Основы анализа. Выборки
Тема 1.2. Основы статистики
Тема 1.3. Основы анализа. Корреляция и регрессия
Тема 1.4. Основы анализа. Алгоритмы и прогнозирование
Тема 1.5. Визуализация в Студии данных (Yandex DataLens, сбор информации, отчётность и составление прогнозов)
Модуль 2. SQL и получение данных (40 ак. часов) - завершается промежуточной аттестацией
Тема 2.1. СУБД. Введение в SQL
Тема 2.2. Создание и удаление таблиц. Ограничение значений данных
Тема 2.3. Ввод, удаление и изменение данных. SQL – запросы
Тема 2.4. Сложные запросы.
Тема 2.5. Представления. Оконная функция.
Тема 2.6. Проектирование баз данных.
Модуль 3. Python для анализа данных (50 ак. часов) - завершается промежуточной аттестацией
Тема 4.1. Основы системы управления версиями Git. Основы Python.
Тема 4.2. Библиотека pandas.
Тема 4.3. Библиотека numpy.
Тема 4.4. Основы парсинга.
Модуль 4. Метрики данных (20 ак. часов) - завершается промежуточной аттестацией
Тема 3.1. Метрики данных, используемые в здравоохранении (Типы данных, их отличия и особенности. Модели медицинских данных (FHIR, стандарт HL). Продуктовые метрики данных).
Тема 3.2. Когортный анализ.
Модуль 5. Статистика в Python (40 ак. часов) - завершается промежуточной аттестацией
Тема 5.1. Визуализация в Python. Методы визуализации данных. Практикум по matplotlib.
Тема 5.2. Дескриптивная статистика и разведочный анализ данных в Python. Корреляция. Практикум по SciPy.
Тема 5.3. A/B тестирование.
Тема 5.4. Работа с временными рядами в Python.
Модуль 6. Машинное обучение (50 ак. часов) - завершается промежуточной аттестацией
Тема 6.1. Введение в машинное обучение. Обучение с учителем/без учителя.
Тема 6.2. Библиотека Scikit-learn.
Тема 6.3. NoSQL-подход к работе с большими данными.
Тема 6.4. Кластеризация
Тема 6.5. Большие данные. Hadoop и Spark
Тема 6.6. Анализ больших данных. PySpark
Для доступа к лекциям, видео и текстовым материалам - Вам необходим личный кабинет учащегося.