Web-studio46.ru

Обучение и образование
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Открытый курс машинного обучения тема 4

Основы машинного обучения

  • 11 недель

от 5 до 8 часов в неделю

понадобится для освоения

4 зачётных единицы

для зачета в своем вузе

Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Курс пригодится всем, кто хочет «с нуля» погрузиться в область машинного обучения, получить первые практические навыки и начать применять их для решения собственных задач по извлечению пользы из данных.

О курсе

Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Практика проходит на языке Python и основана на библиотеках pandas, matplotlib, scikit-learn. Для успешного прохождения курса требуются знания математики на уровне школьных курсов, а также навыки программирования на Python. Контроль на курсе представлен в виде заданий на программирования, заданий на построение выводов (проверяются с помощью взаимного оценивания), а также тестов на знание теоретического материала.

Формат

Курс состоит из 11 недель, каждая включает в себя несколько коротких видеолекций (суммарная продолжительность — от 60 до 90 минут), тест на знание теоретического материала (5-15 вопросов), а также тест, включающий в себя выполнение задания по программированию. На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестов.

Информационные ресурсы

Python, библиотеки numpy, pandas, matplotlib, seaborn, scikit-learn

Требования

Освоение школьного курса математики, навыки программирования на Python

Программа курса

  1. Основные понятия и задачи в машинном обучении
  2. Метод k ближайших соседей
  3. Линейная регрессия
  4. Градиентный спуск
  5. Линейная классификация
  6. Логистическая регрессия и метод опорных векторов
  7. Решающие деревья
  8. Бэггинг и случайный лес
  9. Градиентный бустинг
  10. Обучение без учителя
  11. Рекомендательные системы

Поделиться

  • 11 недель

от 5 до 8 часов в неделю

понадобится для освоения

4 зачётных единицы

для зачета в своем вузе

Соколов Евгений Андреевич

Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска

Зимовнов Андрей Вадимович

Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска

Ковалев Евгений Игоревич

Должность: Приглашенный преподаватель факультета компьютерных наук

Кохтев Вадим Михайлович

Должность: Приглашенный преподаватель факультета компьютерных наук

Рысьмятова Анастасия Александровна

Должность: Приглашенный преподаватель факультета компьютерных наук

Филатов Артём Андреевич

Должность: Приглашенный преподаватель факультета компьютерных наук

Практический Machine Learning

Курс включает в себя 10 модулей, более 500 упражнений на закрепление материала, обучение 10 алгоритмов ML, два хакатона на kaggle, чат с сообществом и поддержку менторов

Каждая тема разбирается в видео, скринкастах и конспектах и закрепляется десятками упражнений (тесты, дебаггинг кода, проверка кода студента)

По каждой теме вы работаете с моделью ML — файнтьюните, создаёте с нуля, оптимизируете, пробуете разные методы

● Сообщество и ментор

На курсе вы не останетесь один на один с затруднениями — вам помогут не только ваши одногруппники, но и ментор курса. С такой поддержкой вы не бросите обучение на пол пути

Модуль 1 Введение в машинное обучение

— Введение в машинное обучение. Типы алгоритмов

— Какие бизнес-задачи решает машинное обучение — и какие нет

— Обзор кейсов по внедрению машинного обучения: анализ алгоритмов и использованных решений

— Этапы решения задач машинного обучения:

● Моделирование (обучение модели)

— Задачи на закрепление темы: тесты, проверка кода

— Практика: реализация этапов машинного обучения на примере готовой модели

Модуль 2 Методы предобработки данных

— Типы данных и их проблемы

● Типы данных: табличные, текстовые, временные ряды, аудиосигналы, изображения, видео и другие

● Проблемы с данными: пропуски, неподходящий формат, мусор в данных, зашифрованные данные, проблема с разметкой и прочее

— Работа с пропусками и начальная обработка

● Работа с пропусками и дублями

● Нормализация данных по min, max, std

● Удаление столбцов и строк

● Проверка правильности типа данных

Читать еще:  Аннотация к видеоролику в конкурсе

— Визуализация для предобработки

● Создание признаков вручную

● Признаки даты и времени

● Статистики по наборам признаков

● Поиск и удаление по порогу

● Поиск по отклонению / распределению

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: работа с параметрами модели

Модуль 3 Регрессия

— Линейная регрессия. Задачи регрессии и примеры использования в бизнесе

— Математический вывод линейной регрессии. Возможные ошибки в работе алгоритма

— Обучение модели линейной регрессии

— Методы нахождения прямой в регрессии

● Аналитический вывод для одной переменной

● Аналитический вывод для многих переменных

● Примеры использования в решении жизненных задач

● Решение задачи с помощью градиентного спуска

● Обучение модели логистической регрессии

● Сравнение производительности разных методов

● Использование матричных операций

● Преобразование линейной модели

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: обучение и оптимизация моделей линейной и логистической регрессии

Модуль 4 Кластеризация

— Обучение с учителем и без учителя (supervised / unsupervised learning)

— Области применения методов обучения без учителя

● теория метода и реализация в коде

● плюсы и минусы метода

● теория метода и реализация в коде

— Метод понижения размерности с помощью SVD

● теория метода и реализация в коде

● сильные и слабые стороны

— Работа с текстами

● кластеризация текстов: теория и реализация в коде

● метод «мешок слов»

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: unsupervised обучение модели методами K-means, mean-shift и методом понижения размерности

Модуль 5 Tree-based алгоритмы: введение в деревья решений

— Введение в деревья решений

— Решающее дерево и как его построить

● Структура дерева: внутренние и терминальные узлы

● Разделяющие функции. Виды разделяющих функций

● Обучение дерева решений для классификации и регрессии

● Критерии качества разделения и прекращения роста дерева

● Влияние параметров обучения на under / overfitting модели

— Примеры использования деревьев решений в production

— Визуализация структуры дерева

— Алгоритм построения дерева

— Виды деревьев в библиотеках машинного обучения

— Реализация деревьев в библиотеке sklearn

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: обучение решающего дерева для задачи регрессии

Модуль 6 Tree-based алгоритмы: ансамбли

— Области применения ансамблей

● Bagging и out-of-bag оценки

● Применение bagging к логистической регрессии

● Cлучайный лес: bagging и эвристики подбора признаков

● Перебор параметров алгоритма по сетке (Grid Search)

● Объединение деревьев в один классификатор

● Как вырастить деревья разными?

● Настраиваемые параметры случайного леса

● Сравнение результатов настройки параметров

● Анализ качества ансмабля и влияния признаков

● Что такое бустинг деревьев?

● AdaBoost и примеры использования

● Значение порядка построения деревьев в ансамбле

● AdaBoost в логистической регрессии

● CatBoost: особенности интерфейса

● Построение классификатора первого уровня и мета-классификатора

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: соревнование по обучению решающих деревьев на kaggle

Модуль 7 Валидация данных и оценка качества алгоритмов

— Методы разбиения выборки для валидации данных

— Метрики качества алгоритмов

● метрики precision / recall

— Оценка качества алгоритмов в production

● примеры реализации в коде

● как избавиться от переобучения?

— Дисбаланс выборки: как бороться

— Визуализация процесса обучения модели

● визуализация с Tensorboard

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: оценка качества алгоритма классификации

Модуль 8 Временные ряды в машинном обучении

— Задача анализа временных рядов в ML

— Принципы обучения алгоритма

● экспоненциальное сглаживание: простое, двойное, с ручной настройкой параметров

● кросс-валидация на временных рядах

— Эконометрический подход в анализе временных рядов

● стационарность и единичные корни

● ограничения и недостатки эконометрического подхода

— Алгоритмы машинного обучения для анализа временных рядов

Читать еще:  Курсы дизайнера в москве

● извлечение признаков для обучения

● обучение линейных моделей

● бустинг для временных рядов: преимущества и ограничения

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: обучение линейной модели и использование XGBoost для анализа временных рядов

Модуль 9 Рекомендательные системы

— Обзор подходов к построению рекомендательных систем

— Принципы разбиения выборки

● принцип работы алгоритма

● практика реализации в коде

● границы применимости, достоинства и недостатки

— Алгоритм SVD Recommender

● принцип работы алгоритма

● практика реализации в коде

● достоинства метода, ограничения

— Проблема холодного старта в рекомендательных системах

— Бустинг в рекомендательных системах: использование LightGBM

— Задачи на закрепление темы: тесты, ввод значений, проверка кода студентов на платформе

— Практика: обучение рекомендательной системы

Модуль 10 Финальный хакатон

— Выпускной хакатон: командное соревнование по обучению модели на платформе kaggle

По окончанию обучения слушатели получают либо Сертификат Учебного Центра о прохождении курса, либо Удостоверение о повышении квалификации, зарегистрированное в ФРДО (Федеральный реестр сведений о документах об образовании и (или) о квалификации, документах об обучении). Для получения Свидетельства необходимо, чтобы длительность обучения превышала 16 академических часов, а так же необходимо предоставить оригинал Диплома о профессиональном или высшем образовании государственного образца.

Помимо этого, по факту прохождения авторизованных курсов вендоров Cisco, Postgres, AstraLinux, Microsoft, ICAgile выдается электронный сертификат вендора.

Возьмите паспорт и Диплом об окончании профессионального или высшего образования. Диплом понадобится для получения Удостоверения о повышении квалификации (в случае отсутствия Диплома, по окончанию курса будет выдан Сертификат Учебного Центра, подтверждающий факт пройденного обучения).

За несколько дней до начала обучения (обычно за неделю) все слушатели получают приглашение по указанной электронной почте (если обучение заказывалось централизованно, ваш персональный мейл могли не передать — обратитесь к специалисту вашей организации, кто заказывал курсы, приглашение есть у него). В приглашении указан адрес и прочая полезная для слушателя информация. Если вы не получили приглашение – обратитесь к нам любым удобным для вас способом и мы сообщим адрес и продублируем приглашение на вашу почту.

В основном корпусе в Москве по адресу Дербеневская набережная д.7 стр.5, БЦ «Оазис», парковки, к сожалению, нет. Зато есть муниципальная платная парковка на всех прилегающих улицах.

По поводу остальных филиалов и корпусов – уточняйте информацию у наших менеджеров. Мы постараемся сделать всё возможное для вашего комфортного обучения.

Да, во время занятий для слушателей всегда доступны чай, кофе, прохладительные напитки и орешки, печеньки и другие снеки на кофе-брейках. Помимо этого, в обеденный перерыв будет предложен полноценный горячий обед.

Наш центр работает с корпоративными и частными клиентами. Для каждой категории клиентов мы разработали различные варианты сотрудничества, позволяющие гибко подходить к ценообразованию и вариантам оплаты.

Обо всех специальных условиях читайте в разделе Спецпредложения.

Не достаточно информации? Напишите нам и мы сделаем вам предложение, от которого невозможно отказаться.

Основы машинного обучения

  • 11 недель

от 5 до 8 часов в неделю

понадобится для освоения

4 зачётных единицы

для зачета в своем вузе

Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Курс пригодится всем, кто хочет «с нуля» погрузиться в область машинного обучения, получить первые практические навыки и начать применять их для решения собственных задач по извлечению пользы из данных.

О курсе

Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Практика проходит на языке Python и основана на библиотеках pandas, matplotlib, scikit-learn. Для успешного прохождения курса требуются знания математики на уровне школьных курсов, а также навыки программирования на Python. Контроль на курсе представлен в виде заданий на программирования, заданий на построение выводов (проверяются с помощью взаимного оценивания), а также тестов на знание теоретического материала.

Читать еще:  Курсы pmbok управление проектами

Формат

Курс состоит из 11 недель, каждая включает в себя несколько коротких видеолекций (суммарная продолжительность — от 60 до 90 минут), тест на знание теоретического материала (5-15 вопросов), а также тест, включающий в себя выполнение задания по программированию. На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестов.

Информационные ресурсы

Python, библиотеки numpy, pandas, matplotlib, seaborn, scikit-learn

Требования

Освоение школьного курса математики, навыки программирования на Python

Программа курса

  1. Основные понятия и задачи в машинном обучении
  2. Метод k ближайших соседей
  3. Линейная регрессия
  4. Градиентный спуск
  5. Линейная классификация
  6. Логистическая регрессия и метод опорных векторов
  7. Решающие деревья
  8. Бэггинг и случайный лес
  9. Градиентный бустинг
  10. Обучение без учителя
  11. Рекомендательные системы

Поделиться

  • 11 недель

от 5 до 8 часов в неделю

понадобится для освоения

4 зачётных единицы

для зачета в своем вузе

Соколов Евгений Андреевич

Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска

Зимовнов Андрей Вадимович

Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска

Ковалев Евгений Игоревич

Должность: Приглашенный преподаватель факультета компьютерных наук

Кохтев Вадим Михайлович

Должность: Приглашенный преподаватель факультета компьютерных наук

Рысьмятова Анастасия Александровна

Должность: Приглашенный преподаватель факультета компьютерных наук

Филатов Артём Андреевич

Должность: Приглашенный преподаватель факультета компьютерных наук

Программа «Введение в машинное обучение»

ОНЛАЙН

Машинное обучение — один из самых востребованных разделов компьютерных наук. Именно с помощью машинного обучения сейчас удаётся строить рекомендательные системы для видео, прогнозировать спрос на тысячи товаров и автоматически обрабатывать огромные потоки писем в службе поддержки.

Основные темы курса:

  • Обучение с учителем — линейные модели, решающие деревья, композиции моделей на основе бэггинга и бустинга
  • Обучение без учителя — кластеризация и визуализация многомерных данных
  • Подготовка данных — отбор признаков, обработка категориальных и текстовых признаков

По итогам курса вы будете понимать основные постановки задач в машинном обучении, изучите основные виды моделей, будете уметь пройти путь от обработки сырых данных до построения и валидации модели.

Все темы сопровождаются практическими домашними заданиями на реальных данных.

Мы ожидаем, что слушатели владеют языком Python, который является де-факто стандартным инструментом для анализа данных: знают про условные операторы, циклы, функции, разбираются в числовых и строковых типах данных, умеют работать со списками и словарями, знают встроенные функции языка.

академических часов, включая 40 часов онлайн-работы с преподавателем.

рублей.
Оплату можно разбить на две части.
Для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ предусмотрены скидки.

Начальные требования

Законченное высшее или среднее профессиональное образование. Слушателями также могут стать студенты, получающие высшее образование.

Документы для зачисления

  1. паспорта (3-4 страница, а также страница с адресом регистрации);
  2. диплома о высшем или среднем профессиональном образовании (первые две страницы);
  3. актуальной справки из вуза (если вы являетесь студентом);
  4. свидетельства о смене фамилии (если в паспорте и дипломе фамилия не совпадает).

Расписание занятий

Общий период обучения: 16 мая 22 июля 2020 г.

Один раз в неделю, онлайн

16 мая — 4 июля 2020 г. по субботам с 15:30 до 18:30.

8 июля — 22 июля 2020 г. по средам с 19:00 до 22:00.

Для прохождения курса вам понадобятся основы программирования на Python и знание базовых разделов высшей математики.

Преподаватели

Елена Кантонистова

Кандидат физико-математических наук, ведущий Data Scientist в консалтинговой компании UCG. Приглашенный преподаватель факультета компьютерных наук НИУ ВШЭ.

Окончила механико-математический факультет МГУ им. М.В. Ломоносова и Школу анализа данных Яндекса, направление «Компьютерные науки».

Как устроено обучение

Занятия проходят раз в неделю. Каждое занятие состоит из лекции и семинара. На лекции преподаватель объясняет, как работают методы машинного обучения, какие математика и алгоритмы за ними стоят. На семинаре слушатели работают с данными и решают реальные задачи с помощью Python и его библиотек. После каждого занятия выдаётся домашнее задание, которое поможет закрепить навыки.

Ссылка на основную публикацию
Adblock
detector