close facebook google+ habr instagram linkedin arrow-right phone telegram twitter user vk youtube upload close menu-stroke search lock

Углубленные методы анализа данных и data science в Statistica и R: построение предсказательных моделей

004-АА

25 000 руб

очно

22 500 руб

дистанционно
Очное обучение

Очное обучение – это обучение в одном из 13 городов России, где есть классы Учебного центра Softline (Москва, Санкт-Петербург, Владивосток, Екатеринбург, Казань, Красноярск, Нижний Новгород, Новосибирск, Омск, Ростов-на-Дону, Самара, Уфа, Хабаровск).

Вы приезжаете в указанное администратором время по нужному адресу и проходите обучение на наших ПК. Все лабораторные работы и/или практические задания будут заранее настроены нашими техническими специалистами и готовы к работе. В стоимость очного обучения входит блокнот, ручка, учебники и пособия, чай/кофе/вода/печеньки и обед. Иногородним слушателям, желающим обучаться в наших классах очно, мы помогаем с подбором и бронированием гостиницы (командировку вы оформляете за свой счёт).

Подробнее
Дистанционное обучение

Если в вашем городе нет класса, вы можете пройти обучение в дистанционном формате. Стоимость дистанционного курса на 10% меньше, чем очного.

Удалённый формат подразумевает подключение к очной группе во время проведения курса (ссылка для подключения будет выслана вам заранее). С вашей стороны нужен компьютер или ноутбук с устойчивым подключением к интернету и гарнитура с микрофоном и наушниками. Вы будете видеть презентацию преподавателя, слышать его, получите удалённый доступ к лабораторным работам (если курс подразумевает их использование), сможете задавать вопросы в групповом чате или голосом, общаться с другими слушателями, а по окончании обучения получите те же сертификаты (по электронной почте), что и очные слушатели (в сертификате не указано, в каком формате вы прошли обучение).

Подробнее

В курсе систематически излагаются методы построения широко используемых на практике предиктивных моделей, используя новейшие аналитические технологии. В качестве примеров анализа реальных данных используется данные об оценке стоимости квартир, арендной платы, цены европейских подержанных автомобилей и др.

Подробнее

Производитель: Академия Анализа Данных

Направление: Data Science&Machine Learning
Продолжительность: 16 ак. часов
  • Расписание и цены
    24 — 25 января 2019
    16 ак. часов
    Москва
    Дистанционный
    22 500 руб.
    14 — 15 февраля 2019
    16 ак. часов
    Москва
    Дистанционный
    22 500 руб.
    21 — 22 марта 2019
    16 ак. часов
    Москва
    Дистанционный
    22 500 руб.
    11 — 12 апреля 2019
    16 ак. часов
    Москва
    Дистанционный
    22 500 руб.
    23 — 24 мая 2019
    16 ак. часов
    Москва
    Дистанционный
    22 500 руб.
    Место обучения Формат Дата и время Стоимость
  • О курсе

    Категории слушателей: К освоению программы допускаются лица, прошедшие курс Введение в анализ данных и data science на Statistica и R, либо обладающие соответствующими компетенциями.

    Цель: получить углубленные знания по интеллектуальному анализу данных и построению предсказательных моделей в среде R и статистическом ПО Statistica.

    Обучающийся в результате освоения программы должен уметь:

    • использовать инструменты анализа данных Statistica и R, включая методы добычи данных и машинного обучения для решения практических задач;
    • строить предсказательные модели;
    • оценивать точность моделей;
    • сохранять предсказательные модели в различных форматах, включая язык разметки прогнозного моделирования PMML (Predictive Model Markup Language), C, Java;
    • корректировать точность моделей на основе новых данных;
    • использовать ансамбли моделей;
    • пользоваться алгоритмом xgboost в задачах классификации и регрессии;
    • пользоваться классическими регрессионными моделями;
    • проводить анализ остатков и диагностику регрессионных моделей;
    • интерпретировать и сравнивать модели;
    • проводить кросс-проверку;

    знать:

    • методы построения предсказательных моделей;
    • основы регрессионного анализа;
    • метод главных компонент;
    • бинарную и мультиномиальную логистическую регрессию;
    • деревья классификации и регрессии;
    • многомерные адаптивные сплайны.
  • Программа курса

    Модуль 1. Парадигма построения предсказательных моделей, обзор методов, сравнение классических методов и машинного обучения.

    • Назначение предсказательных моделей.
    • Обзор методов построения предсказательных моделей.
    • Классические модели в сравнении с моделями машинного обучения.

    Модуль 2. Технология построения классических регрессионных моделей в Statistica и R.

    • Построение двумерных моделей.
    • Построение многомерных моделей.
    • Анализ результатов.
    • Оценка адекватности моделей, анализ остатков, применение модели к новым данным.

    Модуль 3. Построение логит моделей в Statistica и R.

    • Построение двумерных моделей
    • Построение многомерных моделей
    • Анализ результатов
    • Оценка адекватности моделей, анализ остатков, применение модели к новым данным

    Модуль 4. Построение CART моделей в Statistica и R.

    • Обзор методов деревьев классификации
    • Обзор методов деревьев регрессии
    • Правила ветвления
    • Проверка точности модели с помощью кросс-проверки
    • Основные этапы построения CART моделей

    Модуль 5. Cлучайные леса регрессии и классификации в Statistica и R.

    • Обзор методов случайных лесов
    • Примеры использования случайных лесов
    • Основные этапы построения моделей
    • Оценка адекватности моделей
    • Сохранение и развертывание моделей случайных лесов на новых данных

    Модуль 6. Многомерные адаптивные сплайны в Statistica и R.

    • Обзор многомерных адаптивных сплайнов
    • Примеры использования многомерных адаптивных сплайнов
    • Основные этапы построения многомерных адаптивных сплайнов
    • Оценка адекватности моделей
    • Сохранение и развертывание моделей случайных лесов на новых данных

    Модуль 7. Алгоритм xgboost.

    • Постановка задачи бустинга
    • Типы градиентного бустинга
    • Градиентый бустинг в задачах классификации
    • Градиентый бустинг в задачах регрессии

    Модуль 8. Сохранение и развертывание моделей.

    • Обзор форматов сохранения предсказательных моделей
    • Развертывание предсказательных моделей

    Модуль 9. Кейсы: примеры применения предиктивных моделей в экономике, промышленности.

    • Предиктивные модели в экономике
    • Предиктивные модели в промышленности
    • Предиктивные модели в бизнесе

    Итоговое тестирование по окончании курса.

    Форма контроля:

    • правильность выполнения упражнений на практических занятиях
    • правильность ответов на вопросы итогового тестирования

    По итогам слушателям выдается сертификат Учебного центра Softline и сертификат Академии Анализа Данных.

  • Отзывы

    Ваш отзыв поможет кому-то сделать выбор. Спасибо, что делитесь опытом!

Связаться с менеджером

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».

Запрос

В данный момент курс не стоит в открытом расписании. Оставьте запрос на этот курс, и мы свяжемся с вами для согласования времени и места проведения обучения.

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».