close facebook google+ habr instagram linkedin arrow-right phone telegram twitter user vk youtube upload close menu-stroke search lock

Введение в анализ данных и Data Science в Python

005-AA

Курс предназначен для студентов, аспирантов высших учебных заведений технических и гуманитарно-социальных, медико-биологических направлений, а также всех желающих войти в Data Science (дейта сайнс).

Подробнее

Введение в анализ данных и Data Science в Python

средний

Уровень

16 ак. часа

Продолжительность
Производитель:
Направление:
Цена очного обучения:
20 000 руб.
Цена дист.анционного обучения:
18 000 руб.
  • Расписание и цены

    Формат, место и дата проведения обучения согласовываются индивидуально.

    Оставьте запрос на обучение, заполнив форму ниже. Менеджер Учебного центра свяжется с вами для согласования времени и места проведения курса.

    Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».

  • О курсе
    Цель курса: получение начальных компетенций по инструментам и анализу данных на языке Python.
    Предварительные требования: к освоению программы допускаются лица, имеющие базовые навыки работы с ПК и офисными приложениями, обладающие базовыми навыками программирования.
     
    Обучающийся в результате освоения программы должен уметь:
    • устанавливать и настраивать сборку пакетов и инструментов Anaconda для программирования на языке Python;
    • пользоваться модулями NumPy, SciPy, Matplotlib, Pandas для решения стоящих перед ними задач на языке Python;
    • пользоваться средами разработки Jupyter Notebook (Lab) и Spyder;
    • строить несложные программы на языке Python в среде Jupyter Notebook;
    • строить графики и визуализировать данные при помощи модуля Matplotlib;
    • интерпретировать результаты применения выполнения кода;
    • импортировать данные из файлов различных форматов и из интернета;
    • пользоваться основными функциями Python и модулей NumPy, SciPy, Matplotlib, Pandas;
    • интегрировать Python и Statistica;
    • создавать аналитические отчеты;
    знать:
    • назначение и возможности среды Jupyter Notebook;
    • интерфейс, принцип REPL (read-eval-print-loop);
    • способы ввода данных;
    • способы построения графиков;
    • возможности Python, Jupyter Notebook и перечисленных выше модулей;
    • синтаксис Python;
    • преобразование данных в Python;
    • базовые принципы статистики и теории вероятностей.

    Форма контроля: правильность выполнения упражнений на практических занятиях и правильность ответов на вопросы итогового тестирования.

    По итогам слушателям выдается сертификат Учебного центра Softline и сертификат Академии Анализа Данных.

  • Программа курса

    Модуль 1. Знакомство с языком Python: обзор, примеры, области применения.

    • знакомство с языком Python: обзор, примеры, области применения,
    • краткий обзор популярных пакетов/модулей Python: NumPy, SciPy, Matplotlib, Pandas,
    • сборка Anaconda: установка, возможности,
    • работа с менеджером пакетов conda: окружение, установка пакетов,
    • среда программирования Jupyter Notebook: код, описание, оформление, презентация – все в одном. Запуск, создание первых программ, принцип работы REPL. Контекстная справка,
    • среда программирования Spyder (аналог Matlab). Интерфейс, менеджер переменных, интерфейс, отладка.

    Модуль 2. Язык Python, синтаксис, типы данных, операторы, циклы, функции.

    • синтаксис Python, типы данных,
    • условные операторы, циклы, range, enumerate,
    • изменяемые типы: списки, словари,
    • функции и процедурное программирование.

    Модуль 3. Модуль NumPy: работа с многомерными массивами и линейная алгебра.

    • модуль NumPy: многомерные массивы. Типы элементов. Создание массивов. Сохранение/загрузка массивов,
    • принципы работы с массивами: element-wise ops, broadcasting, slicing, indexing, ufuncs,
    • важные функции для работы с массивами. Линейная алгебра,
    • примеры решения задач при помощи NumPy,

    Модуль 4. Модуль Matplotlib: визуализация данных. Модуль SciPy – численные методы.

    • модуль Matplotlib. Принцип работы: figure, axis,
    • виды графиков: plot, scatter, bar, hist, contour, и др.,
    • цветовые карты, работа с изображениями как с массивами данных,
    • интерполяция (scipy.interpolate), интегрирование (scipy.integrate), оптимизация (scipy.optimize).

    Модуль 5. Модуль Pandas: работа с таблицами, загрузка и анализ данных.

    • модуль Pandas (Python for Data Analysis). Основные типы данных: Series, DataFrame,
    • работа с Series и DataFrame. Загрузка из CSV, XLS, HDF5,
    • пример анализа данных / Датасет "Температура в Стокгольме за 200+ лет". Применение NumPy, SciPy, Matplotlib,
    • повторение анализа при помощи Pandas.

    Модуль 6. Примеры анализа данных на датасетах.

    • пример анализа датасета: поток велосипедистов через мост Fremont Bridge,
    • пример анализа датасета: "Open policing project" Стэнфордского университета.

    Модуль 7. Обработка текста, регулярные выражения, извлечение данных из веб-страниц.

    • простая обработка текста без регулярных выражений,
    • регулярные выражения и их применение,
    • извлечение данных из веб-страниц. Модули urllib, requests, BeautifulSoup,
    • работа с JSON, HTML, XML.

    Модуль 8. Вычисление описательных статистик, интеграция Python и Statistica.

    • генерация псевдослучайных последовательностей. Подгонка распределений,
    • вычисление описательных статистик, вычисление корреляций Пирсона,
    • группировка, оценка значимости корреляций, построение корреляционной матрицы,
    • интеграция Python и Statistica.

    Итоговое тестирование по окончании курса.

  • Отзывы
    Отзывов нет.
    Чтобы оставить отзыв, необходимо войти
Связаться с менеджером

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».

Заявка

Формат, место и дата проведения обучения согласовываются индивидуально.

Оставьте запрос на обучение, заполнив форму ниже. Менеджер Учебного центра свяжется с вами для согласования времени и места проведения курса.

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».