close facebook google+ habr instagram linkedin arrow-right phone telegram twitter user vk youtube upload close menu-stroke search lock

Введение в анализ данных и Data Science в Python

005-AA

20 000 руб

очно

18 000 руб

дистанционно
Очное обучение

Очное обучение – это обучение в одном из 13 городов России, где есть классы Учебного центра Softline (Москва, Санкт-Петербург, Владивосток, Екатеринбург, Казань, Красноярск, Нижний Новгород, Новосибирск, Омск, Ростов-на-Дону, Самара, Уфа, Хабаровск).

Вы приезжаете в указанное администратором время по нужному адресу и проходите обучение на наших ПК. Все лабораторные работы и/или практические задания будут заранее настроены нашими техническими специалистами и готовы к работе. В стоимость очного обучения входит блокнот, ручка, учебники и пособия, чай/кофе/вода/печеньки и обед. Иногородним слушателям, желающим обучаться в наших классах очно, мы помогаем с подбором и бронированием гостиницы (командировку вы оформляете за свой счёт).

Подробнее
Дистанционное обучение

Если в вашем городе нет класса, вы можете пройти обучение в дистанционном формате. Стоимость дистанционного курса на 10% меньше, чем очного.

Удалённый формат подразумевает подключение к очной группе во время проведения курса (ссылка для подключения будет выслана вам заранее). С вашей стороны нужен компьютер или ноутбук с устойчивым подключением к интернету и гарнитура с микрофоном и наушниками. Вы будете видеть презентацию преподавателя, слышать его, получите удалённый доступ к лабораторным работам (если курс подразумевает их использование), сможете задавать вопросы в групповом чате или голосом, общаться с другими слушателями, а по окончании обучения получите те же сертификаты (по электронной почте), что и очные слушатели (в сертификате не указано, в каком формате вы прошли обучение).

Подробнее

Курс предназначен для широкой аудитории слушателей, желающих развить свои компетенции в области науки о данных.

Подробнее

Производитель: Академия Анализа Данных

Направление: Data Science&Machine Learning
Продолжительность: 16 ак. часов
  • Расписание и цены

    В данный момент курс не стоит в открытом расписании. Оставьте запрос на этот курс, и мы свяжемся с вами для согласования времени и места проведения обучения.

  • О курсе
    Цель курса: получение начальных компетенций по инструментам и анализу данных на языке Python.
    Предварительные требования: к освоению программы допускаются лица, имеющие базовые навыки работы с ПК и офисными приложениями, обладающие базовыми навыками программирования.
     
    Обучающийся в результате освоения программы должен уметь:
    • устанавливать и настраивать сборку пакетов и инструментов Anaconda для программирования на языке Python;
    • пользоваться модулями NumPy, SciPy, Matplotlib, Pandas для решения стоящих перед ними задач на языке Python;
    • пользоваться средами разработки Jupyter Notebook (Lab) и Spyder;
    • строить несложные программы на языке Python в среде Jupyter Notebook;
    • строить графики и визуализировать данные при помощи модуля Matplotlib;
    • интерпретировать результаты применения выполнения кода;
    • импортировать данные из файлов различных форматов и из интернета;
    • пользоваться основными функциями Python и модулей NumPy, SciPy, Matplotlib, Pandas;
    • интегрировать Python и Statistica;
    • создавать аналитические отчеты;
    знать:
    • назначение и возможности среды Jupyter Notebook;
    • интерфейс, принцип REPL (read-eval-print-loop);
    • способы ввода данных;
    • способы построения графиков;
    • возможности Python, Jupyter Notebook и перечисленных выше модулей;
    • синтаксис Python;
    • преобразование данных в Python;
    • базовые принципы статистики и теории вероятностей.

    Форма контроля: правильность выполнения упражнений на практических занятиях и правильность ответов на вопросы итогового тестирования.

    По итогам слушателям выдается сертификат Учебного центра Softline и сертификат Академии Анализа Данных.

  • Программа курса

    Модуль 1. Знакомство с языком Python: обзор, примеры, области применения.

    • знакомство с языком Python: обзор, примеры, области применения,
    • краткий обзор популярных пакетов/модулей Python: NumPy, SciPy, Matplotlib, Pandas,
    • сборка Anaconda: установка, возможности,
    • работа с менеджером пакетов conda: окружение, установка пакетов,
    • среда программирования Jupyter Notebook: код, описание, оформление, презентация – все в одном. Запуск, создание первых программ, принцип работы REPL. Контекстная справка,
    • среда программирования Spyder (аналог Matlab). Интерфейс, менеджер переменных, интерфейс, отладка.

    Модуль 2. Язык Python, синтаксис, типы данных, операторы, циклы, функции.

    • синтаксис Python, типы данных,
    • условные операторы, циклы, range, enumerate,
    • изменяемые типы: списки, словари,
    • функции и процедурное программирование.

    Модуль 3. Модуль NumPy: работа с многомерными массивами и линейная алгебра.

    • модуль NumPy: многомерные массивы. Типы элементов. Создание массивов. Сохранение/загрузка массивов,
    • принципы работы с массивами: element-wise ops, broadcasting, slicing, indexing, ufuncs,
    • важные функции для работы с массивами. Линейная алгебра,
    • примеры решения задач при помощи NumPy,

    Модуль 4. Модуль Matplotlib: визуализация данных. Модуль SciPy – численные методы.

    • модуль Matplotlib. Принцип работы: figure, axis,
    • виды графиков: plot, scatter, bar, hist, contour, и др.,
    • цветовые карты, работа с изображениями как с массивами данных,
    • интерполяция (scipy.interpolate), интегрирование (scipy.integrate), оптимизация (scipy.optimize).

    Модуль 5. Модуль Pandas: работа с таблицами, загрузка и анализ данных.

    • модуль Pandas (Python for Data Analysis). Основные типы данных: Series, DataFrame,
    • работа с Series и DataFrame. Загрузка из CSV, XLS, HDF5,
    • пример анализа данных / Датасет "Температура в Стокгольме за 200+ лет". Применение NumPy, SciPy, Matplotlib,
    • повторение анализа при помощи Pandas.

    Модуль 6. Примеры анализа данных на датасетах.

    • пример анализа датасета: поток велосипедистов через мост Fremont Bridge,
    • пример анализа датасета: "Open policing project" Стэнфордского университета.

    Модуль 7. Обработка текста, регулярные выражения, извлечение данных из веб-страниц.

    • простая обработка текста без регулярных выражений,
    • регулярные выражения и их применение,
    • извлечение данных из веб-страниц. Модули urllib, requests, BeautifulSoup,
    • работа с JSON, HTML, XML.

    Модуль 8. Вычисление описательных статистик, интеграция Python и Statistica.

    • генерация псевдослучайных последовательностей. Подгонка распределений,
    • вычисление описательных статистик, вычисление корреляций Пирсона,
    • группировка, оценка значимости корреляций, построение корреляционной матрицы,
    • интеграция Python и Statistica.

    Итоговое тестирование по окончании курса.

  • Отзывы

    Ваш отзыв поможет кому-то сделать выбор. Спасибо, что делитесь опытом!

Связаться с менеджером

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».

Запрос

В данный момент курс не стоит в открытом расписании. Оставьте запрос на этот курс, и мы свяжемся с вами для согласования времени и места проведения обучения.

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006, отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных. Мы, ЗАО «СофтЛайн Интернейшнл» и аффилированные к нему лица, гарантируем конфиденциальность получаемой нами информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и пр. в соответствии с «Политикой конфиденциальности персональных данных».