Загрузил Андрей Владимирович

Математика для анализа данных от Яндекс Практикума

реклама
Практику
Практикум
м
Карта курса
Карта курса
Математика
для анализа
Веб-разработчик
плюс данных
0
1
Вводный урок
Связь математики и современных
инструментов анализа данны
Примеры задач с собеседований
Линейная алгебра
Вектор
Математический анализ
Норм
Матриц
Обратная матрица и определитель
4
Разные виды функци
Производные и интеграл
Функции нескольких переменных
Продвинутая алгебра
Линейная регресси
Сингулярное разложение, PCA,
визуализация данных высокой
размерности и другие применения SVD
Собеседование
Теория вероятностей
и статистика
Симулятор математической
секции собеседования
Время прохождения:
в среднем 1 час
⓿ Вводная часть
Дискретные случайные величин
Непрерывные случайные величин
Статистическая оценка параметро
Статистические эксперименты
и проверка гипоте
Методы статистической проверки
гипотез
3
2
Узнаете, для понимания каких инструментов анализа данных и Data Science
нужен каждый раздел математики. Пройдёте небольшую симуляцию
собеседования на платформе.
Темы
— Связь математики и современных инструментов анализа данных
— Примеры задач с собеседований
4 недели, в среднем 47 часов
➊ Линейная алгебра
1 неделя,
Векторы
в среднем 10 часов
Научитесь использовать матрицы, векторы, нормы, определители. Сможете
читать обозначения и оперировать формулами. Узнаете, почему косинусное
расстояние используется для сравнения текстов. Разберётесь в особенностях
применения линейной алгебры в анализе данных.
— Операции над векторами
— Векторное пространство
— Линейная независимость
— Базис
1 неделя,
в среднем 12 часов
ормы
— Основы тригонометрии
— Скалярное произведение векторов
— Нормы вектора
— Связь L2 нормы и скалярного произведения
— Расстояния между векторами
Н
1 неделя,
в среднем 12 часов
Матрицы
— Арифметические операции над матрицами и их свойства
— Умножение матрицы на вектор
— Матричное перемножение
1 неделя,
в среднем 13 часов
Обратная матрица и определитель
— Обратная матрица
— Вырожденная матрица
— Определитель, его применение и смысл
— Упрощение матричных выражений
4 недели, в среднем 42 часа
➋ Математический анализ
Освоите семейства и характеристики функций. Узнаете практическое значение
производной и интеграла. Разберётесь в алгоритме градиентного спуска, который
лежит в основе нейронных сетей и градиентного бустинга.
2 недели,
в среднем 20 часов
Функции
— Определение функции и графика функции
— Линейная функция
— Полиномиальная функция
— Описание данных с помощью функций
— Показательная функция
— Логарифм
— Обратная функция
— Модуль
— Композиция функций
1 неделя,
в среднем 12 часов
Производные и интегралы
— Предел
— Производная
— Правила нахождения производных
— Экстремумы функции
— Свойства функций: монотонность, выпуклость
— Интеграл
1 неделя,
в среднем 10 часов
Функции нескольких переменных
— Функция нескольких переменных
— Визуализация функции двух переменных
— Частная производная
— Градиент функции
— Экстремумы функции нескольких переменных
— Градиентный спуск
2 .5 недели, в среднем 28 часов
➌ Приложения линейной алгебры
в анализе данных
Поймёте, как работают методы линейной регрессии и сингулярного разложения.
Узнаете, как связаны собственные числа с матричными разложениями PCA и SVD,
и научитесь их вычислять. Научитесь сокращать размерность больших данных
и визуализировать их. Узнаете, как найти решение линейной регрессии с помощью
градиентного спуска, и лучше поймёте, как обучается нейронная сеть.
1 неделя,
в среднем 12 часов
Линейная регрессия
1.5 недели,
в среднем 16 часов
Сингулярное разложение, PCA, визуализация данных большой размерности
6 недель, в среднем 72 часа
➍ Теория вероятностей и статистика
— Определение модели линейной регрессии
— Нахождение параметров линейной регрессии как решение СЛУ
— Функция ошибки и её минимизация
— Аналитическое решение для параметров регрессии
— Коллинеарность в данных, регуляризация
— Градиентный спуск для нахождения параметров линейной регрессии
— Собственные значения и векторы матрицы
— Геометрическое представление собственных векторов
— Матрица ковариации
— Сингулярные векторы, cингулярное разложение SVD
— Применения сингулярного разложения, PCA
Узнаете, как принимаются решения на основе статистических данных. Разберётесь
в теореме Байеса и других формулах теории вероятностей. Узнаете, что такое A/B-тест,
доверительный интервал и бутстрэп.
2 недели,
в среднем 20 часов
Дискретные случайные величины
1.5 недели,
в среднем 15 часов
Непрерывные случайные величины
1 неделя,
в среднем 10 часов
Статистическая оценка параметров
— Исход, событие, вероятность
— Дискретные случайные величины и их свойства
— Дискретные распределения
— Совместное распределение и ковариация
— Условная вероятность, теорема Байеса
— Сэмплирование, базовая визуализация данных
— Основные описательные статистики
— Непрерывные случайные величины
— Нормальное распределение и ЦПТ
— Совместное распределение, связь величин, корреляция
— Условная вероятность и теорема Байеса для непрерывных величин
— Гистограммы и описательные статистики для непрерывных
величин
— Вероятность и правдоподобие
— Оценка параметров распределения
— Метод максимального правдоподобия
— Поиск параметров линейной регрессии с вероятностной точки
зрения
1 неделя,
в среднем 15 часов
Статистические эксперименты и проверка гипотез
1 неделя,
в среднем 12 часов
Методы статистической проверки гипотез
— Вероятностное принятие решений
— Доверительные интервалы
— A/B тестирование
— Параметрические тесты
— Размер выборки, его связь с ошибкой
— Непараметрические тесты
— Бутстрэп
— Нелинейное преобразование данных
— Множественная проверка гипотез
Дополнительный модуль
Симуляция математической секции
собеседования
Пройдёте симулятор математической секции собеседования на позицию аналитика или специалиста по Data Science в нашем тренажёре.
Скачать