Публикации по теме 'data-analysis'


MATLAB в анализе данных: полное руководство
В современном мире, управляемом данными, объем генерируемой информации растет экспоненциально. В результате предприятия, исследователи и аналитики сталкиваются с непростой задачей извлечения значимой информации из обширных наборов данных. Анализ данных является краеугольным камнем этого процесса, и одним из инструментов, доказавших свою ценность в этой области, является MATLAB. Благодаря интуитивно понятному интерфейсу, мощным библиотекам и обширным функциональным возможностям MATLAB стал..

Прогнозирование продаж на основе данных с помощью машинного обучения
Этот пост посвящен изучению данных о продажах Bigmart и разработке модели машинного обучения для прогнозирования продаж определенного товара в конкретном магазине. Набор данных предоставляется как часть решения Analytics Vidhya’s Bigmart Sales Prediction Problem. Введение Данные о продажах Bigmart состоят из данных обучения (8523 строки) и данных тестирования (5681 строка) с 11 переменными признаков. Данные обучения дополнительно содержат цену продажи для всех товаров, и задача..

Используйте метод Pandas Apply как профессионал!
Вы когда-нибудь сталкивались с трудностями при использовании метода применения панд? Если да, то этот урок для вас. Метод apply() — это мощный инструмент, который позволяет применять пользовательскую функцию к каждому элементу DataFrame или Series, упрощая сложные операции с данными и вычисления. В этой статье мы узнаем, как использовать методы Series.apply() и DataFrame.apply(). В чем разница между методами Series.apply() и DataFrame.apply(). Как использовать их с функциями с..

Не запускайте циклы в Python, вместо этого используйте их!
Больше не нужно запускать циклы в Python Введение Циклы в Python дороги (медленны), и если вы работаете с большим количеством строк, то это преступление. В этом блоге я познакомлю вас с теорией и практическими примерами функций, которые вы можете использовать в качестве альтернативы циклам в Python.

Цены на жилье Продвинутые методы регрессии
В этой статье мы рассмотрим классическое соревнование Kaggle и изучим некоторые методы, которые помогут нам добиться лучшего результата в наших моделях более «автоматическим» способом. Вы можете найти более подробную информацию о наборе данных здесь , а полный блокнот jupyter — здесь . Импорт данных import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.impute import SimpleImputer from sklearn.preprocessing import OneHotEncoder..

Почему мы должны говорить об ошибке типа 1 и ошибке типа 2?
Тяжелые уроки, реальные советы Почему мы должны говорить об ошибке типа 1 и ошибке типа 2? От оценки модели до принятия бизнес-решений… Вы когда-нибудь слышали об ошибке типа 1 и ошибке типа 2? или ложноположительный, истинно отрицательный и т. д.? Эти понятия обычно вводятся, когда мы изучаем проверку гипотез. Это фундаментальное понятие в логической статистике. Однако каждый должен это понимать, потому что это также важно, когда мы хотим оценить, какую модель использовать для..

Машинное обучение с помощью Python в наборе данных Enron
Машинное обучение с помощью Python в наборе данных Enron Расследование мошенничества с помощью Scikit-learn Примечание автора: Следующий проект машинного обучения был завершен в рамках Udacity Data Analyst Nanodegree , который я завершил в мае 2017 года. Весь код можно найти в моем репозитории GitHub для этого класса. . Я настоятельно рекомендую этот курс всем, кто интересуется анализом данных (то есть всем, кто хочет разобраться в огромных объемах данных, генерируемых в..