Публикации по теме 'statistics'


Моделирование Монте-Карло
В настоящем блоге будут затронуты следующие темы: Введение в моделирование методом Монте-Карло Основные принципы Применение МК Шаги в моделировании Монте-Карло Статистика (более подробная информация доступна по адресу: https://github.com/arunsinp/Statistics-fundamental ) Генерация случайных чисел Методы уменьшения дисперсии Приложения моделирования Монте-Карло Введение в моделирование методом Монте-Карло Моделирование методом Монте-Карло — это мощный метод моделирования и..

Интервью о машинном обучении — Часть 5
Интервью о машинном обучении — часть 5 Погружение в машины опорных векторов ядра с использованием Python Как я упоминал в предыдущей статье этой серии, теперь я расскажу о машинах опорных векторов и о том, как их можно использовать для классификации нелинейно разделимых наборов данных с помощью хитрости ядра . Если вы пропустили предыдущие статьи из этой серии Ace your Machine Learning Interview , я оставлю ссылки ниже: Собеседование о машинном обучении — часть 1 : погружение..

Статистические тесты для сравнения алгоритмов классификации
Обзор основополагающего документа и реализаций, чтобы найти наилучший вариант для ваших данных. Сравнение методов прогнозирования, чтобы определить, какой из них следует использовать для решения поставленной задачи, является повседневной деятельностью большинства специалистов по обработке и анализу данных. Обычно у вас будет пул моделей классификации, и вы будете проверять их с помощью перекрестной проверки, чтобы определить, какая из них лучше. Другой целью, однако, является..

Показатели после развертывания — Индекс стабильности населения и Индекс стабильности характеристик
Что такое проверка модели? После того, как модель разработана, очень важно, чтобы значительное количество времени было потрачено на проверку модели. Это связано с тем, что перед развертыванием модели в производственной среде абсолютно необходимо убедиться в ее точности и надежности. Проверка модели — это итеративный процесс, который выполняется синхронно с разработкой. Основное внимание здесь уделяется статистическим показателям, которые дают нам определенное представление о..

Компромисс смещения и дисперсии
При разработке моделей машинного обучения специалисты по машинному обучению обычно сталкиваются с проблемой выбора лучшей модели. Как правило, наилучшей моделью является модель с наименьшей возможной ошибкой прогнозирования. Поэтому, чтобы найти лучшую модель, нам нужно минимизировать ошибку прогноза. Ошибка предсказания для любого алгоритма машинного обучения может быть разбита на Неустранимая ошибка Предвзятость Дисперсия Неисправимая ошибка Неустранимые ошибки — это..

Практическое руководство по мерам корреляции
TL; DR: в большинстве случаев лучше всего использовать Kendall. Мера корреляции Мера корреляции используется для измерения степени взаимосвязи между двумя переменными. Существуют разные виды показателей корреляции, которые можно использовать в зависимости от типа данных и варианта использования. Некоторые общие меры корреляции - корреляция Пирсона, Спирмена и Кендалла. В этом посте я постараюсь кратко объяснить, что они делают и когда их использовать. Формулы для них можно легко..

Доказательство выпуклости логарифмических потерь для логистической регрессии
Распаковка влияния функции ошибки потери журнала на логистическую регрессию Автор(ы): Пратик Шукла Мужество похоже на мускул. Мы укрепляем его использованием . — Рут Гордо Оглавление: Доказательство выпуклости функции логарифмических потерь для логистической регрессии Визуальный взгляд на BCE для логистической регрессии Ресурсы и ссылки Введение В этом руководстве мы увидим, почему функция логарифмических потерь лучше работает в логистической регрессии...