«mean_absolute_error()» или «mean_squared_error()» или «expanded_variance

👉 Средняя абсолютная ошибка

Функцияmean_absolute_error вычисляет среднюю абсолютную ошибку — метрику риска, соответствующую ожидаемому значению потерь по абсолютной ошибке. Если ŷi — это прогнозируемое значение i-го образца, а yi — соответствующее истинное значение, то оцененная средняя абсолютная ошибка (MAE) более n образцов определяется следующим образом:

или sklearn.metrics.mean_absolute_error(y_true, y_pred, sample_weight=None, multioutput=’uniform_average’)

Реализация так же проста, как

>>> from sklearn.metrics import mean_absolute_error

>>> y_true = [3, -0.5, 2, 7]

>>> y_pred = [2.5, 0.0, 2, 8]

>>> mean_absolute_error(y_true, y_pred)
0.5

👉 Среднеквадратическая ошибка

Среднеквадратическая ошибка определяется по следующей формуле:

Предыдущая формула аналогична формуле, которую мы видели для средней абсолютной ошибки, за исключением того, что вместо вычисления абсолютной разницы между истинными и прогнозируемыми выходными значениями мы вычисляем квадрат разницы.

То есть sklearn.metrics.mean_squared_error(y_true, y_pred, sample_weight=None, multioutput=’uniform_average’, Squared=True)

Мы используем функциюmean_squared_error() из модуля метрик. Чтобы реализовать MSE в scikit-learn, мы используем следующий код:

>>> from sklearn.metrics import mean_squared_error

>>> y_true = [3, -0.5, 2, 7]

>>> y_pred = [2.5, 0.0, 2, 8]

>>> mean_squared_error(y_true, y_pred)
0.375

👉 Объясненная оценка дисперсии

В машинном обучении дисперсия — это разница между фактическими выборками набора данных и прогнозами, сделанными моделью. При работе над задачей машинного обучения на основе регрессии очень полезно знать, какая часть дисперсии объясняется моделью машинного обучения.

То есть sklearn.metrics.explained_variance_score(y_true, y_pred, *, sample_weight=None, multioutput=’uniform_average’,force_finite=True)

Объясненная оценка дисперсии объясняет дисперсию ошибок данного набора данных, и формула записывается следующим образом:

Здесь Var(y, ŷ) и Var(y) — это дисперсия ошибок прогнозирования и фактических значений соответственно. Очень желательны оценки, близкие к 1,0, что указывает на лучшие квадраты стандартных отклонений ошибок.

Получите объясненную оценку дисперсии наших прогнозов, используя функцию объяснения_дисперсии_score модуля sklearn.metrics со следующим кодом:

>>> from sklearn.metrics import explained_variance_score

>>> y_true = [3, -0.5, 2, 7]

>>> y_pred = [2.5, 0.0, 2, 8]

>>> explained_variance_score(y_true, y_pred)
0.957...

Дайте мне знать в комментариях, что еще следует добавить ;)

Приятного обучения!

«mean_absolute_error()» или «mean_squared_error()» или «expanded_variance_score()»

👉 Средняя абсолютная ошибка

👉 Среднеквадратическая ошибка

👉 Объясненная оценка дисперсии

Вопросы по теме