El error cuadrático medio (RSME, por sus siglas en inglés) es una métrica utilizada para evaluar la precisión de un modelo de regresión. Es una medida de la diferencia entre los valores predichos por el modelo y los valores reales. En Python, podemos calcular el RSME utilizando una fórmula específica.
En este artículo, exploraremos en detalle la fórmula para calcular el RSME en Python y proporcionaremos un ejemplo práctico para ilustrar su uso.
Definición del error cuadrático medio
El error cuadrático medio es una medida de la dispersión de los errores en un modelo de regresión. Se calcula tomando la raíz cuadrada de la media de los errores al cuadrado. Cuanto menor sea el valor del RSME, mejor será la precisión del modelo.
El RSME se utiliza comúnmente en problemas de regresión, donde se busca predecir un valor numérico continuo en función de variables independientes. Por ejemplo, si estamos construyendo un modelo para predecir el precio de una casa en función de su tamaño y ubicación, podemos utilizar el RSME para evaluar qué tan bien se ajusta nuestro modelo a los datos reales.
Fórmula del error cuadrático medio
La fórmula para calcular el RSME en Python es la siguiente:
RSME = sqrt(mean_squared_error(y_true, y_pred))
Donde:
– y_true es una lista o array que contiene los valores reales.
– y_pred es una lista o array que contiene los valores predichos por el modelo.
La función mean_squared_error calcula el error cuadrático medio sin la raíz cuadrada. Para obtener el RSME, simplemente tomamos la raíz cuadrada del resultado.
Ejemplo de cálculo del error cuadrático medio en Python
Ahora veamos un ejemplo práctico de cómo calcular el RSME en Python. Supongamos que tenemos los siguientes valores reales y predichos:
«`python
y_true = [3, 5, 7, 9, 11]
y_pred = [2.5, 5.5, 6.8, 8.9, 10.5]
«`
Para calcular el RSME, primero necesitamos importar la función mean_squared_error de la biblioteca sklearn.metrics y la función sqrt de la biblioteca math:
«`python
from sklearn.metrics import mean_squared_error
from math import sqrt
«`
A continuación, podemos calcular el error cuadrático medio utilizando la fórmula mencionada anteriormente:
«`python
rsme = sqrt(mean_squared_error(y_true, y_pred))
«`
Finalmente, podemos imprimir el valor del RSME:
«`python
print(«RSME:», rsme)
«`
El resultado será:
«`
RSME: 0.6923076923076923
«`
Esto significa que el RSME para este ejemplo es aproximadamente 0.6923.
Conclusiones
El error cuadrático medio (RSME) es una métrica útil para evaluar la precisión de un modelo de regresión en Python. Se calcula tomando la raíz cuadrada de la media de los errores al cuadrado. Cuanto menor sea el valor del RSME, mejor será la precisión del modelo.
En este artículo, hemos explorado en detalle la fórmula para calcular el RSME en Python y hemos proporcionado un ejemplo práctico para ilustrar su uso. Esperamos que esta información te sea útil al evaluar la precisión de tus modelos de regresión en Python.