Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Los tres modelos de Regresión Lineal Robusta (RLM) que has construido usando las matrices de correlación de Pearson, Kendall, y Spearman presentan diferentes enfoques para modelar la relación entre las variables predictoras (Azúcar Residual, Alcohol, Ácido Cítrico y Dióxido de Azufre) y la variable dependiente (Densidad escalada).
- Evaluación general de los modelos
- Modelo Pearson:
- Este modelo asume una relación lineal fuerte entre las variables. Como vimos en la matriz de correlación de Pearson, el Azúcar Residual y la Densidad tienen una correlación positiva muy fuerte, mientras que el Alcohol y la Densidad tienen una relación negativa fuerte.
- Este modelo probablemente destacará las relaciones lineales, especialmente la fuerte relación entre Azúcar Residual y Densidad, así como la fuerte relación negativa entre Alcohol y Densidad.
- Debido a que Pearson es sensible a los valores extremos (outliers), si el conjunto de datos tiene valores atípicos, el ajuste del modelo puede verse afectado.
- Modelo Kendall:
- Este modelo se basa en una correlación ordinal y mide la consistencia en los rangos entre las variables. El modelo Kendall es menos sensible a los outliers, por lo que podría ser más estable si los datos contienen valores extremos o si las relaciones entre las variables no son perfectamente lineales.
- Como las correlaciones entre las variables en el análisis de Kendall son generalmente más bajas que las de Pearson, es probable que el ajuste de este modelo sea más conservador y capture relaciones monótonas en lugar de lineales estrictas.
- Azúcar Residual y Densidad aún tienen una relación positiva fuerte, pero es menos pronunciada que en Pearson.
- Modelo Spearman:
- Este modelo también mide correlaciones de rangos, pero no asume linealidad, lo que lo hace útil para relaciones no lineales. Si hay alguna no linealidad en la relación entre las variables, este modelo podría capturarla mejor que los otros dos.
- El ajuste de este modelo debería ser más robusto que el de Pearson y menos influenciado por los outliers que el modelo Pearson, pero aún más sensible a la estructura de los datos que el modelo Kendall.
- En el caso de Azúcar Residual y Densidad, la relación sigue siendo fuerte pero menos rígida en términos de linealidad.
- Consideraciones importantes:
- Azúcar Residual y Alcohol son las variables más influyentes en la densidad, según las matrices de correlación. Los tres modelos deberían reflejar esto, con Azúcar Residual mostrando una relación positiva significativa y Alcohol mostrando una relación negativa significativa.
- Dióxido de Azufre y Ácido Cítrico tienen correlaciones más débiles con la densidad en las tres matrices de correlación, por lo que es posible que estos coeficientes no sean tan significativos en ninguno de los tres modelos.
- Comparación entre los modelos:
- Modelo Pearson probablemente tendrá el ajuste más fuerte debido a las fuertes relaciones lineales que asume. Sin embargo, este modelo podría ser menos robusto frente a valores atípicos.
- Modelo Kendall ofrecerá una mejor representación si las relaciones no son perfectamente lineales o si hay valores atípicos en los datos. Sin embargo, los coeficientes serán más conservadores.
- Modelo Spearman se comportará de manera intermedia, capturando tanto relaciones lineales como no lineales y siendo más robusto que Pearson frente a valores extremos.
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement