Show Menu
Cheatography

Regresión multi-polinónimica con R Cheat Sheet by

Regresión multi-polinónimica con R

Sintaxis

 

Formato stargazer para summary

librar­y(s­tar­gazer)
starga­zer­(ols, type = "­tex­t")

Selección del mejor modelo de regresión lineal

Después de hacer comprobado el mejor modelo, se hace summar­y(mod) y se quitan las variables mayores de 0.05 en Pr(>|t|). Después comparamos R2, AIC y BIC con el anterior modelo.
Opción 1
step(m­od,­dir­ect­ion­="ba­ckw­ard­")
Opción 2
mod_cte= lm(wag­e~1­,da­ta=­wage1)
step(m­od_­cte­,di­rec­tio­n="f­orw­ard­"­,sc­ope­=li­st(­low­er=­mod­_cte, upper=­mod))
Opción 3

incluir no-lin­ealidad en un modelo de regresión

model1 <- lm(wage ~ educ, data = wdata)
lineal
model2 <- lm(wage ~ educ+I­(ed­uc^2), data = wdata)
cuadrático
model3 <- lm(log­(wage) ~ educ, data = wdata)
expone­ncial
 

10. Extracción del estadí­stico F y su p-valor

fstat.all <- output­$fs­tat­ist­ic[1]

Diagnosis regresión lineal múltiple (1 extra)

Relativos a los residuos
Los errores del modelo han de seguir una distri­bución normal (1er gráfico) con media 0 y varianza σ2 constante (2do gráfico)
Relativos al modelo
Los puntos han de ajustarse a la estructura lineal consid­erada (3er gráfico)
Relativos a las observ­aciones anómalas
Puede que algunas de las observ­aciones no se ajusten al modelo, compro­met­iendo su validez general (4to gráfico)
Relativos a las variables indepe­ndi­entes
Ninguna de las variables explic­ativas es combin­ación lineal de las demás. En el caso de regresión múltiple es de especial interés el fenómeno de la coline­alidad (o multic­oli­nea­lidad). Cuando algunas variables explic­ativas estén altamente correl­aci­onadas entre sí, tendremos una situación de alta coline­alidad. En este caso las estima­ciones de los parámetros pueden verse seriamente afectadas:
Problemas de coline­alidad
Tendrán varianzas muy altas (serán poco eficie­ntes)
Habrá mucha depend­encia entre ellas (al modificar ligera­mente el modelo, añadiendo o eliminando una variable o una observ­ación, se producirán grandes cambios en las estima­ciones de los efectos).
Incluso puede ocurrir que el contraste de regresión sea signif­icativo (alto coefic­iente de determ­ina­ción), pero los contrastes indivi­duales sean no signif­ica­tivos.
Por último
confirméis con evidencias numéricas y contra­stadas las hipótesis de homoce­das­ticidad de los residuos y la existencia de una relación lineal entre los valores ajustados y los residuos.
 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.

          Related Cheat Sheets

          ggplot2-scatterplots Cheat Sheet
          iGraph Cheat Sheet
          Introductory Statistics in R Cheat Sheet

          More Cheat Sheets by julenx

          Python 1.1 Numpy Cheat Sheet
          Python pandas Cheat Sheet
          R Cheat Sheet