Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

VIFs retornando coeficientes de alias em R


Use a função 'alias' em R para ver quais variáveis ​​são linearmente dependentes. Remova as variáveis ​​dependentes e a função vif deve funcionar corretamente.
formula <- as.formula(Spring_Autumn ~ Oct + Nov + Dec + Jan + Feb + Mar + Apr + May + Jun + Jul + Aug + Sep + X1min + X3min +   X7min + X30min + X90min + X1max + X3max + X7max + X30max + X90max + BF + Dmin + Dmax+ LP + LPD + HP + HPD + RR + FR + Rev, data = IHA_stats)
fit <-lm(formula)

#the linearly dependent variables
ld.vars <- attributes(alias(fit)$Complete)$dimnames[[1]]

#remove the linearly dependent variables variables
formula.new <- as.formula(
    paste(
        paste(deparse(formula), collapse=""), 
        paste(ld.vars, collapse="-"),
        sep="-"
    )
)

#run model again
fit.new <-lm(formula.new)
vif(fit.new)

NOTA:Isso não funcionará no caso de você ter variáveis ​​fictícias geradas automaticamente que são idênticas a outras variáveis. Os nomes das variáveis ​​ficam confusos. Você pode criar seu próprio hack para contornar isso.