• 变量的取值类型
    • 因变量:连续变量,二分类变量,等级变量、多分类变量,连续带有删失变量
    • 解释变量:连续、分类、等级变量
  • 模型选择方式:基本公式(X,Y是否正态分布)

up-d67af4789367db232c83489eb643ac99a26.png

  • 广义线性模型
    • y不是正态分布
    • 指数分布族

up-f09f303d9490ed3d5a074cdc3e4f5b233f0.png

  • glm()的用法
  • Logistic模型函数形式:

up-7334e0bd77c098a00b3a0faeda6e2fd9859.png

  • 对数线性模型 分类变量 层次变量

up-bc1b000643cfa0f7df44dc367f931caca7c.png

  • 一般线性模型

y正态分布,x非正态分布

  • 完全随机设计方差分析,只考虑一个随机因素
  • 随机单位组设计模型
#建立全变量logistic回归模型
d5.1=read.table('clipboard',header = T)
logit<-glm(y~x1+x2+x3,family = binomial,data=d5.1)
summary(logit)
#逐步筛选变量logistic回归模型
logit.step=step(logit)
summary(logit.step)
#对数Poisson回归模型
d5.2=read.table('clipboard',header = T)
log=glm(y~x1+x2,family=poisson,data=d5.2)
summary(log)
#一般线性回归模型
d5.3=read.table('clipboard',header = T)
#完全随机设计方差分析
anova(lm(Y~factor(A),data = d5.3))
#随机单位组设计模型
d5.4=read.table('clipboard',header = T)
anova(lm(Y~factor(A)+factor(B),data = d5.4))

参考资料: https://next.xuetangx.com/course/JNU07011000851/151569

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐