决策树属于哪种机器学习类型?
无监督学习
监督学习
强化学习
半监督学习
树类分析主要包括以下哪种组合?
决策树、支持向量机
随机森林、K 近邻
决策树、随机森林
逻辑回归、决策树
回归类方法的主要特点是?
对局部数据探查深入
采用分割方法处理特征
始终着眼整个数据的拟合
样本量萎缩快
决策树中,分类树的分裂准则不包括以下哪项?
信息增益
最小方差
信息增益率
基尼系数
决策树剪枝的核心操作是?
对置信度足够的节点子树用内部节点代替
对置信度不够的节点子树用叶子节点代替
允许树过度拟合训练数据且不做处理
叶子节点的类标号用子树中最不频繁的类标记
条件熵(H(Y|X))表示的是?
已知 Y 条件下 X 的不确定性
已知 X 条件下 Y 的不确定性
Y 的边际熵
X 和 Y 的联合熵
信息增益(g(D,A))的计算方式是?
(H(D|A) - H(D))
(H(A) - H(D|A))
(H(D) - H(D|A))
(H(D) + H(D|A))
基于信息增益进行决策树学习的算法是?
CART 算法
ID3 算法
C4.5 算法
随机森林算法
CART 分类树选择分裂节点特征的依据是?
信息增益
信息增益率
基尼系数
最小方差
以下哪项是决策树的停止条件?
节点中所有观测属于同一类
树的深度小于设定阈值
节点观测数大于子节点阈值
有多个属性能满足分裂准则阈值
树类分析的处理方式是?
同时处理多变量进行检验
着眼整个数据拟合
对特征逐个处理,采用分割方法
不切断分层与其他节点的关系
随机森林的 “森林” 由什么组成?
多棵决策树
多棵回归树
多个支持向量机
多个 K 近邻模型
关于回归类方法和树类分析的预测能力,正确的是?
只有回归类能用于预测
只有树类分析能用于预测
两者都能用于预测分析
两者都不能用于预测
信息熵(H(X))的值与不确定性的关系是?
(H(X))越大,不确定性越小
(H(X))越小,不确定性越大
(H(X))越大,不确定性越大
(H(X))与不确定性无关
基尼系数(Gini(p))的作用是?
衡量数据的集中程度(非不确定性)
仅用于回归树分裂
表征事件的不确定性,用于 CART 分类树分裂
计算信息增益
剪枝后,叶子节点的类标号如何确定?
用该节点子树中最频繁的类标记
用父节点的类标记
随机选择一个类标记
用该节点子树中最不频繁的类标记
决策树(非参数方法)衡量变量重要性的方式是?
计算变量的回归系数大小
统计变量在树中出现的次数(不考虑分裂准则变化)
计算所有节点中因该变量导致的分裂准则函数(如残差平方和、基尼指数)的总下降幅度
仅看根节点分裂时使用的变量,根节点变量最重要,其他不重要