以下哪种方法不属于分类算法?
决策树 (Decision Tree)
支持向量机 (Support Vector Machine)
线性回归 (Linear Regression)
K近邻 (K-Nearest Neighbors)
在使用 KNN 分类算法时,下列哪一项可以显著影响分类结果?
数据的标准化
K 值的选择
特征的数量
其余所有
支持向量机分类的核心思想是:
通过条件概率预测类别
寻找最近的样本点进行预测
寻找最大化类别间间隔的超平面
通过深度学习网络预测类别
当分类问题的类别非常不平衡时,下列哪种方法是适合的?
增加数据样本的数量
使用准确率作为唯一评价指标
使用 F1 分数代替准确率
忽略少数类的样本
以下哪种分类算法使用树结构进行决策?
逻辑回归 (Logistic Regression)
决策树 (Decision Tree)
支持向量机 (SVM)
K近邻 (KNN)
朴素贝叶斯分类算法中的“朴素”假设是指:
数据是线性可分的
所有特征相互独立
类别数量相等
数据分布是均匀的
在随机森林算法中,模型性能提升的关键是:
通过集成多棵独立决策树减少过拟合
使用不同核函数
每棵树都使用相同的训练数据
使用稀疏数据集
在分类问题中,下列哪种操作通常用于减少模型过拟合?
使用更多的训练数据
降低特征维度
使用交叉验证
其余均是
SVM 中使用核函数的主要作用是:
降维
将数据映射到更高维以实现线性可分
减少训练时间
去除噪声点
随机森林相较于单棵决策树的优势不包括:
降低过拟合
对高维特征鲁棒
模型可解释性更强
使用特征子集减少方差
逻辑回归是一种用于回归分析的算法,因此不能用于分类问题。
AdaBoost是一种提升分类性能的算法,但只能用于二分类问题。
决策树算法容易受到过拟合的影响。
SVM 的目标是最大化间隔(margin)。
KNN 算法中 K 值越大越容易过拟合。