聚类分析的核心特点不包括以下哪项?
是无监督学习过程
需预先给出分类标准
划分的类是未知的
能从样本数据自动分类
K-means 算法的目标函数是最小化什么?
簇内点与簇质心的距离平方和
簇间点的距离平方和
簇内点的数量之和
簇质心之间的距离平方和
层次聚类中 “单连接” 的类间距离定义为?
一类所有实例到另一类所有实例的最长距离
一类所有实例到另一类所有实例的最短距离
两类质心之间的距离
两类实例数量的比值
以下哪项体现了聚类分析的 “探索性”?
需先训练得到规则再应用于数据
从样本数据出发自动分类,无需预先给分类标准
只能处理已知类别的数据
必须指定簇的数量才能执行
K-means 算法中簇的数量k的确定方式是?
算法自动计算得出
必须预先指定
等于数据集中不同类别的真实数量
与数据维度一致
层次聚类(凝聚法)的主要步骤最终会?
停止在用户指定的簇数量
随机停止
直到所有数据合并为一个类别
每次合并多个类别
以下不属于商业领域中聚类应用的是?
确定客户群
描绘客户特征
定制化客户管理
压缩图片、影像
层次聚类中 “全连接” 的类间距离定义为?
一类所有实例到另一类所有实例的最短距离
一类所有实例到另一类所有实例的最长距离
两类中距离最近的两个实例的距离
两类质心之间的欧氏距离
K-means 算法属于哪种聚类类型?
软聚类(点可属于多个簇)
硬聚类(点仅属于一个簇)
只能用于有监督场景的聚类
仅能处理线性可分数据的聚类
聚类分析与分类分析的本质区别是?
聚类需要标签,分类不需要标签
聚类是无监督(类别未知),分类是有监督(类别已知)
聚类只能处理高维数据,分类只能处理低维数据
聚类的计算效率远低于分类