K-means 算法的簇中心是()
数据中真实存在的点
簇内所有点的均值(虚拟点)簇内出现次数最多的点
簇内出现次数最多的点
距离其他点最远的点
K-means 对以下哪种情况最敏感()
数据量大小
噪声与离群点
数据维度高低
簇的形状是否不规则
K-modes 算法主要解决 K-means 的什么问题()
对离群点敏感
只能处理数值型数据
初始中心选择差
计算速度慢
K-means++ 算法的核心改进是
用曼哈顿距离代替欧氏距离
优化初始聚类中心的选择
用真实点作为簇中心
支持分类数据聚类
聚类是无监督学习,不需要数据标签。
PAM 算法会通过 “替换中心点、计算代价” 来迭代优化聚类结果。
K‑中心点使用曼哈顿距离,对极端值更稳健。
K-means++ 会尽可能选择距离较近的点作为初始中心。()