关于混合模型聚类算法的优缺点,下面说法正确的是()。
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。
C.混合模型很难发现不同大小和椭球形状的簇。
D.混合模型在有噪声和离群点时不会存在问题
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。
C.混合模型很难发现不同大小和椭球形状的簇。
D.混合模型在有噪声和离群点时不会存在问题
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。
C.混合模型很难发现不同大小和椭球形状的簇。
D.混合模型在有噪声和离群点时不会存在问题。
下列关于K-Means算法的说法错误的是()。
A.构建K-Means聚类模型需要对数据进行标准化
B.K-Means算法涉及空间距离计算
C.K-Means算法训练结果具有一定的随机性,所以需要多次训练
D.K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法
A.JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。
B.JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。
C.JP聚类是基于SNN相似度的概念。
D.JP聚类的基本时间复杂度为O(m)。
A.它使用最小均方误差准则来确定转换函数
B.它具有软聚类、增量学习和连续概率转换的特点
C.它所建立的转换函数是不连续的,容易导致语音内部频谱不连续
D.它会给转换特征带来过平滑的问题,导致语音的音质下降
A、k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B、k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C、k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D、k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
A.聚类与分类类似,需要把没有类别标签的样本根据距离分组。
B.聚类需要根据样本的距离,距离近的分为一组,反之划分到不同的组。
C.对于同一批样本,使用不同聚类算法得到的结果是相同的。
D.聚类的类别在分析前就很容易确定。
A.在DBSCAN算法中,将点分类核心点、边界点和噪音点三类
B.DBSCAN算法,需要指定聚类后簇的个数
C.DBSCAN算法是一种基于划分的聚类算法
D.DBSCAN算法是一种基于密度的聚类算法
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.关于K-Mean和二分K-Means算法对于同样的K值得到的聚类结果基本相同
B.一般来说.K-Mean比二分K-Means算法的聚类结果要好(具有更小的误差平方和)
C.一般来说.K-Mean算法在迭代过程中,应用了二分K-Means算法
D.一般来说.二分K-Means算法比K-Means的聚类结果要好(具有更小的误差平方和)
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!