关于聚类算法,下列说法中正确的有()
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.K均值聚类算法是高效的,但是比较缓慢
B.K均值聚类算法的相似度的计算是根据个簇中对象的平均值进行的
C.K均值算法使簇内对象具有较高的相似度
D.K均值算法使簇间的相似度较低
下列关于K-Means算法的说法错误的是()。
A.构建K-Means聚类模型需要对数据进行标准化
B.K-Means算法涉及空间距离计算
C.K-Means算法训练结果具有一定的随机性,所以需要多次训练
D.K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法
A.k均值算法采用误差和准则函数,其聚类目标是使准则函数值最小
B.理论上可以证明,k均值聚类算法是收敛的
C.k均值算法的聚类结果虽然收敛但不确定
D.聚类结果受设定的聚类数k、初始聚类中心和样本的分布情况影响
A.使用误差平方和作为基本聚类准则
B.设定指标参数决定是否进行“合并”或“分裂”
C.设定算法控制参数来决定算法的运算次数
D.不能自动调节最优类别数k
A.聚类算法中,同一类别内部样本的相似度较低
B.自动编码器常应用于图像抗噪和数据降维
C.聚类算法中,不同类别之间样本不交叉
D.与有监督学习相比,无监督学习更接近人类学习的过程
A.在DBSCAN算法中,将点分类核心点、边界点和噪音点三类
B.DBSCAN算法,需要指定聚类后簇的个数
C.DBSCAN算法是一种基于划分的聚类算法
D.DBSCAN算法是一种基于密度的聚类算法
A.K-means中的K表示样本簇(聚类)的数目
B.K-NN中的K表示最近邻的数目
C.二者都由用户给定且其取值都对算法性能产生重要影响
D.二者取值都必须大于1(不能等于1)
A.聚类算法无需事先指定聚类的数目,而是根据训练数据迭代得到
B.无监督学习中不需要人工标注知识
C.K-means算法与K近邻算法中最初选择的K个点会影响最终结果
D.有效的距离计算方法能够提高K-means算法的精确度
A.层次聚类算法可以用模糊数学理论来改进
B.K-均值聚类算法不可以用模糊数学理论来改进
C.K-均值聚类算法可以用模糊数学理论来改进
D.层次聚类算法不能通过模糊数学理论来改进
A.在K均值聚类算法中,我们不必事先就确定聚类数目。
B.EM算法分为求取期望和期望最大化两个步骤。
C.在K均值聚类算法中,欧式距离与方差量纲相同。
D.在K均值聚类算法中,未达到迭代次数上限,迭代不会停止。
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!