下面有关聚类的说法正确的是?
A.聚类与分类类似,需要把没有类别标签的样本根据距离分组。
B.聚类需要根据样本的距离,距离近的分为一组,反之划分到不同的组。
C.对于同一批样本,使用不同聚类算法得到的结果是相同的。
D.聚类的类别在分析前就很容易确定。
A.聚类与分类类似,需要把没有类别标签的样本根据距离分组。
B.聚类需要根据样本的距离,距离近的分为一组,反之划分到不同的组。
C.对于同一批样本,使用不同聚类算法得到的结果是相同的。
D.聚类的类别在分析前就很容易确定。
B.A:hover是鼠标正在按下时链接文字的样式
C.A:link是未被访问的链接样式
D.A:visited是鼠标正在按下时链接文字的样式
有关聚类的说法,错误的是?
A、对聚类的样本可以继续分类,从而可以获得各类样本的特征。
B、对于一些异常的样本,在聚类时可以单独处理,可能得到有用的异常模式。
C、对于任意形状分布的样本,基于密度的聚类算法可能得到有用的分组。
D、检验聚类算法的好坏只要看SSE(每个样本与聚类簇中心的距离的平方和)是否最小。
有关kmeans算法,正确的说法是?
A、kmeans只能处理凸型分布的非数值型样本。
B、kmeans算法需要在聚类前确定类数k,这个k值需要有助于解释各类的业务含义。
C、kmeans聚类的过程与初始的k个假设的聚类中心的选择没关。
D、kmeans算法对异常样本非常敏感,因此在聚类前要把异常样本直接删除。
下面有关聚类的说法不正确的是?
A、kmeans算法各聚类中心与其几何重心是重合的,对于凸型数据集初始的假设聚类中心尽量距离远一些。
B、在计算样本之间的距离时,对样本不同量纲的数据属性进行标准化是必要的。
C、Kohonon神经网络在计算过程中需要计算样本之间的距离。
D、当聚类的组数比较多时,可以把距离较近的簇合并。
以下有关聚类算法,不正确的说法是哪些?
A、对于基于密度的聚类而言,不是根据样本的距离,而是根据样本的密度进行分组的。
B、在基于密度的聚类中,样本的邻域距离阈值参数不同,可能得到不同的聚类结果。
C、在聚类过程中,非数值型属性必须转为数值属性才能进行聚类分析。
D、在使用kmeans聚类时,k值总是很容易给出。
有关kmeans算法,以下正确的说法有哪些?
A、kmeans算法对于非凸型的聚类不能产生聚类结果。
B、在确定样本集是否可以使用kmeans算法时,可以先对数据集进行可视化观察样本集的大致分布。
C、初始聚类中心的选择会影响kmeans算法的收敛速度。
D、kmeans需要多次迭代,因此对于大的样本集速度求解比较慢。
聚类是一类重要的机器学习算法,以下哪些场景不属于聚类问题?
A、某网商对客户的购物行为进行分析,从而分析不同组用户的偏好。
B、对数据库的论文根据内容主题的不同做划分。
C、判断一个网络访问是否为入侵访问。
D、根据学生的成绩,给出学生的名次。
有关聚类的算法,正确的说法有以下哪些?
A、类似Kmeans基于划分的聚类与基于层次的聚类都是样本的距离为划分基础。
B、聚类的结果要考虑业务的可解释性。
C、自底向上的层次聚类算法对样本的输入顺序比较敏感。
D、聚类的簇密度指样本的个数多少。
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!