更多“进行数据离散化的原因不包括”相关的问题
第1题
我们想要训练一个 ML 模型,样本数量有 100 万个,特征维度是 5000,面对如此大数据,如何有效地训练模型(多选)?
A、对训练集随机采样,在随机采样的数据上建立模型
B、尝试使用在线机器学习算法
C、使用 PCA 算法减少特征维度
点击查看答案
第2题
SVM算法的最小时间复杂度是O(n*n)。基于这一点,以下哪种规格的数据集并不适用于该算法?
A.大数据集
B.小数据集
C.中数据集
D.不受数据集大小的影响
点击查看答案
第3题
如果一个模型在训练集上正确率为99%,测试集上正确率为60%。我们应该怎么做()。
A.加入正则化项
B.增加训练样本数量
C.增加模型复杂度
D.减少模型复杂度
点击查看答案
第4题
是在数据挖掘过程结束后,模型应用的实际数据集,验证集用于在实践中检验模型.属于()
点击查看答案
第5题
评价一个算法性能好坏的重要标准是()。
A.算法的鲁棒性
B.算法的可读性
C.算法的时间复杂度和空间复杂度
D.算法的正确性
点击查看答案
第6题
提高图像分类的准确度,可以考虑以下哪些方法?
A.使用预训练的网络模型
B.数据增强增加训练数据
C.调整超参
D.减少训练数据集
点击查看答案
第7题
用离散数据建立DTM模型中不可缺少的一个步骤是离散数据网格化。
点击查看答案
第8题
()是对决策问题建立模型。先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找最佳的匹配。
A.回归算法
B.正则化方法
C.基于实例的算法
D.决策树算法
点击查看答案
第9题
下列的哪种方法可以用来抑制深度学习模型的过拟合现象?
A.增加更多的数据
B.使用数据扩增技术
C.使用归纳性更好的模型
D.降低模型的复杂度
点击查看答案
第10题
人工智能技术得到迅猛发展的原因不包括
A.计算能力的提升
B.大数据的突破
C.算法的增强
D.人口红利的消失
点击查看答案