下面的论述中,正确的是:
A.传统的机器学习算法,由于技术和单机存储的限制,大多只能在少量数据上使用
B.利用MapReduce框架在全量数据上进行机器学习,这在一定程度上解决了统计随机性的问题,提高了机器学习的精度
C.MapReduce可以高效支持迭代计算
D.Spark无法高效支持迭代计算
A.传统的机器学习算法,由于技术和单机存储的限制,大多只能在少量数据上使用
B.利用MapReduce框架在全量数据上进行机器学习,这在一定程度上解决了统计随机性的问题,提高了机器学习的精度
C.MapReduce可以高效支持迭代计算
D.Spark无法高效支持迭代计算
B、领导行为理论认为,判断领导是否有效关键看他做什么
C、领导权变理论关注领导者能力和环境的匹配
D、领导权变理论优于领导行为理论
E、领导行为理论优于领导性格理论
A、MLlib库从1.2版本以后分为两个包:spark.mllib和spark.ml
B、spark.mllib包含基于DataFrame的原始算法API
C、spark.mllib包含基于RDD的原始算法API
D、spark.ml则提供了基于RDD的、高层次的API
A、DataFrame可容纳各种数据类型,与RDD数据集相比,它包含了模式(schema)信息,类似于传统数据库中的二维表格
B、流水线用DataFrame来存储源数据
C、转换器(Transformer)是一种可以将一个DataFrame转换为另一个DataFrame的算法
D、评估器(Estimator)是一种可以将一个DataFrame转换为另一个DataFrame的算法
A、Set(2, 0, 1, 1)
B、Set(2, 0, 1)
C、Set(2, 0)
D、以上均不正确
A、Map("bookbook" -> 5, "penpen" -> 2)
B、Map("bookbook" -> 10, "penpen" -> 4)
C、Map("book" -> 10, "pen" -> 4)
D、Map("book" -> 5, "pen" -> 2 ,"book" -> 5, "pen" -> 2)
A、(“one”,1),(“two”,1),(“three”,1)
B、(“one”,1),(“two”,2),(“three”,1)
C、(“one”,3),(“two”,2),(“three”,1)
D、(“one”,1),(“two”,2),(“three”,3)
A、t_1 等于 1
B、t的类型为Tuple3[Int, Double, java.lang.String]
C、val (first, second, _) = t // second等于3.14
D、t._0无法访问,会抛出异常
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!