题目内容（请给出正确答案）

[多选题]

Spark和Hadoop的差异主要体现在以下几点（)

A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象，容错性高

B.Spark提供的数据集操作类型不仅限于Map和Reduce，大致分为：Transformations和Actions两大类

C.Spark程序由Python语言进行编写，不支持Java语言进行的程序编写

D.Spark把中间数据放到内存中，迭代运算效率高

提问人：网友罗琼 发布时间：2022-01-07

参考答案

查看官方参考答案

如搜索结果不匹配，请联系老师获取答案

网友答案

查看全部（）

· 有4位网友选择 C，占比40%
· 有2位网友选择 BC，占比20%
· 有1位网友选择 D，占比10%
· 有1位网友选择 AC，占比10%
· 有1位网友选择 ABC，占比10%
· 有1位网友选择 AD，占比10%

ABCD

提交我的答案

登录提交答案，可赢取奖励机会。

您可能会需要：

重置密码查看订单联系客服

安装简答题APP，拍照搜题省时又省心！

更多“Spark和Hadoop的差异主要体现在以下几点()”相关的问题

第1题

基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力，如下属于分布式存储组件的有（)。

A.MR

B.Spark

C.HDFS

D.HBase

点击查看答案

第2题

Spark大数据分析处理中的内存数据结构是（）。

A.RDD弹性分布式数据集

B.Key-Value

C.Record

D.Document

点击查看答案

第3题

Spark中的RDD的说法正确的是（)。

A.弹性分布式数据集

B.是Spark中最基本的数据抽象

C.代表一个可变的集合

D.代表的集合里面的元素可并行计算

点击查看答案

第4题

关于Hadoop和Spark的相互关系，以下说法正确的是？

A.Hadoop和Spark可以相互协作

B.Hadoop负责数据的存储和管理

C.Spark负责数据的计算

D.Spark要操作Hadoop中的数据，需要先启动HDFS

点击查看答案

第5题

下面描述正确的是：

A.Hadoop和Spark不能部署在同一个集群中

B.Hadoop只包含了存储组件，不包含计算组件

C.Spark是一个分布式计算框架，可以和Hadoop组合使用

D.Spark和Hadoop是竞争关系，二者不能组合使用

点击查看答案

第6题

Spark是一个高效的分布式计算系统，它有MapReduce所有优点，同时性能与Hadoop一样高。（)

Spark是一个高效的分布式计算系统，它有MapReduce所有优点，同时性能与Hadoop一样高。()

点击查看答案

第7题

Hive是一个构建于（)顶层的数据仓库工具，主要用于对存储在（)文件中的数据集进行数据整理、特殊查询和分析处理。

A.Hadoop

B.Impala

C.Spark

D.BigTable

点击查看答案

第8题

有一个键值对RDD，名称为pairRDD，包含4个元素，分别是（"Hadoop",1)、（"Spark",1)、（"Hive",1)和（"Spark",1)，则pairRDD.keys操作得到的RDD中所包含的元素是

A.”Hadoop”,”Spark”,”Hive”,”Spark”

B.”Hadoop”,”Spark”,”Hive”

C.(”Hadoop”,1),(”Spark”,1),(”Hive”,1)

D.("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)

点击查看答案

第9题

Apache软件基金会最重要的三大分布式计算系统开源项目包括

A.Hadoop

B.Spark

C.Storm

D.MapReduce

点击查看答案

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“简答题”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

微信搜一搜

简答题

点击打开微信

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

微信搜一搜

简答题

点击打开微信