下列对Hadoop各组件的理解正确的是()。
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
A.Tez:支持DAG作业的计算框架
B.Kafka:分布式发布订阅消息系统
C.Pig:处理大规模数据的脚本语言
D.Oozie:工作流和协作服务引擎
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
A.MPP数据库和Hadoop技术均有其各自的优劣势以及适用的场景
B.实际应用中不必须采用MPP数据库和Hadoop技术的混搭方案
C.对于大规模的复杂分析、即时查询、多表复杂关联等场景,由MPP数据库处理
D.非结构化数据处理、流处理以及大规模批量复杂作业,由Hadoop架构负责
A、HADoop的核心是HDFS和MApREDuCE
B、HADoop是基于JAA语言开发的,只支持JAvA语言编程
C、HADoop2.0增加了NAmENODEHA和WE-CompATiBiliTy两个重大特性
D、HADoopMApREDuCE是针对谷歌MApREDuCE的开源实现,通常用于大规模数据集的并行计算
A.Hadoop和Spark不能部署在同一个集群中
B.Hadoop只包含了存储组件,不包含计算组件
C.Spark是一个分布式计算框架,可以和Hadoop组合使用
D.Spark和Hadoop是竞争关系,二者不能组合使用
A.提供多种数据集操作类型而不仅限于MapReduce
B.数据集中式计算更加高效
C.提供了内存计算,带来了更高的迭代运算效率
D.基于DAG的任务调度执行机制
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!