首页 > 益智问答

网友您好，请在下方输入框内输入要搜索的题目：

请输入或粘贴题目内容搜题

搜题

拍照、语音搜题，请扫码下载APP

题目内容（请给出正确答案）

[单选题]

下面哪个组件可以将大规模的数据处理工作拆分成互相独立的任务并行处理。（）

A.HDFS

B.YARN

C.MapReduce

D.Spark

答案

查看答案

发布时间：2023-12-26

更多“下面哪个组件可以将大规模的数据处理工作拆分成互相独立的任务并行处理。（）”相关的问题

第1题

FusionInsight中，HiveServer将用户提交的HQL语句进行编译，解析成对应的Yarn任务Spark任务或者HDFS操作，从而完成数据转换，分析。（)

点击查看答案

第2题

不属于大数据平台中的组件是（）。

A.MapReduce

B.Open Stack

C.HDFS

D.Yarn

点击查看答案

第3题

请问以下哪个组件是在Hadoop2.x版本后新增加，实现hadoop集群的资源调度？（)

A.Yarn

B.Flume

C.MapReduce

D.HDFS

点击查看答案

第4题

Hadoop常见的组件包括哪些（)。

A.Hbase

B.HDFS

C.Yarn

D.Zookeeper

点击查看答案

第5题

Hadoop 2.0是由哪些核心组件组成？（)

A.HDFS、Spark

B.Hive、HCatalog

C.HDFS、YARN

D.ZooKeeper、HBase

点击查看答案

第6题

哪个组件不是SQL On Hadoop？（)

A.Hive hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能

B.Impala Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据

C.Kylin Kylin？是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维析(OLAP)能力以支持超大规模数据

D.HBase HBase是一个分布式的、面向列的开源数据库

点击查看答案

第7题

（)充分利用了MapReduce和HDFS的扩展性和容错性，是基于MapReduce开发的数据挖掘，机器学习库

A.STORM

B.MAPREDUCE

C.YARN

D.MaHout

点击查看答案

第8题

在Hadoop2.x以上版本，HDFS高可用中哪个组件负责定期合并元数据?()

A.SeconaryNN

B.Active NN

C.Standby NN

D.Journal Node

点击查看答案

第9题

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）

A.FSDataInputStream扩展了DataInputStream以支持随机读

B.为实现细粒度并行，输入分片(Input Split)应该越小越好

C.一台机器可能被指派从输入文件的任意位置开始处理一个分片

D.输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

点击查看答案

第10题

下面哪个组件适用于离线批量处理数据?

A.Spark Streaming

B.Flink

C.MapReduce

D.Storm

点击查看答案

第11题

下面哪个功能属于操作系统中的资源管理功能(单选)

A.对CPU,内存，外设以及各类程序和数据进行管理

B.实现主机和外设的并行处理以及异常情况的处理

C.控制用户的作业排序和运行

D.处理输入/输出事务

点击查看答案

账号：尚未登录

登录没有账号？去注册

购买搜题卡

下载APP

关注公众号

TOP