下面哪个组件适用于离线批量处理数据?
A.Spark Streaming
B.Flink
C.MapReduce
D.Storm
A.Spark Streaming
B.Flink
C.MapReduce
D.Storm
第2题
A.Spark SQL在HDFS文件上可根据自定义方式进行文件与表的映射关系
B.Spark Streaming准实时流计算框架,数据可以消费MQ、Kafka等
C.Spark MLlib机器机器学习算法库,封装了主流的机器学习算法
D.Spark GraphX进行基于图计算的服务支持
第4题
A.Bundle类与Map不一样,它不是一个key-value类型。
B.在onCreate()方法中,可以不调用父类的同名方法。
C.onCreate()方法是具有参数的,也有返回值。
D.在四大组件之间传递数据时,Bundle常被用来封装数据。
第7题
A.Hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能
B.Impala Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据
C.Kylin Kylin?是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维析(OLAP)能力以支持超大规模数据
D.HBase HBase是一个分布式的、面向列的开源数据库