大数据计算任务中,关于IO密集型任务的描述不正确的是哪一项?
CPU消耗很少,任务的大部分时间都在等待IO操作完成
任务越多,CPU效率越高
要进行大量的计算,消耗CPU资源
通过提升网络传输效率和读写效率可大幅度提升性能
以下关于大数据和传统数据库数据的特点描述不正确的是?
大数据是对“池塘中的鱼”进行数据处理,目标明确;传统数据库的数据处理是通过某些“鱼”判断其他种类的“鱼”是否存在
大数据处理的数据类型很多,包括结构化、非结构化和半结构化的数据;传统故据库的数据类型较为单一,常以结构化为主
在大数据中,并没有统一的数据工具,即"No size fits all";在传统数据库中,常常一个工具就能解决某个问题,即”One size fits all"
大数据的数据规模很大一般以TB、PB作为数据处理单位;传统数据库中数据规模一般较小常以MB作为数据处理单位
硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存几份?
1
2
3
4
在HDFS联邦机制下,各NameNode间元数据是不共享的。
正确
错误
HDFS中NameNode的主备仲裁,是由哪个组件控制的?
HDFS Client
NodeManager
DataNode
Zookeeper Failover Controller