关于Hive分桶的优点,以下说法正确的是?
分桶后数据物理存储更节省空间
分桶能显著提升数据写入速度
分桶使得抽样更高效且查询处理效率更高
分桶可以替代分区的功能
HDFS的关键特性包括哪些?
多方式访问机制
HA高可靠
以上都是
元数据持久化机制
在HDFS联邦环境下,NameSpace包含哪些元素?
块
以上都是
文件
目录
Hive不支持以下哪种特性?
通过INSERT INTO插入其他表的结果集
对大规模数据集实现低延迟快速查询
灵活ETL操作并直接访问HDFS
指定列分隔符定义表结构
在Hive中创建表时,若需指定列之间的分隔符为逗号,应使用以下哪个语法?
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
COLUMN SEPARATOR ','
FIELDS SEPARATED BY ','
DELIMITER ','
关于HDFS数据存储策略,以下描述正确的是?
数据存储位置由客户端决定
默认情况下,一份文件存储3份
以上描述都不正确
数据副本存储在不同机架的不同服务器
以下哪些选项是正确的?
HDFS 不适用于 大量小文件存储、随机写入。
HDFS 联邦环境下, NameSpace 包含目录、文件和块。
默认情况下,一份文件, HDFS 会存 3 份
HDFS 中 NameNode 的主备仲裁,由 ZooKeeper Failover Controller 组件控制。
以下哪些选项是正确的?
ZooKeeper 的关键特性包含以下特性:等待无关性、最终一致性、原子性和可靠性
ZooKeeper 在分布式应用中的主要作用包括:分布式协调、分布式锁、分布式会话管理、分布式配置中心
ZooKeeper 的 Leader 节点收到数据变更请求后的读写流程说法正确的是:先写磁盘再写内存
ZooKeeper 关键特性中的原子性说法正确的是:更新只能全部完成或失败,不会部分完成
HDFS 不适用于哪两类存储场景?
顺序读取
随机写入
大量小文件存储
大量大文件存储
以下哪些选项是正确的?
HBase 的主要特点有高可靠性、高性能、面向列、可伸缩
HBase 默认使用 HDFS 作为其底层文件存储系统
HBase 的主要应用场景包括:日志存储、实时数据查询、离线数据分析
HBase 的数据模型支持多版本,可以实现数据的实时更新和历史版本查询
以下关于Hive外部表的描述,正确的有哪些?(多选)
创建时必须使用EXTERNAL关键字
删除表时会同时删除元数据和底层数据
数据文件可以位于HDFS任意路径
必须与分区表联合使用
HDFS 的基本系统架构中包含DataNode 和 NameNode 节点。
HDFS 关键特性包括HA高可靠、多方式访问机制和元数据持久化机制。
删除Hive外部表时,会同时删除元数据和底层HDFS上的数据文件。
HIVE 支持灵活方便的 ETL,可直接访问 HDFS 以及 Hbase,且易用易编程。