在数据仓库项目中,通常工作量占比最大的阶段是
需求分析
模型设计
ETL 规则设计与实施
前端报表开发
将业务系统“全角数字字符、日期越界”等问题数据找出,属于 ETL 的哪一子过程?
数据抽取
数据清洗
数据转换
数据加载
把“同一供应商在结算系统编码 XX0001,在 CRM 编码 YY0001”统一成唯一编码,这一过程属于
粒度转换
不一致数据转换
商务规则计算
主外键约束
ETL三个部分是指:
数据抽取
数据清洗
数据转换
数据加载
在 ETL 的“数据加载”环节,提到的加载策略有
时间戳增量加载
日志表增量加载
全表对比加载
微批流式加载
数据湖可原生存放结构化、半结构化、非结构化数据