数据联邦是虚拟化的数据库,仅保存实际数据及其位置的信息或元数据。
数据集成所面临的问题主要体现在哪几个方面?
异构性
分布性
自治性
完整性
适用于群间差异小,群内个体差异较大的抽样方式为?
系统抽样
分层抽样
整群抽样
随机抽样
数据集成所涉及的各个数据源的管理系统具有强自治性,偶性关系较为紧密。
分层抽样是将总体中的各但愿先按一定顺序排列并编号,再按照一定规则抽样。
一下哪项活动更适合采用分层抽样?
调查不同规模零售店销售数据
工厂木工工资调查
居委会入户调查中老年居住满意度
晚会活动选取幸运观众
渐进抽样也就是自适应抽样。
无法确定抽样样本的数量时,可以采用哪种抽样方式?
系统抽样
分层抽样
随机抽样
自适应抽样
ETL指的是数据的哪些操作过程?
抽取
转换
集成
装载