以下哪种数据形式是半结构化数据( )。
视频
表格
文字
HTML
当利用Python采集企业资产负债表时,在url里设置( )地址。
info.get
incomestatement.get
balancesheet.get
cashflow.get
大数据包含如下类别( )。
结构化数据
非结构化数据
半结构化数据
类结构化数据
以右表为基础,根据两表的关联条件将两表连接起来,这种连接方式是( )。
全连接
内连接
左连接
右连接
数据集成最常见的两种方法是( )。
数据连接
数据关联
数据合并
数据整理
只显示满足关联条件的左右两表的数据记录,不符合的条件的数据不使用。这种连接方式为( )。
内连接
全连接
左连接
右连接
以下说法正确的是( )。
数据清洗是一次性工作,只需完成一次
数据来源具有多样性,无需进行清洗
数据清洗时需要先观察数据
数据中有缺失值的字段可以直接删除
以下哪些内容是常见的数据清洗问题( )。
数值为空,有缺失
有影响指标计算的非法字符,如英文逗号、空格等
重复数据
日期、时间格式不一致
当我们需要用到的维度,在数据表原始数据中没有时,我们可以通过( )来实现。
添加层级
添加计算字段
添加过滤
添加辅助线
当我们需要用到的指标,在数据表原始数据中没有时,我们可以通过( )来实现。
添加层级
添加计算字段
添加过滤
添加辅助线