下列关于数据预处理环节简化数据的表述中,不正确的是()。
A.过多的数据会导致模型训练效率低下。
B.初学者进行数据分析时需要简化数据,专业数据分析师不需要简化数据。
C.简化数据时,需要保证数据集的信息不过多损失。
D.在样本量增加到一定程度后,信息含量趋近于不变。
A.过多的数据会导致模型训练效率低下。
B.初学者进行数据分析时需要简化数据,专业数据分析师不需要简化数据。
C.简化数据时,需要保证数据集的信息不过多损失。
D.在样本量增加到一定程度后,信息含量趋近于不变。
A.数据清洗的目的是为了提高数据质量
B.空值一定要删除
C.数据预处理包括数据的清洗、合并、重塑与转换
D.在Pandas中,缺失值使用NaN表示
A.因子分析是一种降维、数据简化技术
B.因子分析前,不需要对原始数据进行标准化处理
C.因子分析的假设前提是观测变量能够转换为一系列潜在因子的线性组合
D.因子分析中的公共因子是可以直接观测的共同影响因素
E.因子分析的出发点是从显在变量提炼潜在因子,判定和消除指标间的信息重叠
A.Excel2010是表格处理软件
B.Excel2010不具有数据库管理能力
C.Excel2010具有报表编辑、分析数据、图表处理、连接及合并等能力
D.在Excel2010中可以利用宏功能简化操作
A.JavaScript中的变量可以具有多种数据类型,根据程序动态运行情况决定
B.JavaScript中的整型长度与是计算机的执行环节和操作系统无关
C.JavaScript中的整型数据和浮点型数据是严格区分的
D.JavaScript中字符串类型采用的国际字符集Unicode
A.遥感数据可以用于监测城市大气污染
B.遥感数据可以直接获取城市规划中需要地物的社会属性
C.气象卫星数据可以用于监测城市热岛效应
D.高分辨率卫星影像可以用于发现道路上的车辆
A.列标志应位于数据清单的第一行
B.尽量在一张工作表上建立一个数据清单
C.避免在数据清单中间放置空白的行或列
D.同一列中各行数据项的类型和格式应当完全相同