题目内容
(请给出正确答案)
[多选题]
我们想要减少数据集中的特征数,即降维.选择以下适合的方案:()。
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
答案
查看答案
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
第9题
A.因子分析是一种降维、数据简化技术
B.因子分析前,不需要对原始数据进行标准化处理
C.因子分析的假设前提是观测变量能够转换为一系列潜在因子的线性组合
D.因子分析中的公共因子是可以直接观测的共同影响因素
E.因子分析的出发点是从显在变量提炼潜在因子,判定和消除指标间的信息重叠
第10题
A.塔板受腐蚀,孔径增大,产生漏液,应增加塔釜热负荷
B.筛孔被堵塞,孔径减小,孔速增加,雾沫夹带严重,应降低负荷操作
C.塔板脱落,理论板数减少,应停工检修
D.降液管折断,气体短路,需更换降液管
第11题
A.云计算的主要特点是非常昂贵。
B.大数据是多源、异构、动态的复杂数据,即具有4V特征的数据
C.大数据是数据科学的研究对象之一
D.MapReduce是采用云计算这种新的计算模式研发出的具体工具软件(或算法)