我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()A.我们
我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()
A.我们随机抽取一些样本,在这些少量样本之上训练
B.我们可以试用在线机器学习算法
C.我们应用PCA算法降维,减少特征数
D.B和C
E.A和B
F.以上所有
我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()
A.我们随机抽取一些样本,在这些少量样本之上训练
B.我们可以试用在线机器学习算法
C.我们应用PCA算法降维,减少特征数
D.B和C
E.A和B
F.以上所有
第1题
A.当增加最小样本分裂个数,我们可以抵制过拟合
B.当增加最小样本分裂个数,会导致过拟合
C.当我们减少训练单个学习器的样本个数,我们可以降低variance
D.当我们减少训练单个学习器的样本个数,我们可以降低bias
第2题
A.干扰机器识别图像的新方法
B.新算法助机器学习抵抗干扰
C.机器学习是人工智能的核心
D.机器学习大数据训练的方法
第3题
A.增加树的深度
B.增加学习率(learnin grate)
C.减少树的深度
D.减少树的数量
第4题
1.我们必须在使用PCA前规范化数据
2.我们应该选择使得模型有最大variance的主成分
3.我们应该选择使得模型有最小variance的主成分
4.我们可以使用PCA在低维度上做数据可视化
A.1,2and4
B.2and4
C.3and4
D.1and3
E.1,3and4
第5题
A.根据样本数据,采用分类算法,训练分类器
B.根据样本数据,进行回归分析
C.将未知类别的一组数据,采用聚类方法,分成不同的组
D.机器人在报考环境中,自主学习掌握行走方法
第7题
1.一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
2.如果增加模型复杂度,那么模型的测试错误率总是会降低
3.如果增加模型复杂度,那么模型的训练错误率总是会降低
4.我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习
A.1
B.2
C.3
D.1and3