我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练（)A.我们

我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()

A.我们随机抽取一些样本,在这些少量样本之上训练

B.我们可以试用在线机器学习算法

C.我们应用PCA算法降维,减少特征数

D.B和C

E.A和B

F.以上所有

答案

查看答案

发布时间：2021-07-20

更多“我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练（)A.我们”相关的问题

第1题

对应GradientBoostingtree算法，以下说法正确的是:（)

A.当增加最小样本分裂个数，我们可以抵制过拟合

B.当增加最小样本分裂个数，会导致过拟合

C.当我们减少训练单个学习器的样本个数，我们可以降低variance

D.当我们减少训练单个学习器的样本个数，我们可以降低bias

点击查看答案

第2题

机器学习的主旨是让计算机去模拟或实现人类的学习行为，是人工智能的核心。机器学习虽然可以在大数据训练中学到正确的工作方法，但它也很容易受到恶意干扰。通常攻击者是通过输入恶意数据来“欺骗”机器学习模型，导致其出现严重故障。近日，“Data61”机器学习小组研发出了一种机器学习的新算法。这种新算法通过类似疫苗接种的思路，帮助机器学习“修炼”出抗干扰能力。这是针对机器学习模型打造的防干扰训练，譬如，在图片识别领域，该算法能够对图片集合进行微小的修改或使其失真，激发出机器学习模型的抗干扰能力，并形成相关的自我抗干扰训练模型。这段文字意在说明：()

A.干扰机器识别图像的新方法

B.新算法助机器学习抵抗干扰

C.机器学习是人工智能的核心

D.机器学习大数据训练的方法

点击查看答案

第3题

我们想在大数据集上训练决策树,为了使用较少时间,我们可以()A.增加树的深度B.增加学习率（learnin

我们想在大数据集上训练决策树,为了使用较少时间,我们可以()

A.增加树的深度

B.增加学习率(learnin grate)

C.减少树的深度

D.减少树的数量