微众的画风太诡异了,我是八道问答题。。。 第一个是训练集,验证集,测试集的用途,怎么用这些数据来检验模型。 有一个是kernel函数和统计特征工程,svd,lda主题模型的区别和联系 有一个是请举一个矩阵分解的算法,如qr,svd等,写出其算法流程,和矩阵分解的式子(大概是这个意思)并且举个具体例子。 还有一个请从算法原理和应用场景讲述pca和*(不记得是啥了,没接触过的东西,估计是个矩阵分解的)的区别。。。 还有一个给两万个样本数据,每个数据输入参数五百个,请问有什么可能会出现的问题并且怎么解决,如果用lr和svm能不能使用。 还有个k-mean模型聚类,结果发现有偏,问出现什么问题,该怎么...