1.数据归一化的原因,方法等 2.数据训练精度很高,但是预测结果却出现很多错误的结果。(过拟合) 3.中位数和平均数相等的分布(补充概率论) 4.余弦距离与欧式距离:欧氏距离体现数值上的绝对差异,而余弦距离体现方向上的相对差异。 总体来说,欧氏距离体现数值上的绝对差异,而余弦距离体现方向上的相对差异。 1)例如,统计两部剧的用户观看行为,用户A的观看向量为(0,1),用户B为(1,0);此时二者的余弦距很大,而欧氏距离很小;我们分析两个用户对于不同视频的偏好,更关注相对差异,显然应当使用余弦距离。 2)而当我们分析用户活跃度,以登陆次数(单...