腾讯- 后台策略安全-一面凉经
部门介绍:用户借贷的信用评估之类的问题 用户画像
1min自我介绍
对机器学习哪些算法比较熟悉? LR,SVM,树模型,模型集成
XGboost介绍,优缺点
有比较过效果差异吗? 上课听过,实验做过,比赛和项目中没有用过。
XGboost和随机森林的对比。
XGboost中的行采样和列采样有什么用? 加速&降低过拟合风险
过拟合和欠拟合分别怎么解决?
实际使用中,处理的先后顺序? 先上小模型,一般欠拟合,加复杂度,发现过拟合,再正则化等。
机器学习和深度学习在处理过拟合时有什么区别?
DL需要数据量更大,数据问题更严重;各种结构设计,正则化技术和参数可供选择;early stopping等技术。这里胡扯。
数据重要还是模型重要?为什么?
数据:
学习数据的规律,数据是效果上限。
大量数据+简单模型也能够取得不错的效果,缺少数据,很难办,特别是推荐系统中。
挖掘特征,特征能够提高效果,LR+GBRT.
了解项目,问的很细。
内容特征提取时,哪种词embedding?google 新闻语料+word2vec,初始化后fine-tune.
详细介绍node2vec: 同质性,BFS;结构性,DFS.
项目中GE的时候,用的是什么连接边?只有user-item? 对。不用内容相似度作为边的权重,内容部分已经处理的比较好了。 后期有必要可以各种信息融合进去,异构信息网的embedding。
图数据集的规模。
项目中更关注BFS还是DFS? 协同过滤,更关注近邻用户,同质性。
调节了什么参数? 主要是两个概率的设置。
做题,很简单的应用问题。
User-id,日期,打卡时间。
找出某个用户,距离当前日期的连续打卡时间。#腾讯后台策略安全机器学习应用一面##腾讯##实习##面经##校招#
1min自我介绍
对机器学习哪些算法比较熟悉? LR,SVM,树模型,模型集成
XGboost介绍,优缺点
有比较过效果差异吗? 上课听过,实验做过,比赛和项目中没有用过。
XGboost和随机森林的对比。
XGboost中的行采样和列采样有什么用? 加速&降低过拟合风险
过拟合和欠拟合分别怎么解决?
实际使用中,处理的先后顺序? 先上小模型,一般欠拟合,加复杂度,发现过拟合,再正则化等。
机器学习和深度学习在处理过拟合时有什么区别?
DL需要数据量更大,数据问题更严重;各种结构设计,正则化技术和参数可供选择;early stopping等技术。这里胡扯。
数据重要还是模型重要?为什么?
数据:
学习数据的规律,数据是效果上限。
大量数据+简单模型也能够取得不错的效果,缺少数据,很难办,特别是推荐系统中。
挖掘特征,特征能够提高效果,LR+GBRT.
了解项目,问的很细。
内容特征提取时,哪种词embedding?google 新闻语料+word2vec,初始化后fine-tune.
详细介绍node2vec: 同质性,BFS;结构性,DFS.
项目中GE的时候,用的是什么连接边?只有user-item? 对。不用内容相似度作为边的权重,内容部分已经处理的比较好了。 后期有必要可以各种信息融合进去,异构信息网的embedding。
图数据集的规模。
项目中更关注BFS还是DFS? 协同过滤,更关注近邻用户,同质性。
调节了什么参数? 主要是两个概率的设置。
做题,很简单的应用问题。
User-id,日期,打卡时间。
找出某个用户,距离当前日期的连续打卡时间。#腾讯后台策略安全机器学习应用一面##腾讯##实习##面经##校招#