腾讯视频一面二面记录
更新
1.怎么判定DIN模型已经收敛到一个比较好的状态了,而没有欠拟合和过拟合?面试官说不能只看AUC和loss 我想问还有没有别的东西可以拿来check?
2.文本特征在输进DIN模型之前有没有更好的建模方式?我当时说的是本地创建一个词表,比如常见字有1000个,生成的词向量有5维,embedding层就是5*1000的矩阵,通过实际label和DIN输出的对candidate点击率的预估,用focal loss做损失函数,然后反向传播更新DIN和embedding层的参数。参数更新好之后,把词中的字对应的one-hot编码先输入embedding层,得出的向量就是有语义信息的向量。 面试官的意思是想要更好的文本建模方式,但她也没说什么算更好的方式
3.在线如果用DIN给某一个用户做推荐,这个用户id嵌入是存在什么地方呢?(拼多多也问过,具体是存在哪?)如果用户量级比较大,比如像抖音、大众点评,那么从大量的用户id嵌入中找出张三的id会不会有内存压力?
4.双层Attention的DIN 第一层Multi-Head这里有几个头?比较合适呢?如果序列长度为30的话
如果路过的UU会的话,能不能给我解答一下呀?
02.27投递 03.04约一面
03.07一面 项目40mins
八股:介绍DIN模型
代码:最长递增子序列
一面结束后两小时查到通过
03.14二面
无代码环节
八股:欠拟合 过拟合
文本特征怎么处理才能输入模型呢?有没有更好的建模方式?
03.18 面试流程结束
1.怎么判定DIN模型已经收敛到一个比较好的状态了,而没有欠拟合和过拟合?面试官说不能只看AUC和loss 我想问还有没有别的东西可以拿来check?
2.文本特征在输进DIN模型之前有没有更好的建模方式?我当时说的是本地创建一个词表,比如常见字有1000个,生成的词向量有5维,embedding层就是5*1000的矩阵,通过实际label和DIN输出的对candidate点击率的预估,用focal loss做损失函数,然后反向传播更新DIN和embedding层的参数。参数更新好之后,把词中的字对应的one-hot编码先输入embedding层,得出的向量就是有语义信息的向量。 面试官的意思是想要更好的文本建模方式,但她也没说什么算更好的方式
3.在线如果用DIN给某一个用户做推荐,这个用户id嵌入是存在什么地方呢?(拼多多也问过,具体是存在哪?)如果用户量级比较大,比如像抖音、大众点评,那么从大量的用户id嵌入中找出张三的id会不会有内存压力?
4.双层Attention的DIN 第一层Multi-Head这里有几个头?比较合适呢?如果序列长度为30的话
如果路过的UU会的话,能不能给我解答一下呀?
02.27投递 03.04约一面
03.07一面 项目40mins
八股:介绍DIN模型
代码:最长递增子序列
一面结束后两小时查到通过
03.14二面
无代码环节
八股:欠拟合 过拟合
文本特征怎么处理才能输入模型呢?有没有更好的建模方式?
03.18 面试流程结束
全部评论
相关推荐
03-19 21:45
新疆大学 算法工程师 点赞 评论 收藏
分享