terminator12 level
获赞
269
粉丝
10
关注
7
看过 TA
72
北京航空航天大学
2017
算法工程师
IP属地:浙江
暂未填写个人简介
私信
关注
2020-05-29 10:47
已编辑
北京航空航天大学 算法工程师
一面,又被按在地上摩擦,完全不按常规出牌 (1)bert的未登录词怎么处理 (2)bert的残差网络在哪用到的 (3)lr为什么叫回归 (4)lr的极大似然函数是凸函数吗 (5)极大似然是什么
家住朝阳区的陶先生:1.mask过程种替换unk和unknown词进行训练,预测时以unk和unknown词替代未登录词 2.在Attention后对output_layer进行了dense+dropout后再合并input_layer后执行layer_norm完成残差传递,为了避免网络退化;同时防止梯度消失,使得输出的变化更敏感
投递vivo等公司10个岗位 >
0 点赞 评论 收藏
分享
2016-09-21 18:22
已编辑
北京航空航天大学 算法工程师
RT
投递360集团等公司10个岗位 >
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务