腾讯微信搜一搜一面凉经

上来先用编辑器写两个题:
1.   64匹马,每次最多可以赛8匹,可以知道结果的相对顺序,测多少次可以选出前4名?

2.  二分类交叉熵和多分类交叉熵的公式;

然后:
  • 知道的Sentence embedding的方式;
  • 知道的正则化方法:

回答L1L2;

介绍Dropout后,问缺点是什么?或者说,低层还是高层使用,为什么?

介绍BN后:问BN有什么缺陷?在模型中用过吗?回答效果不太好。分析原因?

了解Layer normalization吗?(这个应该才是想问的问题...感觉上面的BN缺点都是铺垫)


  • 介绍知道的梯度消失的解决方法.
  • 标签平滑方法,作用?
  • 介绍项目.
  • 了解transformer吗?了解一些。那BERT呢?不了解。为什么了解transformer不再学习BERT呢?项目中有一个模块要提取文本特征,为什么没有用BERT
  • Bagging和boosting简介,随机森林.
  • Attention的几种实现方式.


#算法面经##腾讯##面经##算法工程师#
全部评论
卧槽,和我一个朋友的一模一样
1 回复 分享
发布于 2020-04-06 11:13
听说牛客特别灵,在这儿许个愿(.......)😋
点赞 回复 分享
发布于 2020-04-05 20:08
Layer正则化是指LRN吗…
点赞 回复 分享
发布于 2020-04-05 20:59
楼主是校招吗
点赞 回复 分享
发布于 2020-04-05 22:44
&所以请问一下dropout缺点是啥,用在底层还是高层
点赞 回复 分享
发布于 2020-04-06 07:46

相关推荐

11-06 02:05
门头沟学院 Java
点赞 评论 收藏
分享
评论
5
31
分享
牛客网
牛客企业服务