计算机视觉工程师的岗位,主要做OCR的 1.聊项目,比较详细的问了项目里的一些细节 2.项目里用了LSTM,问了LSTM的结构,三个门的作用 3.项目里有CTCLoss,问了一下CTC loss有什么用,不用CTC的话怎么办 4.Encoder-Decoder模型里,如果Decoder是基于Attention做的,该怎么做,是一个什么结构 5.给一个逻辑回归就是y=Wx+b,然后y接sigmoid然后接交叉熵算loss,算反传梯度,主要是反传梯度怎么算实在是有点忘了,链式求导法则倒是还记得,在面试官提醒下做出来的 竟然没有问概率统计和算法题,比较意外 ...