小红书视觉多媒体算法实习凉经
一面
1.1介绍项目1
1.2.讲一下cyclegan的结构和损失函数
1.3.讲一下L1和L2的区别
追问.L1和L2怎么计算
追问.特征提取中如果要降维度应该用哪个?L1
2.1介绍项目2
2.2.bert的原理
2.3.为什么要用多头注意力?类似卷积操作,关注更多地方
2.4.讲一下self attention
2.5.计算公式及意义
2.6.QKV意义
算法:最长递增子序列
dp,刚才突然看懂了,面试的时候怎么就没想到(●—●)
许愿下次offer#算法工程师面经##小红书##实习#
1.1介绍项目1
1.2.讲一下cyclegan的结构和损失函数
1.3.讲一下L1和L2的区别
追问.L1和L2怎么计算
追问.特征提取中如果要降维度应该用哪个?L1
2.1介绍项目2
2.2.bert的原理
2.3.为什么要用多头注意力?类似卷积操作,关注更多地方
2.4.讲一下self attention
2.5.计算公式及意义
2.6.QKV意义
算法:最长递增子序列
dp,刚才突然看懂了,面试的时候怎么就没想到(●—●)
许愿下次offer#算法工程师面经##小红书##实习#