字节cv正式批二面凉经

被拷打1h30min
1.自我介绍
2.详细介绍一下实习的项目,从数据构建,benchmark构建到最终取得的效果
3.stable diffusion的结构与原理
4.项目里设计的模型与原始SD结构的差异,具体通过什么方式实现
5.做一下题目:
1.手撕transformer里面的cross attention与mask-filled 的self attention,可以用torch,最好不用nn.Multiheadattention,自己定义输入q,k,v
2. 给定二值图像,找出两个不连通的图形,分别是五角形与圆形,输出位置坐标与类型,不能用opencv等图像处理库。
6. 回到八股
CNN与transformer区别
为什么transformer可以更好建模长距离依赖
CNN提升全局信息利用最简单直接的方式
说一下分割的代表性架构与前沿研究,FCN系列和Transformer系列,优缺点
说一下目标检测的代表性架构与前沿研究,优缺点

反问
手撕基本只能撕一半,感觉凉,强度很大,不愧是宇宙厂。其他问题基本答的也还行
#晒一晒我的offer##字节跳动##计算机视觉岗##算法#
全部评论
楼主啥时候二面的?现在约3面了吗
1 回复 分享
发布于 2023-08-31 13:06 北京
项目里设计的模型与原始SD结构的差异 ,还自己设计sd模型吗,这么有卡去训练
点赞 回复 分享
发布于 2023-08-31 10:57 上海
给定二值图像,找出两个不连通的图形,分别是五角形与圆形 请问怎么做呢 感谢
点赞 回复 分享
发布于 2023-10-04 15:24 上海

相关推荐

3 39 评论
分享
牛客网
牛客企业服务