影像算法 岗位大哥人不错,上来先自我介绍聊项目。行人遮挡,人员密集的场景怎么处理?没有考虑这样的场景。为什么选择llava或者qwen-VL,选型的思路?code:(不写leetcode)手撕 softmax,要求写成nn.module,前向传播的形式。有意思的是反问环节。影像算法这块会用到什么多模态的内容?开集检测,像grounding dino这样的,找到人像,背景虚化这样的内容。vivo的工作强度如何?比互联网好的多得多,八小时打卡下班,因为工作设备不让带出工区,所以下班了就真是下班了。晋升怎么样?一年一次,低职级的晋升会比较顺利。(所以高级别的就需要人情世故了对吗。)昨天出的g...