零跑汽车- 强化学习算法工程师面经

因为投的比较晚,所以目前进行到一面,后面是主管面和HR 面。

一面(1小时20分钟):主要是聊项目和论文,撕了一道蒙特卡洛估计的题
  • 从论文的DDPG算法开始聊,TD3,SAC算法,应用场景,优缺点啥的
  • 聊王者荣耀比赛,从网络结构设计(特征工程、channel attention,self-attention,multi-head value estimation),奖励函数设计,算法设计(dual-clip PPO + NoisyNet, 此处对RL 中的探索方法展开了一下),训练流程设计(自对弈模型筛选、策略集成),聊完之后面试官已经比较满意了,后面就是随便聊了些跟CV相关的比赛和项目
  • 聊天池图像分割比赛,讲了一下我们上分技巧,伪标签+模型融合,顺便讲了一下为什么伪标签这种方法在比赛中屡试不爽
  • 聊另外一个项目,跟机器人抓取相关,介绍了一下整体方案,网络结构,问了一些项目中的难点怎么解决的
代码题: 从左至右 有 A,B,C,D,E 五个点,每次初始时刻智能体都在C点处,每次有0.5的概率往左,0.5的概率往右,到达A 点或者E点就结束,到达A 的话 获得 r = 1 的奖励,到达E获得 r = -1的奖励,否则 r =0. 试写一个强化学习环境 并且估计智能体到达A 点的概率

就是写个环境然后进行蒙特卡洛估计,代码如下,到达A 点的概率在0.5左右
class gameenv:
    def __init__(self):
        self.arr = ['A','B','C','D','E']
        self.state = 2

    def reset(self):
        self.state = 2

    def step(self, action):
        if action == 0:
            self.state = self.state-1
        elif action==1:
            self.state = self.state+1
        if self.arr[self.state] =='A':
            done = True
            r = 1
        elif self.arr[self.state] =='E':
            done = True
            r = -1
        else:
            done = False
            r = 0
        return self.state, r, done



反问业务:预研部门,然后用RL 做路径点规划,感觉有点像goal-conditioned 的任务,只不过每个目标点有约束。


二面(10min):刚吃完晚饭,直接一个电话call 过来,没有提前预约,问了一些业务问题和八股
  • 怎么用RL 做路径规划?尝试给出一个具体的方案
  • 深拷贝和浅拷贝
  • 动态规划和分治的区别        

#强化学习##自动驾驶##零跑汽车#
全部评论
手撕现场调试吗
3 回复 分享
发布于 2022-10-18 17:36 北京
老哥,啥时候做的笔试
1 回复 分享
发布于 2022-10-17 10:29 陕西
点赞 回复 分享
发布于 2022-10-15 14:43 河北
有二面消息么,兄弟
点赞 回复 分享
发布于 2022-10-18 19:59 辽宁
老哥二面完有消息吗
点赞 回复 分享
发布于 2022-10-19 20:08 天津
老哥,现在有什么最新消息吗?
点赞 回复 分享
发布于 2022-10-24 12:55 北京
哥,二面完有消息了么
点赞 回复 分享
发布于 2022-11-01 10:56 辽宁
和你一样的岗,一样的问题 今天看状态寄了 请问你这个目前HR面了吗?
点赞 回复 分享
发布于 2022-11-09 16:11 江苏
进了吗,薪资大概多少
点赞 回复 分享
发布于 2023-06-15 02:49 浙江

相关推荐

双飞二本嵌入式求拷打我是在 BOSS 上投递的简历,好多都没人回复,这是开场白和简历求大神帮忙看看。您好!我是2025届应届生,最快可在一周内上岗,能够实习六个月以上,并接受加班。以下是我的核心优势和相关经验:1. 嵌入式开发能力:   熟练掌握STM32系列单片机及其外设(如GPIO、定时器、ADC、DAC、I2C、SPI、UART等),能够独立完成硬件驱动开发和调试。  熟悉FreeRTOS实时操作系统,具备多任务调度和资源管理经验。  熟悉LVGL图形库开发,能够实现嵌入式设备的图形界面设计。2. 硬件设计能力:   具备PCB设计经验,曾为2023年工创赛物流搬运赛道设计小车主板,带领团队获得国家级银奖。   熟悉硬件原理图分析,能够快速理解并调试硬件电路。3. 机器人开发与竞赛经验:   在全国大学生智能车竞赛、ROS机器人竞赛中多次获得国家级奖项,具备丰富的机器人开发经验。   熟悉Linux环境,对ROS和ROS 2有一定了解,能够进行机器人系统的开发与调试。4. 编程能力:   熟悉C/C++,熟悉Python,能够高效完成嵌入式开发和算法实现。   具备良好的代码规范和文档编写能力。5. 团队协作与领导能力:   在多个项目中担任核心开发或团队负责人,具备良好的沟通能力和团队协作精神。   在工创赛中带领团队完成项目规划、任务分配和技术攻关,展现了较强的领导力。我对嵌入式开发、机器人技术和智能硬件充满热情,期待加入贵公司,与团队共同成长,为公司创造价值!如果有合适的岗位,欢迎随时联系我,期待进一步沟通!
沉淀一会:嵌入式就是狗屎
点赞 评论 收藏
分享
2024-12-23 06:50
门头沟学院 Java
给点吧求求了:3点发的帖子,害怕😰
点赞 评论 收藏
分享
评论
13
45
分享

创作者周榜

更多
牛客网
牛客企业服务