图森同学 | “T计划”韫韬专访
图森同学 | “T计划”韫韬专访:直面“未知”,破解自动驾驶感知的无穷解
本期主人公
►本期主人公:韫韬,毕业于中科院自动化所,自动驾驶感知算法高级工程师短短三年,从一名校招生成长为未知物体识别组负责人他是“图森金喷壶”,也是倍受宠爱的表情包对象让我们走进自动驾驶感知算法组,听听他的故事吧
三年前的夏天,还在中科院自动化所读书的韫韬,接受导师推荐来到图森未来。彼时自动驾驶赛道里大多是初创公司,整个计算机视觉领域的研究者们,兴致勃勃地准备将科研成果试落地,赌一把深度学习应用到底能不能闯出一片天地。韫韬也是其中之一。虽然当时韫韬还是一位未出校门的学生,但关注时事、善于从宏观的视角俯瞰事件脉络的特点,使得韫韬对汽车行业的发展有独到的见解。他认为汽车是未来的手机,而新能源与自动驾驶是未来发展的趋势。这也是他坚持加入图森未来,在自动驾驶领域实习的原因所在。不出所料,自动驾驶完美地印证了韫韬的猜想,深度学习在汽车领域的应用产生了巨大的反响。2020年底,韫韬成为了图森未来的一名正式员工,至今已在自动驾驶领域从业三年有余,“自动驾驶还有很长的路要走,我选择一直走下去,相信一定可以成功!”
开拓思路,专注未知物体感知
韫韬在图森未来负责自动驾驶算法中未知物体的感知工作。现有的自动驾驶感知大概分为两个部分。一类是基于语义识别的感知,比如对预先定义的车、行人等行驶路途中常见的物体进行感知。行人的模样、车辆的外观,这些可以通过标注让机器识别出来。按图索骥,在见过足够多的物体图片、点云输入后,算法就能够知道前方物体的类别,并进行相应处理。而另一类物体的感知则是韫韬所从事的工作。用他的话来讲,不管是路上的一块轮胎皮,还是前车掉下来的一头猪,只要不是能够预先设想到的物体,在自动驾驶感知模块里都可以算作未知物体感知。“当人类司机碰到这些千奇百怪的物体时,大多能够识别且做出下一步的行驶决策。但这对于机器来说就比较困难了。 ”韫韬解释道,“这主要是由于以下两点原因。”第一个原因,作为开放世界里的物体,未知的类别可谓无穷无尽,在感知的过程中没有办法为所有东西标注具体类别,因而无法通过深度学习模型训练的方法来达到识别的目的。第二个原因是,在行驶路途中,相比起行人、车辆等,未知物体并不罕见。
因此在训练机器学习的时候,韫韬带领未知物体识别小组的成员们开拓思路,尝试了多种不同的方案,最终巧妙地将未知的问题转换为了已知的可解问题,圆满完成了任务。
直面挑战,打造畅通高效的跨部门沟通
韫韬是图森未来“T计划”选拔的顶尖人才,短短三年时间,他就从一个校招生成长为未知物体识别组的leader。图森未来“T计划”是面向全球顶尖技术人才的专项招聘计划,致力于将顶尖人才与技术汇集在一起,实现前所未有的协同创新,共同解决无人驾驶面临的技术挑战,用技术推动社会的进步。工作中身份的转变,给韫韬带来了新的挑战:跨部门沟通。面对这一问题,韫韬有着坚持的原则:语言交流是高效率的首选。“阅读半天文档还不如当面聊几句。” 但随着公司组织结构的逐渐扩大,韫韬逐渐意识到,将线下沟通与文档同步才能达到最好的沟通与协作效果。以未知物体识别组为例,韫韬会将其他部门合作时常见的问题写成 FAQ,在此基础上进一步形成系统文档。这样一来,当其他部门对韫韬组从事的工作产生问题、想要讨论时,可以先查看文档自行了解。在此基础上如果还有疑问,则直接面对面讨论。“跨部门沟通是我在成为小组leader之后,感觉最有趣的工作之一,也是个人成长最大的一个部分。”身份的转变,给韫韬带来了许多类似于这样的挑战,在迎接一个个挑战的同时,韫韬自言获得了高速的成长与蜕变。就这样,在韫韬和同事们的不断实践下,这种“文档+面对面沟通”的方式,大大提高了跨部门沟通的效率,节省了大家的时间与精力,现在已然是全公司多部门正在使用的跨部门沟通方法。
“图森金喷壶”
每周一晚餐过后是算法组的paper reading时间。席间整个算法组的同事聚集在一起,对业界最新的学术论文展开讨论与研究。博览众知的韫韬,总能敏锐地发现同事发言时细节与逻辑上的问题,稍稍不严谨的地方也会帮忙指正出来,这就是“图森金喷壶”昵称的来源。“韫韬不仅会随时提出问题,而且每次在他解释过后,你会发现发现他说的很对,心里不得不服。所以就喊他’金喷壶’了!”一位算法组的同事回忆道。除了paper reading,直言不讳、互帮互助已经成为韫韬工作中的“日常”。有一次韫韬看到同事在工作中仿佛是遇到了什么问题,通过交谈他了解到同事在为LiDAR的某个功能发愁,在敲代码的过程中常会遇到一些小问题,让同事对现有的算法产生了怀疑。韫韬在跟同事一起研究过后,提出同事在用的这个算法并不是效果最好的,并建议他针对待解决的问题建立benchmark,比较不同算法之间的性能差异,这样就能够选取合适的算法。同事根据韫韬的建议大胆否定了前面的开发流程,更换新的算法之后,不仅功能的效果显著提高,给算法的迭代也提供了实验依据。
这种实事求是、互帮互助的风气在韫韬的“无意传播”下,周围越来越多的同事们在工作中有问题直接指出、讨论、共同解决,使得工作效率不断提高,大家的关系更加简单、融洽。韫韬本人呢,凭借这种直言不讳、乐于助人的特点,成为同事们分外“宠爱”的对象。就连公司组织的羽毛球活动中,韫韬也首当其冲成为被抓拍的主人公,丰富的面部表情立刻成为新一代的表情包素材。