25届未来精英-网约车交易策略

薪资面议
2024-08-07
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便

网约车动态大规模交易决策系统求解


挑战一:基于启发式方法和强化学习的动态双边匹配问题求解

网约车司机和乘客的匹配是典型的双边匹配问题,面向未来可能不断出现的订单和状态瞬息万变的司机运力状况,为实现全天的整体匹配最优,则需要针对动态双边匹配问题求解。


传统技术主要依赖数学方法和小规模启发式方法,当面对业务的大规模数据、未来预测的不确定性、异质参与者等各类新挑战时,希望通过更强大的启发式方法、强化学习等方法来实现对复杂动态双边匹配问题的求解。


挑战二:基于离线强化学习的司机全天最优行为策略求解

从单名司机角度,全天做单行为对收入等最终结果具有强烈的影响,有经验的司机可以通过良好的做单行为获得更高的收益。进而,平台拥有更实时、更详细的司乘情况数据,可以帮助司机进行更优决策。平台希望为司机提供更优的决策能力(空车游走、接单、选单等)来提升司机整体做单体验。


从技术角度而言,为实现全天最优化,可以通过强化学习方法来实现短期决策对长期影响最优,但由于网约车场景线上探索学习成本较大,可以通过离线强化学习在不实际影响用户的情况下,学习到全天最优行为策略。


挑战三:基于行为大模型的网约车用户行为理解和预测

网约车乘客在平台中的行为非常多种多样,包括但不限于查看、打车、完单、优惠等等,并且乘客行为与时空场景、个人诉求有着强烈的关联性。基于大规模用户行为策略的理解,针对乘客的行为预估,可以帮助网约车平台更好提供服务。


当前LLM等大模型兴起,基于用户行为序列的大模型方兴未艾,值得探索作为网约车用户理解的基础模型,强力支撑交易市场优化。

滴滴
工具
不需要融资
北京,上海,杭州,广州
查看其他 188 个职位