25届未来精英-网约车交易策略

薪资面议

2024-08-07

什么是官网闪投?

简历直投官网

无需重复填写简历

投后必反馈

进度实时更新

安全可靠官网可查

海量岗位5w+

移动端投递方便

网约车动态大规模交易决策系统求解

挑战一：基于启发式方法和强化学习的动态双边匹配问题求解

网约车司机和乘客的匹配是典型的双边匹配问题，面向未来可能不断出现的订单和状态瞬息万变的司机运力状况，为实现全天的整体匹配最优，则需要针对动态双边匹配问题求解。

传统技术主要依赖数学方法和小规模启发式方法，当面对业务的大规模数据、未来预测的不确定性、异质参与者等各类新挑战时，希望通过更强大的启发式方法、强化学习等方法来实现对复杂动态双边匹配问题的求解。

挑战二：基于离线强化学习的司机全天最优行为策略求解

从单名司机角度，全天做单行为对收入等最终结果具有强烈的影响，有经验的司机可以通过良好的做单行为获得更高的收益。进而，平台拥有更实时、更详细的司乘情况数据，可以帮助司机进行更优决策。平台希望为司机提供更优的决策能力（空车游走、接单、选单等）来提升司机整体做单体验。

从技术角度而言，为实现全天最优化，可以通过强化学习方法来实现短期决策对长期影响最优，但由于网约车场景线上探索学习成本较大，可以通过离线强化学习在不实际影响用户的情况下，学习到全天最优行为策略。

挑战三：基于行为大模型的网约车用户行为理解和预测

网约车乘客在平台中的行为非常多种多样，包括但不限于查看、打车、完单、优惠等等，并且乘客行为与时空场景、个人诉求有着强烈的关联性。基于大规模用户行为策略的理解，针对乘客的行为预估，可以帮助网约车平台更好提供服务。

当前LLM等大模型兴起，基于用户行为序列的大模型方兴未艾，值得探索作为网约车用户理解的基础模型，强力支撑交易市场优化。

滴滴出行

研究所

未融资

天津市