在推荐系统中,你觉得召回和排序哪部分更重要一些
先思考3秒,召回重要?
先思考2秒,排序重要?
先思考1秒,同样重要?
从实践来看,推荐系统,初期排序重要,后期召回重要。
初期,可供推荐的物料有限,物料分类也相较集中,召回可以简单做做,比如最新/热门,有余力搞一下 Item-CF,User-CF,足够了。这个阶段要重点把排序模型迭代起来,线上落模型 feature,离线关联 label,模型训练,模型热部署,线上特征服务,线上推荐服务。初期排序模型可以很简单,重点是跑通整个离线/在线数据流程,之后,负责排序的同学可以持续优化特征工程和排序模型。
后期,严格说是业务发展到一定阶段,物料池有了一定体量,原有召回渠道搜索空间有限;另外,业务需要促发布,需要破圈,需要提关注等,这时就需要针对业务扩充召回渠道。往往新增召回渠道在最终业务指标上,表现不够显著,因为精排模型以前没有见过这类样本,可以让模型慢慢学习,也可以配合一些提权/保量策略,加速落地,逐步形成多路召回+粗排+精排+策略的系统架构。#推荐算法工程师#
先思考2秒,排序重要?
先思考1秒,同样重要?
从实践来看,推荐系统,初期排序重要,后期召回重要。
初期,可供推荐的物料有限,物料分类也相较集中,召回可以简单做做,比如最新/热门,有余力搞一下 Item-CF,User-CF,足够了。这个阶段要重点把排序模型迭代起来,线上落模型 feature,离线关联 label,模型训练,模型热部署,线上特征服务,线上推荐服务。初期排序模型可以很简单,重点是跑通整个离线/在线数据流程,之后,负责排序的同学可以持续优化特征工程和排序模型。
后期,严格说是业务发展到一定阶段,物料池有了一定体量,原有召回渠道搜索空间有限;另外,业务需要促发布,需要破圈,需要提关注等,这时就需要针对业务扩充召回渠道。往往新增召回渠道在最终业务指标上,表现不够显著,因为精排模型以前没有见过这类样本,可以让模型慢慢学习,也可以配合一些提权/保量策略,加速落地,逐步形成多路召回+粗排+精排+策略的系统架构。#推荐算法工程师#