数仓面试题:电商数仓销量预测 递归逻辑
投票
辉哥,hive中有没有实现递归的方案?我有个场景,需要循环350次,第二天的数据依赖第一天的数据计算,第三天依赖第二天的数据计算,以此类推到350次。目前用的阿里云的mc,但是CTE只有10次,无法满足该需求。用阿里那边自带的while循环,跑完350次大概要3个半多小时,有没有啥方案可以优化的呀
em,背景就是电商平台的那种预测销量表,比如根据今天的库存,算接下来的350天的值,大概逻辑为:当天的实际库存-季节因子*增长因子+实际需要库存的数量。比如今天预测的11-19号数据,来源于18号,然后将19号的数据写入对应的日期,下一个循环,再从20号拿19号的数据计算。
1. 没有业务数据细节,没有背景,我只能建议udf,或者另外开发java etl
2.用的阿里的,直接向他们要优化方案
3.原数据能不能预聚合下 我看你的需求是不是聚合一个天粒度销量能缓解数据量问题
#实习# #大数据# #校招# #秋招# #数开#
em,背景就是电商平台的那种预测销量表,比如根据今天的库存,算接下来的350天的值,大概逻辑为:当天的实际库存-季节因子*增长因子+实际需要库存的数量。比如今天预测的11-19号数据,来源于18号,然后将19号的数据写入对应的日期,下一个循环,再从20号拿19号的数据计算。
1. 没有业务数据细节,没有背景,我只能建议udf,或者另外开发java etl
2.用的阿里的,直接向他们要优化方案
3.原数据能不能预聚合下 我看你的需求是不是聚合一个天粒度销量能缓解数据量问题
#实习# #大数据# #校招# #秋招# #数开#
全部评论
相关推荐