数仓面试题:电商数仓销量预测 递归逻辑

投票
辉哥,hive中有没有实现递归的方案?我有个场景,需要循环350次,第二天的数据依赖第一天的数据计算,第三天依赖第二天的数据计算,以此类推到350次。目前用的阿里云的mc,但是CTE只有10次,无法满足该需求。用阿里那边自带的while循环,跑完350次大概要3个半多小时,有没有啥方案可以优化的呀

em,背景就是电商平台的那种预测销量表,比如根据今天的库存,算接下来的350天的值,大概逻辑为:当天的实际库存-季节因子*增长因子+实际需要库存的数量。比如今天预测的11-19号数据,来源于18号,然后将19号的数据写入对应的日期,下一个循环,再从20号拿19号的数据计算。

1. 没有业务数据细节,没有背景,我只能建议udf,或者另外开发java etl
2.用的阿里的,直接向他们要优化方案
3.原数据能不能预聚合下 我看你的需求是不是聚合一个天粒度销量能缓解数据量问题
#实习#  #大数据#  #校招#  #秋招#  #数开#
全部评论

相关推荐

不愿透露姓名的神秘牛友
11-11 17:08
蚂蚁 后端 23x16+2x12 其他
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务