指标异常分析是否完全能自动化?
这两天有同学咨询语兴,指标异常分析或者归因,目前有啥好的自动化解决方案吗
首先明确一下这个问题如果要定位到最根本细节的原因是解决不了的,依赖算法模型召回是可以的,如果让数据去做,则无法落地。
举个例子🌰,语兴做了一家类似小某书的公司,现在做的是社区业务,目前语兴01想看一下社区业务中为什么昨天举报量对比前天量级要激增了,于是把这个抛送给语兴02去排查,经过语兴02排查发现昨天是1300,前天是1000,作为数分兼岗数据仓库的语兴02通过数据分析思维去向下排查,发现社区中评论场景举报占比85%+,再按照举报理由去排查发现三级举报类目下引战谩骂占比最高,但对于语兴02同学来说排查到到这里基本就结束了,如果想进一步排查只能继续细看明细,最终语兴02同学通过举报理由中content字段定位到原来是A明星的粉丝群体和B明星群体相互谩骂举报导致举报数量激增。
因此语兴01想让语兴02去做一套监控指标,监测到具体原因,同时方便自己去汇报,这时语兴02犯愁了,如果按照维度把每个指标都拆解出来是没问题的,这次是A明星的粉丝群体和B明星群体相互谩骂举报,可能下次是C明星的粉丝群体和D明星群体相互谩骂举报导致的,那我作为数据同学根本不可能定位这么细节,虽然这两次都是评论场景下引战谩骂相互举报,但完全看不出所以然,所以这个很难落地,一地鸡毛。
但对于指标拆解形成联动,再配合报表工具进行向下钻取,看到最细节指标是完全可以做的,只是看不到最明细的原因,因此只能做到半自动半人肉,通过定位到具体指标再去看明细才能得到最终答案,后续语兴02考虑通过算法模型对文本内容进行识别,从而定位到具体原因,这种是可以的,通过算法模型对文本识别,从而不断训练,来提升具体精准度。
#数据人offer决赛圈怎么选##数据人的面试交流地##大数据开发##牛客解忧铺##牛客创作赏金赛#