获赞
241
粉丝
376
关注
5
看过 TA
2559
中国海洋大学
2019
大数据开发工程师
IP属地:上海
前阿里数仓,现网易数仓,相关课程在b站搜索语兴呀
私信
关注
兴哥,字节二面问到几个问题,想请教一下:1、数据仓库的复杂性体现在哪些方面2、数据仓库如此多的表怎么去管理的3、原子指标和衍生指标是抽象的概念还是已经具像化的指标问题1:最重要复杂体现在模型层面将业务抽象成模型,同时还要让数据模型好用,能够复用,并保障数据质量问题少发生问题2主要考察元数据管理,分层,分域,数据表考评,分层还是咱们之前说的那4层 ods Dwd Dwd ads每一层做的事可以给他说一下我这里就不列举了,分域,包括主题域(业务分析角度),数据域(业务流程),你在这也可以说对于数仓整套元数据我们也有接入,并通过数据门户方式给业务展示,可以让业务快速了解每个分层每个域有什么表,作用是什么,以及表元数据(命名,作用,owner,存储等),同时也提升数仓整体复用性,减少烟囱表开发,同时对于数据表我们也有评分体系通过分数(图在下边)扫描出临时表 无用表 空表 数据表ods 穿透等评论并做整体治理问题3 他想考你原子指标和派生指标区别,其实原子指标是一个概念 他在数仓任何地方 但又不存在,我们所说的全部指标都是派生指标,派生指标🟰原子指标+维度+周期,例如最近30天杭州地区下单人次 这个就是典型的派生指标,原子指标是下单人次,周期是最近30天,维度是杭州地区,所以从这里我们可以看出原子和派生指标关系,再顺道一提复合指标,复合指标一般通过率的方式表达,且是由派生指标为分子分母,比如最近30天离职率🟰最近30天离职人数/最近30天总员工数,这分子分母都是派生指标,再比如同比 环比也是复合指标
查看3道真题和解析
0 点赞 评论 收藏
分享
作为一个即将毕业的研究生,走数据开发的话,对于未来职业生涯规划安排,语兴有什么建议。也害怕35危机😂 对于大多数人来说整体工作中能到的高度应该还是p8为上限,只不过要看自己适合走技术专家还是适合走业务。专家可以往组件平台这块多了解深入 以后也可以做数据平台负责人,偏平台数据产品负责人,业务的话可以走数leader规划内部数仓对接外部需求,如果公司内部有机会依然可以走产品和数分,但真实情况是职级固化,数仓到p7就结束了,做的工作都是偏向业务多一些。对于新人来说,建议日常除了用内部数据平台和别的工具时同时多关注下外部新组件,例如现在的doris 数据湖相关,可以了解探索下,同时多看看其他数据平台都有哪些功能能给业务做什么事,多看看其他领域数仓项目,这个星球也会经常讲,感兴趣同学可以加一下,了解业务和项目相通地方。对于35危机,也解决不了,只能往上爬,35岁p8还有3到5年职业寿命,38到40岁p9也可以续几年职业寿命,再往后要么创业要么退休。年轻还是建议多挣一些钱,一定要有存款,基本可以保持2到3年跳槽换一家公司,特殊情况除外,毕业工作2到3年如果内部没晋升就要跳出去了 刚好涨薪➕拿p6,5年跳出去一波 拿p6+和涨薪  如果能拿7更好 8年拿7 或者去中厂当leader都可以。最后数仓到头,能达到最高度是cdo数据总监或者cto,也可以出去创业,应该是数据产品➕数仓➕对数分有一定了解的结合体(这个是标配,当然也可以往上可以补充算法 平台组件等)
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务