#正在实习的你,在做dirty work吗#实习第17天,感觉每天干的活很繁琐很基础,实习最重要的是理解业务还是学到技术呢?这里正式员工每天干的活也和我一样,只不过人家更轻车熟路,岗位是数据交付,写的都是最基础的sql。我期望秋招找的工作是数据开发或者数仓开发,唉这段实习真的还有意义吗
全部评论
啥岗位啊 感觉能找到实习就很不错了
2
送花
回复 分享
发布于 06-20 13:09 河北

相关推荐

兴哥,字节二面问到几个问题,想请教一下:1、数据仓库的复杂性体现在哪些方面2、数据仓库如此多的表怎么去管理的3、原子指标和衍生指标是抽象的概念还是已经具像化的指标问题1:最重要复杂体现在模型层面将业务抽象成模型,同时还要让数据模型好用,能够复用,并保障数据质量问题少发生问题2主要考察元数据管理,分层,分域,数据表考评,分层还是咱们之前说的那4层 ods Dwd Dwd ads每一层做的事可以给他说一下我这里就不列举了,分域,包括主题域(业务分析角度),数据域(业务流程),你在这也可以说对于数仓整套元数据我们也有接入,并通过数据门户方式给业务展示,可以让业务快速了解每个分层每个域有什么表,作用是什么,以及表元数据(命名,作用,owner,存储等),同时也提升数仓整体复用性,减少烟囱表开发,同时对于数据表我们也有评分体系通过分数(图在下边)扫描出临时表 无用表 空表 数据表ods 穿透等评论并做整体治理问题3 他想考你原子指标和派生指标区别,其实原子指标是一个概念 他在数仓任何地方 但又不存在,我们所说的全部指标都是派生指标,派生指标🟰原子指标+维度+周期,例如最近30天杭州地区下单人次 这个就是典型的派生指标,原子指标是下单人次,周期是最近30天,维度是杭州地区,所以从这里我们可以看出原子和派生指标关系,再顺道一提复合指标,复合指标一般通过率的方式表达,且是由派生指标为分子分母,比如最近30天离职率🟰最近30天离职人数/最近30天总员工数,这分子分母都是派生指标,再比如同比 环比也是复合指标
查看3道真题和解析
点赞 评论 收藏
分享
1. 维度建模和范式建模是什么,两者之间比较大的区别。2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么?3. 两道Sql题。       order_info (                    order_id bigint,    -- 订单id                    city_name string,   -- 城市名                    driver_id bigint,    -- 司机id                    passenger_id bigint,    -- 乘客id                    call_time string,   -- 订单呼叫时间                    finish_time string,   -- 订单完成时间                    pay_time string)  -- 订单支付时间这个表是订单粒度的一个打车记录,call_time、finish_time、pay_time都有可能为空。(1)  求有多少个用户曾经呼叫过,多少个用户曾经完成过订单,多少个用户曾经支付过订单。用户可能多次打车。(2)  求每个城市完成订单最多的十个司机。4.  项目中数仓分了几层?为什么要分成5层?
查看5道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务