首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不拿offer不改名的chen呀
中国科学院大学 大数据开发工程师
发布于山西
关注
已关注
取消关注
@我的名字已被占用:
基于Flink的直播电商实时数仓建设(一)|背景及架构篇
本系列文章从生产实践的角度出发,分享一些直播电商实时数仓的建设思路及实践方法,给正在这方面探索的同学们提供一些经验和方法作为参考输入。相信大家对直播电商并不陌生,直播电商是基于直播的基础上诞生的新的商业模式。对于新的商业模式,大家有没有想过,如果自己负责建设公司的直播电商实时数据,会怎么建设呢?本系列文章主要介绍建设直播电商实时数据的关键步骤,如果对同学们有帮助的话,欢迎 点赞 + 收藏~ 1、建设背景 随着公司直播电商业务的发展,业务变得越来越复杂,营销活动也越来越多,在实时数据方面的诉求也越来越紧迫。如何快速有效地获取有价值、稳定的实时数据以帮助业务更好地进行产品迭代和支持运营及策略调整变得越来越重要和紧迫。有鉴于此,实时数仓也相应地提升建设优先级。 2、应用场景 实时OLAP分析:通过实时处理并将数据写入druid和ClickHouse等OLAP分析工具,提升OLAP时效性,使其具有较优的实时数据分析能力。实时数据看板:活动用的实时大屏数据展示需求。实时业务监控:公司核心指标实时监控。如订单指标、买家首页实时监控。实时数据接口服务:通过提供实时数据接口服务的方式,向其他业务线提供数据支持。如为推荐团队提供实时用户特征、直播间特征。实时ETL:实时消费数据进行清洗、转换、结构化处理用于下游计算处理。如为推荐团队提供商品曝光点击样品流、为商业化提供订单数据流。 3、建设目标 前面的建设背景和应用场景解释了建设实时数仓的必要性以及建设的收益点。假设你是该项目的主R,那么,在项目开始之前,你希望项目达到什么样的预期效果呢?我想这会是项目参与者和领导最关心的事情,所以,明确建设目标应该是一个前置动作。下面列举下我在「基于Flink的直播电商实时数仓建设」项目中期望的建设目标,接下来的系列文章也会围绕该建设目标展开叙述。小伙伴们也可以结合公司的建设现状进行借鉴和参考。设计一套体系化建设框架明确所需覆盖的业务过程,完成各层级数据规范化建设将通用的指标进行统一管理设计,明确口径定义、减少冗余开发、提升复用性对外输出可承诺的服务能力与标准 4、技术架构设计 好了,终于到了干货部分了。下面围绕直播电商实时数仓「数仓分层架构」和「技术架构」给大家展开介绍。 乍眼一看,是不是觉得和离线数仓的架构图,相差无几?其实二者差别还是很多的: 与离线数仓相比,实时数仓的层次更少一些从目前建设离线数仓的经验来看,数仓的数据明细层内容会非常丰富,处理明细数据外一般还会包含轻度汇总层的概念,另外离线数仓中应用层数据在数仓内部,但实时数仓中,app 应用层数据已经落入应用系统的存储介质中,可以把该层与数仓的表分离。应用层少建设的好处:实时处理数据的时候,每建一个层次,数据必然会产生一定的延迟。汇总层少建的好处:在汇总统计的时候,往往为了容忍一部分数据的延迟,可能会人为的制造一些延迟来保证数据的准确。举例,在统计跨天相关的订单事件中的数据时,可能会等到 00:00:05 或者 00:00:10 再统计,确保 00:00 前的数据已经全部接受到位了,再进行统计。所以,汇总层的层次太多的话,就会更大的加重人为造成的数据延迟。与离线数仓相比,实时数仓的数据源存储不同。在建设离线数仓的时候,目前公司整个离线数仓都是建立在 Hive 表之上。但是,在建设实时数仓的时候,同一份表,会使用不同的方式进行存储。比如常见的情况下,明细数据或者汇总数据都会存在 Kafka 里面,但是像商家、直播等维度信息需要借助 Hbase,MySQL 或者其他 KV 存储等数据库来进行存储。离线数仓建设的数据域也更丰富些,因为离线数仓的应用和分析场景比实时数仓丰富,所以对于基础数据建设的覆盖度要求比实时数仓要高。结合直直播电商的业务场景看,交易、营销、流量、内容这几个数据域的实时应用场景往往最多,因此建设优先级也往往是最高的。 技术架构图 在计算方面,采用的是Flink SQL+Flink Code的方式,原因是目前公司大数据平台的Flink SQL建设不完善,性能方面和Code相比仍有较大的优化空间。另外,一些复杂的逻辑处理仍需要使用Code。存储方面,采用Redis+Hbase。二者根据吞吐、时延要求按需使用。OLAP方面,采用的是Druid+ClickHouse。 下集预告 下集将分享直播电商实时数仓模型规范和实践细则 关于作者 作者就职于一线互联网公司负责离线、实时数据开发,每天支持处理千亿级别数据。坚持分享数仓理论、大数据开发技术干货,同时欢迎交流,关注公众号 "大数据开发指南",回复:“联系作者”,添加你身边那位懂数据的朋友。
点赞 0
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-19 16:34
叠纸游戏_UI美术设计(准入职员工)
叠纸游戏内推叠纸游戏内推码
面经分享|叠纸游戏运营自我介绍介绍游戏经历举例说一说,你认为在游戏运营中,玩家的反馈有多重要?你最喜欢哪款游戏?说一说吸引你的原因在游戏设计中,你认为哪些元素是吸引玩家的关键?如果让你设计一款新游戏,你会考虑哪些方面?⌚️上班时间:早10晚8-10,一般情况员工下班都比较晚 🥰女性友好:公司的游戏很多都是养成系女向的,室内装修风格也是非常温柔和亲和~ 💗员工友善:不管是职员还是安保小哥都愿意听我讲话和我聊天帮我拍照,大厂游击保安👮第一次有这种轻松的感觉,一定是公司企业文化也很包容才能招募来这么一批善良的人吧!谢谢善良的大家🙏 男同学🈶️:🙅刻板印象,还是有很多男同学的!并不是只有美...
点赞
评论
收藏
分享
04-23 16:27
已编辑
门头沟学院 算法工程师
大模型 暑期实习 offer选择
鼠鼠之前是搞垂域llm训练的,offer也偏应用,想找个对秋招帮助大的,但不知道怎么选,请各位佬帮忙看下~1、阿里-飞猪-大语言模型和智能客服业务场景是做大模型的智能客服,优点是阿里系的转正率高,飞猪也不卷,缺点是飞猪有点边缘了2、美团-keeta-算法策略是美团的出海品牌,处于扩展期,部门应该算核心之一?鼠鼠投的大模型算法,面试的时候也聊大模型,不过最后发的岗位是算法策略,面试官说主要做商品、商家方向,比如竞对、大模型打商品标签、商家助手之类的,还有用户增长,广告素材的生成等场景,鼠鼠只会llm,这些听不懂啊,有没有佬说下这种方向的前景?3、腾讯-csig-腾讯地图-大模...
投递美团等公司10个岗位 >
点赞
评论
收藏
分享
03-12 12:36
腾讯音乐娱乐集团_软研_后台开发(准入职员工)
快手约面
今天快手居然约面了,虽然已有tme了,但是我还是想面一面,弥补秋招十几连挂的遗憾#你投递的公司有几家约面了?# #春招启动,你开始投递了吗?#
2025请对我好一点:
真好,我进入面试流程了,但是迟迟没见hr找我约面
你投递的公司有几家约面了?
春招启动,你开始投递了吗?
点赞
评论
收藏
分享
04-18 09:01
已编辑
字节跳动_客服平台_前端开发(准入职员工)
第一个offer,开始休息了
咦哟,从去年八月份开始长跑,两处实习转正都失败了,风雨飘摇,终于拿到offer了更新一下面试记录:秋招:多部门反复面试然后挂掉然后复活,具体问了啥已经忘了,只是被反复煎炸,直至焦香😋春招:base北京抖音hr打来电话说再次复活,准备面试,gogogo北京抖音一面:六道笔试题:1.promise顺序2.定义域问题3.flat展开4.并发请求5.岛屿数量算法(力扣)深度,广度都写6.忘记了,好像也是算法,难度中等其他问题多是框架底层设计,实习项目重难点~~~秒过😇北京抖音二面:三道笔试题:(为什么只有三道是因为第三道没做出来,卡住了)1.中等难度算法(忘记啥题了,应该是个数组的)2.认识js的继承本质(手写继承模式,深入js的面相对象开发)3.手写vue的响应式(卡在了watch,导致挂掉)---后知后觉是我的注册副作用函数写得有问题,有点紧张了其他题目多是项目拷打,项目亮点,对实习项目的贡献~~~第二天,挂,but立马复活转战深圳客服当天约面深圳客服一面:六道笔试题,由于面过太多次字节,面试官叫我直接写,不用讲,快些写完😋,具体都是些继承,深拷贝(注意对数组对象分开处理,深层次对象,循环引用),加中等难度算法题~~~秒过深圳客服二面:口诉八股大战:大概囊括网络,浏览器渲染原理,动画优化,时间循环,任务队列等等(你能想到的简单八股通通拉出来鞭尸😋)算法题:笔试题6道:1:找出数组内重复的数,arr[0]-arr[n]内的数大小为[1-n],例如[1,2,2,3,3]返回[2,3],要求o(n),且不使用任何额外空间(做到了o(n),空间方面欠佳,给面试官说进入下一题,做不来了)2:原滋原味的继承(所以继承真滴很重要)3:力扣股票购买时机难度中等其他滴也忘记了,因为拿到offer后鼠鼠一下子就落地了,脑子自动过滤掉可能会攻击鼠鼠的记忆😷~~~秒过深圳客服三面:项目大战参与战斗的人员有:成员1:表单封装及其底层原理,使用成本的优化,声明式表单成员2:公司内部库生命周期管理成员3:第三方库和内部库冲突如何源码断点调试并打补丁解决成员4:埋点的艺术成员5:线上项目捷报频传如何查出内鬼成员6:大文件分片的风流趣事成员7:设计模式对对碰成员8:我构建hooks应对经理的新增的小需求的故事可能项目回答的比较流利,笔试题3道,都很简单,相信大家应该都可以手拿把掐😇~~~过过过无hr面后续煎熬等待几天直接hr打电话发offer了,希望大家也可以拿到自己心仪的offer
法力无边年:
牛哇,你真是准备得充分,我对你没有嫉妒,都是实打实付出
,
查看19道真题和解析
点赞
评论
收藏
分享
04-24 16:56
已编辑
河南理工大学 Unity3D客户端
还有重量级!!!炎魂网络游戏开发线下三面挂!!!线下挂人!真别来游戏行业
都2025年了,还有公司线下面试,但给报销车费,但是挂你时间线:3月19投递,4月9日一面,4月14二面,4月22日线下三面,线下!!!笔试: AK,基本是leetcode mid 没啥要说的一面:出题,5分钟手写二分模板,口嗨算法:如何判断二维平面上的一个点,在给定的范围有多少其余点,具体算法扫描线,极角序,最后又写了个上楼梯简单dp,面试官还说我很优秀二面:按简历上的逐行问,acm,算法,实习,项目,毕业论文是个渲染三面:说要线下面试,我以为是能开香槟了,但是是哥布林的幻想,从学校到杭州,高铁要9个小时,最快的车要从郑州做也要5个小时还只有一班,给报销就还好,但是一去一回肯定要两天了,不如...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
在微信的3个月
1.9W
2
...
想当滴孝子
1.0W
3
...
腾讯云智一二面面经
9833
4
...
双非初见白月光之学习路线分享
8194
5
...
所以,你们许给我们的远大前程呢
6991
6
...
25届双非春招游戏客户端Timeline(已OC)
6805
7
...
爱谁谁吧!暑期实习,老娘再也不面了!
6627
8
...
4.25滴滴测开
6054
9
...
深信服长沙测开oc
5689
10
...
滴滴后端二面 凉经
5171
创作者周榜
更多
正在热议
更多
#
我和mentor的爱恨情仇
#
10586次浏览
131人参与
#
考研可以缓解求职焦虑吗
#
15096次浏览
193人参与
#
平安产险科技中心求职汇总
#
246523次浏览
2622人参与
#
实习进度记录
#
262333次浏览
3311人参与
#
你喜欢工作还是上学
#
33667次浏览
339人参与
#
考研失败就一定是坏事吗?
#
95529次浏览
797人参与
#
大学生该如何认清当下的就业环境?
#
31128次浏览
263人参与
#
浅聊一下我实习的辛苦费
#
213790次浏览
1655人参与
#
你怎么评价今年的春招?
#
92808次浏览
1185人参与
#
格力求职进展汇总
#
169934次浏览
1228人参与
#
找不到好工作选择GAP真的丢人吗
#
56075次浏览
687人参与
#
考研人,我有话说
#
98528次浏览
899人参与
#
我的AI电子员工
#
5576次浏览
49人参与
#
毕业论文怎么查AI率
#
20115次浏览
1336人参与
#
我的求职精神状态
#
28417次浏览
474人参与
#
如果能重来,就业or读研你选哪个?
#
131370次浏览
1643人参与
#
秋招白月光
#
113710次浏览
1391人参与
#
我的第一份实习怎么找的
#
73545次浏览
731人参与
#
五一出游找搭子
#
8924次浏览
83人参与
#
非技术er求职现状
#
53931次浏览
398人参与
#
实习好累,可以辞职全力准备秋招吗
#
140957次浏览
1518人参与
牛客网
牛客企业服务