知乎 数据仓库 凉经

写在前面:这段时间经过了一段高强度笔面,但还是颗粒无收
面试
面试官进来就说:你不会flink?
我:了解的不多
那我们这次可能通过概率不大,但我们仍然可以就大数据来一波交流
实时:
Flink的checkpoint
Flink的反压
Flink的状态后端
离线:
Kafka的有序性(不可全局有序,但可分区有序)面试官说不对??我让他下去再好好看看
Kafka一定不会丢数据嘛?
Spark的内存模型(yarn-client,yarn——cluster)
数据仓库的意义
怎么衡量一个好的数仓(一致,质量,复用,统一口径。。。。)数据治理相关知识
Hive的执行计划看过没?看过,通过stage,定位数据倾斜。
维度建模方法:雪花,星型
拉链表
三个sql:连续登录,互相关注,最大直播间人数(全秒了)
无奈啊,面试官说你这离线这边很扎实,但知乎的数仓只用实时,主要做实时推荐。寄!
全部评论
知乎怎么看挂没挂,官网也看不到流程啊
点赞 回复 分享
发布于 2023-10-19 16:42 四川

相关推荐

两年工作经验,一下是我的技术栈精通Linux基本命令、系统管理、Linux文件管理、用户和权限操作、进程检测与控制、自有服务(ntp,firewalld,crond)管理及软件包搭建、VMware(克隆、快照、镜像)熟练系统服务的搭建、配置、优化,包括 远程管理SSH、yum源配置、FTP文件共享、数据同步RSYNC、NFS等磁盘管理、具备磁盘阵列RAID思维、基本网络基础、网络排错能力,熟悉阿里云,了解华为云,移动云熟练Shell脚本编程例如变量定义、流程控制和循环语句、常用文本处理工具sed、awk、掌握GitHub精通中间件的使用,包括mysql常用语句以及双主双从,数据备份熟练掌握负载均衡的原理,Keepalived+lvs实现高可用高并发,Nginx七层负载、反向代理等; 熟悉常用排错工具的使用,如 top、free、netstat、wireshark、tcpdump、nslookup等;熟悉jumpserver堡垒机部署、配置、使用及用户管理、资产管理、权限管理等;熟悉EFK、日志收集、集群部署及filebeat文件的使用;熟悉zabbix环境搭建、配置监控项、邮件通知及告警触发等;熟练掌握k8s集群搭建、K8S资源管理(pod、pod控制器、NS、SVC、存储持久化)熟练掌握docker容器集群的架构规划、Dockerfile镜像构建、操作Docker容器、镜像加速,熟悉Harbor镜像仓库、能够使用DashBoard图形化熟悉日常办公软件、CAD、visio
点赞 评论 收藏
分享
6 26 评论
分享
牛客网
牛客企业服务