狠狠羡慕🍋了

相关推荐

数开面试题使用的hive,tez计算引擎1.如何建模、以及数据开发过程中需要注意的问题(数据探查、数据开发、数据质量监测、数据核对)2.页面数据有问题、如何排查3.抽数、推数数据量异常如何自动停止任务(要有工作日、非工作日的判断,非工作日不生效,UDF函数)4.hive表生命周期管理失效,如何进行生命周期管理(设成自动任务的话可能会使用shell脚本)(3个月前每月保留第一天与最后一天的数据,注意是业务时间第一天与最后一天,非调度时间)5.数据量大的表推数慢影响页面展示怎么解决6.根据2个日期计算工作日天数7.去重方式(开窗函数如何控制窗口的大小)8.列转行(清洗、分隔符统一、注意有些业务数据(比如一条数据楼栋面积字段(可能是总面积)对应多个房屋或多个楼栋)、LATERAL VIEW explode)9.明细表数据量大,每月还要都保留一份,怎处理?怎么优化?达梦分区(范围分区、哈希分区、列表分区、组合(多级)分区、间隔分区(属于范围分区)INTERVAL <间隔表达式>)10.更新数据效率更高的方式update采用的类似nested loop的方式,对更新的每一行,都会对查询的表扫描一次;merge into这里选择的是hash join,则针对每张表都是做了一次 full table scan,对每张表都只是扫描一次。11、筛选的时候in(不适合B大)、exists不适合B大)、join的底层以及效率12.常用的分析函数13.连续3天及以上连续出现的次数(减序号) #实习#  #校招#  #大厂#  #数开#  #数仓#
查看13道真题和解析
点赞 评论 收藏
分享
1.springsecurity是怎么搭建的我这边搭建的是springsecurity6,搭建分为两大块,一个是登录接口,一个是securityfilterchain的搭建,登录接口会springsecurity的方法创建一个将用户输入的用户名和密码作为参数的令牌,springsecurity那边会写一个impl来继承userdetailservice的方法,这里面会查询数据库的用户信息并且返回一个userdetails对象,springsecurity底层会有方法将userdetail的password和用户输入的密码进行对比,成功则返回一个token2.怎么实现单设备登录这边说的是登录的token存入redis,判断有没有有的话就删除并通知下线(网上查询是根据token一致性来判断,就是每次请求访问都会判断客户端发送的token和缓存的token是否一致)3.http1和2的区别http1相对于0多了Keepalive长连接,不用每次请求都要三次握手和四次挥手,但是有个弊端就是发送的报文必须是有序的,就存在一个问题,如果头报文过大就会发送阻塞,影响后面报文的发送。但是http2采用多路复用以及压缩报文的方式解决了这个问题,他讲报文压缩成二进制帧,且多路复用使得单个tcp链接能够多条路发送数据,就避免了头阻塞4.说一下jvm的垃圾回收这种问题就恶心啊,我不知道要讲什么,就说找垃圾的方法,应用计数法,可达性分析,然后垃圾回收算法又有四个,讲的口干舌燥的5.mysql的索引是什么,有什么索引索引是一种加快数据库查询效率的一种数据结构索引的类型:主键,唯一,常规,全文反问这边用什么技术栈说用的是golang,我就说怎么没问java的基础东西,一个实习把我拷打🐴了
查看5道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务