顶顶顶顶
点赞 评论

相关推荐

数开面试题使用的hive,tez计算引擎1.如何建模、以及数据开发过程中需要注意的问题(数据探查、数据开发、数据质量监测、数据核对)2.页面数据有问题、如何排查3.抽数、推数数据量异常如何自动停止任务(要有工作日、非工作日的判断,非工作日不生效,UDF函数)4.hive表生命周期管理失效,如何进行生命周期管理(设成自动任务的话可能会使用shell脚本)(3个月前每月保留第一天与最后一天的数据,注意是业务时间第一天与最后一天,非调度时间)5.数据量大的表推数慢影响页面展示怎么解决6.根据2个日期计算工作日天数7.去重方式(开窗函数如何控制窗口的大小)8.列转行(清洗、分隔符统一、注意有些业务数据(比如一条数据楼栋面积字段(可能是总面积)对应多个房屋或多个楼栋)、LATERAL VIEW explode)9.明细表数据量大,每月还要都保留一份,怎处理?怎么优化?达梦分区(范围分区、哈希分区、列表分区、组合(多级)分区、间隔分区(属于范围分区)INTERVAL <间隔表达式>)10.更新数据效率更高的方式update采用的类似nested loop的方式,对更新的每一行,都会对查询的表扫描一次;merge into这里选择的是hash join,则针对每张表都是做了一次 full table scan,对每张表都只是扫描一次。11、筛选的时候in(不适合B大)、exists不适合B大)、join的底层以及效率12.常用的分析函数13.连续3天及以上连续出现的次数(减序号) #实习#  #校招#  #大厂#  #数开#  #数仓#
查看13道真题和解析
点赞 评论 收藏
分享
11-06 18:30
已编辑
门头沟学院 Java
10.25一面,原定30min,实面18min,KPI面。没有收到后续1、自我介绍2、看项目中用到了rabbitmq,说下它的主要作用答了解耦、异步和削峰3、如果建立了联合索引(a,b,c)现在查询条件顺序是c,b,a会用到索引么4、对于两个字段的or查询,如何保证走索引,例如查询name=?or student_id=?没答出来,就说给两个字段都建索引呗,面试官表示好像不太行5、看你简历有用到分布式锁,用的哪种实现6、项目中写了es,数据是怎么导入es的回答分页查询,使用线程池导入...7、直接连接的数据库和es进行导入的?用的什么jar包连接的有点无语,jar包名字记不住...8、Spring Cloud用的是阿里的那套还是什么,用到哪些组件9、Gateway路由分发的策略10、微服务之间的调用是怎么实现的知道吗11、服务A调用服务B,会经过nacos么12、有用过别的组件么回答都写在简历上了,没用过别的反问:1、面试流程两轮技术+hr2、有什么要 改进的地方,给些建议说招聘后端开发工程师看的是对这些技术的掌握程度,包括对技术选型上的一些思考,比如你项目中用到了rabbitmq,那思考过不同的消息队列之间的区别吗,比如说项目中用的是redisson实现的分布式锁,有没有考虑和其他实现方式的区别。(这里我非常不解,为什么他面试中不问我这些区别,点评却要说这些)。#顺丰##顺丰科技##一面##一面凉经##kpi面#
顺丰集团一面100人在聊 查看14道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务