数据开发 - 中科智泓 - 一面面经(已OC)

有转正机会

面试流程:

自我介绍

第一个项目中的成员分工

数据规模是多少

数据模型是怎样考虑的

项目中有没有遇到过什么问题,是如何解决的

当时考虑接外部软件是吧,为什么没有考虑在数据可视化部分自己做一些定制化的开发

第二个项目是部署上线的,可使用的项目是吧

SQL中做行列转换如何操作

如何找到脏数据中十条重复数据并删除

如果直接筛,可能导致被锁住,有其他办法么

SQL中几种删除方式的区别

索引有了解吗,有哪些索引的类型

什么情况下会导致索引失效

分区有了解过吗

大数据量处理慢SQL的解决和优化方法

雪花模型和星型模型的区别

事实表和维度表有什么区别

Hive中内外部表有什么区别

Hive和Spark有什么区别

Sqoop在项目中主要做什么

如何用Sqoop实现增量数据的处理

常用Linux命令具体讲解

改文件执行权限用什么命令

做定时任务用什么命令

找到某一目录下,找到占用空间的最大的文件

创建文件呢

校园经历,写过PPT是吧

反问环节:

主要业务和工作:电信行业,安徽电信,数据来源非常多,类型多样,数据治理整合,做指标化的数据,大数据平台,封装API,数据调度,ETL配置开发,数据维护,口径变更,脚本更改,清理表空间,数据回溯,服务器资源优化

本地开发环境风险低,生产环境区别

全部评论

相关推荐

评论
4
2
分享

创作者周榜

更多
牛客网
牛客企业服务