面试题集锦

  1. hdfs有几种存储类型
  2. Kafka的partition存储具体细节
  3. Kafka中索引和真实数据的具体查询机制(.index和.log,二分查找)
  4. Kafka消费者组中如果一个消费者挂掉,会发生什么?(怎么保证后续消费的正常?) 
  5. 补:涉及协议
  6. HDFS的读数据流程(深究) DataNode之间传输Packet一个过程 balabala
  7. HDFS支不支持多个客户端写同一个数据文件

介绍项目 五层架构的作用 数据源是哪来的 用户行为数据 拿脚本生成的 逻辑 脚本一次生成多少条数据 统计的指标有哪些

yarn的资源调度 任务提交 yarn有几个模块 七个子模块? clint,rm,am,nm。后来想想,可能是想让我说Hadoop 中MapReduce过程中的七个,再加上dn,nn,2nn

mysql的引擎还有和innodb这类数据库的区别

聚簇索引和非聚簇索引

事实表维度表,讲了讲大概是什么东西

当数据量很大要运行很久的时候有没有用过什么优化手段?

sql函数rank(),dense_rank(),row_number()的区别?

hbase用过吗,rowkey的设计原则是什么

如何解决热点现象

java的集合类有哪些

java实现多线程的几种方式

你知道有哪些实现线程池的方式吗,讲一下有哪些类

udf函数的分类

你实现的udf函数的功能

自我介绍、 介绍了一下你的数仓项目、 遇到过的最难的需求,怎么解决的、 MapReduce的执行过程、 zookeper的leader选举机制,常见的一些应用场景,举例说明

hive优化你用过哪些,数据倾斜遇到过吗、 你采用的数据存储格式是什么,相比于其他有什么优势

hashmap的底层原理是什么

上海商业化部门: 5.10下午字节一面 1、自我介绍 2、问实习内容,有没有痛点 3、python的装饰器、is和==的区别、好像还问了几个忘记了。 4、tcp是如何保持可靠性? 5、那分别介绍序列号和确认号、超时重传? 5、流量控制如何进行的?拥塞控制又如何进行? 5、tcp和udp的区别。 6、http的method有哪些并解释各方法的作用。 7、http和https有什么区别? 8、cookie和seesion有什么区别? 9、代码题:求一个字符串中的出现最大次数的字符并返回该次数。 10、设计测试用例:扫码支付。 11、逻辑题:有一根金条只可以切两次用来支付一个工人7天的工钱,你要怎么分配。 无反问阶段。。。 5.16字节二面: 1、自我介绍(背景知识少说) 2、实习内容,除了用unitest这个框架外自己增加了哪些技术点? 3、实习网络业务介绍? 4、深度学习模型怎么设计的?为什么这么设计?怎么与传统的图像处理方法相结合。 5、损失函数用的什么?结构相似度损失和像素损失相结合。 6、怎么评估模型的,用了哪些指标。 7、你最熟悉的语言?Python的GIL说一下?什么是CPU密集型、什么是IO密集型? 8、Python深拷贝和浅拷贝有什么区别,函数传参是浅拷贝还是深拷贝?(这是个坑,函数传参属于直接赋值) 9、Python用过哪些库?有没有用过实际开发需要调用的库? 10、死锁的必要条件? 11、说一下索引的优缺点?说一下索引的底层原理? 12、算法题:最长公共前缀。设计该算法的测试用例,直接写出来,并说一下为什么这么设计? 13、你有什么想问的?

全部评论

相关推荐

头像
2024-12-19 18:11
英特尔_Software_engineer
下水道鼠鼠鼠鼠:男的能去当技师吗 好进吗
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务