触宝科技大数据面经

太久以前的面试了,大概在7月初的面试,都过去2过月了。。我的第一个面试,现在补一下面经
简单回忆一下吧,现在想了想当时问的太简单了,基本就是照着你的简历在问
一面1h:
1.MySQL底层存储
2.kafka是推还是拉的模式?好处?
3.Hbase底层原理
4.MySQL的MVCC怎么实现的
5.hive和Hbase的区别
6.es为什么比MySQL快
7.spark提交一个任务到运行的整个流程介绍一些
8.spark broadcast join底层如何实现
9.数据倾斜这么优化的?
10.数仓为什么要分层,你们分了哪些层,每一层的作用
11.flink如何保证经一次语义
12.flink如何处理背压
13.flink和spark的区别?
14.三次握手的过程(大家说这个过程的时候记得说清楚双方的状态!)
15.进程调度算法
16.Linux一些命令:怎么看端口,怎么看内存的使用情况,怎么查找一个文件,还有awk的一些用法
17.手写一个随机快排
二面50min:
基本就是聊天了,问一些业务场景下的问题,比如大数据下的去重啊这些,还有他们的一个业务问题,我随便说了几个解决方案,他们说他们目前也打算这么做。

三面:
1.问平时怎么单元测试?
2.你对static有什么理解?
3.你对面向对象的三大特性有什么认识?哪个最重要,为什么?
4.100亿url的大文件全排序,说一下具体怎么做?
5.你为什么没保研?
6.你的优势?
还有一些问题忘记了

HR 30min:
声音很好听,i了i了😘
一些常规问题吧,你对base的选择,优点,读研期间最大的收获,你觉得读研对你有什么帮助吗?你为什么选择做数据这块,考虑后台开发吗?读研期间研究方向是什么?为什么考虑不做通信的本专业?拿了哪些offer,有谈薪吗?你对薪水有什么期望吗?你有什么问我的吗(问了下对新人的培养和国外封禁国内app对触宝有什么影响吗)

意向书get


#校招##触宝##大数据开发工程师#
全部评论
学大数据要了解yarn结构之类的吗
1 回复 分享
发布于 2020-09-05 15:50
楼主,这也太强了,逢面必意向
点赞 回复 分享
发布于 2020-09-05 06:58
楼主您好,三面到HR面之间隔了多久啊
点赞 回复 分享
发布于 2021-07-14 20:43

相关推荐

#我的失利项目复盘##java##java面试题##java项目##项目#在给别人做模拟面试时,看到的项目某某商城某某商城为某某APP 首页核心业务之一,用户通过首页可直接接入到商城进行浏览、购物行为。商城团队历经了历次大促、活动促销的考验,我司作为合作方与某某大厂架构团队一起完成商城平台的开发建设;我作为核心开发人员参与了商城商品中台建设、库存中心、微服务改造升级、子系统接入、分库分表、拼团营销、金币抽签、合并支付等业务与架构工作。·技术难点:库存中心·技术挑战:商城经常做促销活动、秒杀场景, 商品瞬时进行库存扣减造成 redis 机器流量倾斜问题。 【秒杀场景需不需要单独的服务器,秒杀场景是否需要加锁;促销活动中,活动资源如何评定;】·技术方案:实现了一个高性能,可支撑分桶多分片的库存中心,提供单库存分片不足扣减的合并库存功能,提供商品操作库存入库的渐进性入缓存的实现。【如何保证数据的一致性;分桶多分片的库存扣减完整业务/时序图】·技术难点:数据迁移平台·技术挑战:分库分表方案敲定,为了实现数据迁移、数据同步需要完善可靠的数据迁移系统【数据量有多大?分库分表后,如何保证数据闭环,业务是否需要修改】·技术方案:研发数据迁移系统,包括了业务表(订单、订单详情等),迁移表、迁移配置表等。实现了全量同步滚动拉取、增量同步(基于 Cancal+MQ)防止数据丢失和高效写入方案。实现了单库到八库八表的实践。 【binlog和redolog的区别,binlog异步迁移是否存在风险,是否会造成查询过程卡顿】社交分享平台 【刚培训结束,自己做的面试项目】项目介绍 :社交分享电商平台旨在为用户提供分享购物心得,并可以直接购买相关商品。该项目分为管理端和用户端。用户端核心业务有:查看附近门店、发布笔记(获取积分)、签到、点赞和收藏,以此带动用户的活跃度。还可以发放一些优惠券,促进用户消费。管理端核心业务有:用户的笔记、评论、商品、优惠券的管理。 使用技术 SpringBoot、SpringCloud、RabbitMQ、Redis、XXL-JOB、Redisson、Mybatis-plus、分库分表等。 【接口性能主要在哪些地方消耗较大:IO】工作职责 1、采用百度地址编码和路线规划服务,为用户和商家地址提供查找附近门店的功能。 2、采用Redis位图 ,优化用户签到功能,减少内存消耗。 【按照每周讲解一下位图怎么使用:0000000---》0000001---->0000011】3、采用Redis SortedSet数据结构存储用户本月积分排行,使用MySQL分表存储历史积分排行。 【积分排行持久化的作用】4、采用XXL-JOB实现分布式任务调度,定时持久化上赛季积分排行,根据当月和历史积分排行发送优惠券。 【历史数据较多时,如何进行数据对比?】5、开发可扩展和通用的点赞/踩模块,利用Redis Set数据结构存储用户点赞明细, SortedSet数据结构存储特定业务项的点赞总数,增加用户互动性。 【为什么要用有序集合存储点赞明细】6、采用RabbitMQ实现消息队列,将点赞总数放入消息队列,实现系统解耦和异步处理, 提升系统响应速度。【点赞总数在什么场景下会被持久化DB层;场景如何界定】 7、设计支持多类型配置的优惠券系统,采用策略模式选择不同类型的优惠券。 8、解决了超发和超领问题。使用JMeter工具进行压测,确保并发安全和提高用户体验和平台性能。 9、采用乐观锁思想解决优惠券超发问题,利用关系型数据库写锁排他性保证并发安全。 【如何不使用锁解决超发问题?】10、采用Redisson分布式锁解决优惠券超领问题,结合SPEL表达式、工厂模式、策略模式和AOP思想,封装自定义分布式锁注解。个人成就 1、查询点赞状态使用 ,从单命令执行,改为RedisTemplate 的 executePipelined 方法进行批量处理,优化系统响应时间( 40s->100ms)。 2、多线程优化大批量数据插入速度:由于cdk的生成需要将这批码插入数据库中保存,当创建十万条cdk记录时,耗时达到了十几秒。使用@Async+自定义线程池的方式,异步生成cdk,优化后执行耗时2.5秒,执行时间缩短了6倍。 【批量插入的数据是否会受到间隙锁的影响;数据在插入过程中,如何避免/减少页分裂/页合并的产生/受到间隙锁的影响】3 、基于Redis异步领券响应速度:在兌换资格校验的时候,或者领券资格校验的时候,会有多次与Redis的交互,每一次交互都需要发起一次网络请求。在并发较高的情况下导致网络拥堵,导致业务变慢。通过编写LUA脚本,在脚本中编写复杂业务判断,通过一次请求,完成对脚本的调用。提高接口响应速度。
查看11道真题和解析 我的失利项目复盘 Java求职圈
点赞 评论 收藏
分享
面对HR询问手头是否有其他offer时,回答时可以保持既诚实又专业的态度,这样既体现了对对方公司的尊重,也为自己保留了适当的谈判空间。以下是一个回答示例:"非常感谢您提出这个问题,这显示出贵公司对候选人的全面考虑和尊重。目前,在积极寻找职业发展的机会过程中,我确实已经与几家我深感兴趣并认为与我职业规划相契合的公司进行了深入的交流。这些公司分别在各自领域内有着卓越的成就和良好的发展前景,它们提供的职位也与我的专业技能和经验高度匹配。然而,我必须强调的是,自从与贵公司接触以来,我被贵公司的企业文化、团队氛围以及为员工提供的成长机会深深吸引。我非常珍视这次面试的机会,并且认为如果有机会加入贵公司,将是我职业生涯中的一个重要里程碑。至于具体的offer情况,我目前还处于等待最终决定或进一步沟通的阶段。我深知每个offer都是对个人价值和能力的认可,但我相信在做出最终决定之前,全面评估所有选项,包括贵公司所能提供的平台和发展空间,是至关重要的。因此,我希望能够尽快了解贵公司对我此次申请的反馈,以便我能综合考虑所有因素,做出最符合我个人和职业发展的选择。同时,我也期待有机会与贵公司进一步探讨我能如何为团队贡献自己的力量,并共同成长。#秋招##offer##牛客创作赏金赛#
今年会有offer吗:转人工
查看3道真题和解析 牛客创作赏金赛
点赞 评论 收藏
分享
3 22 评论
分享
牛客网
牛客企业服务