#腾讯大数据开发工程师面经# #大数据开发工程师面经# #大数据面试昨_牛客网

牛客926186275号

2020-07-02 10:47 西安科技大学大数据开发工程师

关注

#腾讯大数据开发工程师面经#
#大数据开发工程师面经#
#大数据面试

昨天面试腾讯大数据开发，面试题奉上，欢迎大佬指点

问题：
1.自我介绍
2.项目细节
3.题目有用户对于微信文章表t_user_log,数据量约40亿，t_wx_doc表，数据量约400W,
表结构信息如下
create table default.t_user_log (
   ip string comment 'ip',
   ts string comment '时间戳',
   userid string comment '用户id',
   docid string comment '文章id',
   action string comment '用户行为1 阅读，2点赞，3 分享，4 打赏, 5 评论',
   entry  string comment '如口'
) partitioned by (
   day string comment ''
)

create table default.t_wx_doc (
cpid string comment '公众号id',
ts string comment '发文时间戳' ,
docid string comment '文章id',
text string comment '文章内容',
category string comment '文章分类'
)
机器资源有限，（vcore 小与100， &&men<400G）请编程解决下面两个问题
计算框架算法不限
1 .找出热门的公众号top10
2. 给定一个10000w 大小用户包（userid 字符长度为16）计算他们各自最可能喜欢的5个公众号

4. Flink如何保障在使用kafka的时候是execyly-one的？
5. Flink与spark的区别
6. Flink内存模型
7. Spark内存模型
8. Spark shuffle过程
9. Spark Rdd属性
10. Rdd的那个算子可以重分区但是不用shuffle
11. 问题3热门文章数据量大的时候，出现数据倾斜如何解决

面试完之后感觉要跪了，效果很差。继续加油补知识

大数据求职圈

全部评论

推荐最新楼层

门头沟学院大数据开发工程师

大佬知道是腾讯哪个事业群吗？

点赞回复分享

发布于 2021-01-20 15:24

海康威视_研究院_大数据开发工程师

能问下怎么投的大数据开发吗？校招岗位只有数据分析啊😂

点赞回复分享

发布于 2020-07-14 11:10

西瓜勇士_变身

门头沟学院数据分析师

码一下，我是刚选方向的菜鸡

点赞回复分享

发布于 2020-07-14 01:41

武汉纺织大学数据仓库

感谢分享

点赞回复分享

发布于 2020-07-02 12:28

03-11 08:40

门头沟学院 golang

拒绝实习offer会影响秋招吗

老哥们我想问一下拒绝实习offer会影响秋招吗？我现在是研一，导师原来答应我出去实习的，然后我就投了不少简历，现在约了几家的面试，然后导师接了个项目，让我去做这个项目，不让我出去实习了请问这种情况该怎样和HR沟通呢，如果HR那边发offer然后我拒绝了，秋招还可以继续投递吗 #实习/项目/竞赛奖项，哪个对找工作更重要？#

实习/项目/竞赛奖项，哪个对找工作更重要？

点赞评论收藏

分享

03-16 21:56

腾讯_大数据高性能开发(准入职员工)

分享面经（wxg 某团队----客户端开发）一面 （1个小时05分钟）30分钟的实习cpp的一些问题，比如如何利用windowsapi设计窗口，z型扫描，如何定位等问题（30分钟）1个小时后约复试二面（1个小时）20分钟实习之后看了看我的github，给面试官跑了一下之前自己开源的代码和博客。30分钟。10分钟 反转链表（好多次都写反转链表了哈哈）1个小时后约第二次复试三面30分钟实习（1小时50分钟）场景题 弹窗的设计以及大数据的处理。（跟之前的很像，我发现这些企业都爱考整体的架构设计，）要包括数据库和中间件的设计以及处理。（因为我实习和开源的东西用到过）1个小时20分钟智力题我是真没准备，...

点赞评论收藏

分享

03-05 15:15

已编辑

中国人民大学 Java

腾讯IEG天美工作室后台开发实习一二面凉经

发面经，涨好运一面 2.251h30min，无算法，基本上是全程八股1.go slice实现原理，追问扩容数组拷贝很耗时，有了解怎么做的优化吗2.redis缓存雪崩，缓存击穿，缓存穿透3.缓存击穿提到了分布式锁方案，问分布式锁如何实现。追问分布式锁抢锁失败应该做什么4.缓存穿透提到了布隆过滤器，问布隆过滤器的原理，追问写操作时写布隆过滤器和写redis数据缓存的一致性如何保障5.kafka如何保证消息的可靠性，追问消费者幂等性如何实现。幂等性提到了唯一id的方案，追问唯一id在哪里生成6.内存只有512M，进程分配1G内存可以实现吗。追问如何关闭换页机制，追问oom kill时杀哪些进程7.问tcp可靠性如何保证8.tcp场景，发送端发seq=11，12，13，接收端只收到11，13，接收端回复什么信息。追问超时重传，快速重传。追问tcp滑动窗口的概念，滑动窗口的初始大小通过什么参数调整9.发http请求的过程，追问tls握手过程，追问一个会话如何记录用户的状态信息（token），追问为什么用了https还需要session，token这些东西10.线程池优化相关，为什么线程多了性能反而受到影响，追问linux线程调度的实现，追问线程调度优先级如何设置11.聊实习的时候顺便基于当时的场景问了一个时序问题，A，B两个机器向C发请求，A比B先发，怎么保证到C的请求的时序和A，B发请求的时序是同一个（这个问题聊了一会，当时没意识到没办法实现），追问为什么没办法实现。追问如果A，B在一个进程里，能实现吗，如何实现二面 3.3约面的时候说要面1h30min，结果最后只面了30min1.简单聊了一下两个项目的架构，一两个关于项目的问题，但不深2.问我熟不熟悉微服务sidecar架构3.一些个人bg方面的问题4.等边三角形三个顶点上三只蚂蚁，每只等概率往两边走，问蚂蚁不相撞的概率是多少5.一道口述的算法题，平面上一堆点，找出所有最小围住的区域的集合。一开始以为是力扣那种恶心人的平面几何数学题，后面沟通让我用图论的方式做，又聊了一下思路，说不用写代码了，也不知道他是觉得算法能力强还是弱6.反问出结果时间，说要横向对比感觉二面啥都没问，面完就有种要挂掉的预感，果然今天早上看挂了。#面经##腾讯#

点赞评论收藏

分享

03-07 23:32

门头沟学院 Java

究极无敌爆炸难面经

1.请解释CMS收集器在并发标记阶段如何解决&quot;浮动垃圾&quot;问题？当出现&quot;Concurrent Mode Failure&quot;时，JVM会采取什么策略？G1的SATB算法相比传统标记有何优势？2.如何通过JVM TI实现动态字节码插桩？请描述类重定义的HotSwap机制限制及JVMTI的Can-Redefine-Classes能力边界3.当出现StackOverflowError时，如何在不修改代码的情况下，通过JVM参数实现栈帧的动态扩容？请解释Xss和Xmx的协同工作机制4. 请手写实现一个无锁的B+树结构，要求支持并发插入和范围查询，并说明如何保证happens-before原则5. 当使用ForkJoinPool处理递归任务时，如何避免工作窃取(Work-Stealing)导致的内存一致性错误？请结合MESI协议说明缓存行对齐的优化方案6. 设计一个支持10万QPS的异步事件总线，要求保证严格的事件顺序性和背压处理，请给出核心类结构并说明为什么选择Phaser而不是CyclicBarrier7. 请解释JLS中关于double和long的非原子性写入规则，如何在字节码层面通过DUP2_X2指令保证64位类型的原子操作？8. 当使用动态代理时，为什么ProxyGenerator会生成包含$methodName$0格式的桥接方法？请用ASM框架手写一个绕过接口限制的动态代理实现10. 当出现Full GC时间过长时，如何通过HSDB定位到具体的对象驻留原因？请给出从jmap到MAT分析的全流程，并解释Dominator Tree的作用11. 如何通过JIT的PrintAssembly输出，发现方法内联失败导致的性能瓶颈？请举例说明@DontInline注解对C2编译器的影响12. 设计一个对象池时，为什么TLAB分配比全局锁竞争更高效？请用JMH测试对比不同分配策略在128字节对象创建时的吞吐量差异13. 请使用Project Loom的虚拟线程重构传统线程池实现，说明如何避免pin到载体线程导致的吞吐量下降，并设计针对IO密集型任务的调度策略14. 当使用Valhalla项目中的值类型时，如何保证泛型特化(List<Point>)与现有集合框架的兼容性？请对比ValueBased和IdentityObject的运行时差异15. 使用Project Panama实现一个零拷贝的Tensor计算框架：如何通过MemorySegment和VarHandle直接操作堆外内存，并保证内存安全的生命周期管理#饿了么求职进展汇总##蚂蚁求职进展汇总##牛客创作赏金赛##面经#

野猪不是猪🐗：饿了么这么逆天？？？下次直接让手撕jdk21得了😂

饿了么求职进展汇总蚂蚁求职进展汇总

点赞评论收藏

分享

03-05 00:01

门头沟学院大数据开发工程师

阿里数仓开发

#软件开发笔面经# 之前参与了阿里的数仓开发面试，到了3轮技术终面，但没有后续的动静了，应该是排队失败了吧，面试主要聊了以下内容：1 大数据生态圈吧，主要是聊了一下spark.hive,flink这些简单聊了一下2 数仓模型，数据分层，数仓模型规范，数据质量监控，数据域和主题域等等吧3还聊了一下业务，我之前一直做财务数据，主要是聊一下财务数据准备性保证，数据延迟，数据交易异常处理等等吧阿里给我的面试感觉就是我们主要是诉说方，面试官很少打断你，也不会说你技术差，只是聊聊，可能社招对于技术关注不是很大，全程不做算法，不写SQL，只是聊天，终面估计是p9大佬来面的，也是聊天为主，主要是聊职业规划和为啥跳槽，基本上不聊技术了

查看4道真题和解析软件开发笔面经

点赞评论收藏

分享

评论

10

25

招聘动态

26届实习软件笔试必刷题单

26届实习求职交流群

字节跳动Tik Tok

26届实习招聘

26届投递链接合集

快手

25届补录+26届实习

字节跳动-Tik Tok

26届实习生招聘

25届春招专场

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 设计人如何选offer #

98413次浏览 689人参与

# 找工作，行业重要还是岗位重要？ #

7788次浏览 102人参与

# 五一之后，实习真的很难找吗？ #

45766次浏览 327人参与

# 盲审过后你想做什么？ #

12705次浏览 113人参与

# 外包能不能当跳板？ #

22200次浏览 191人参与

# 领导秒批的请假话术 #

9957次浏览 74人参与

# 考研可以缓解求职焦虑吗 #

21172次浏览 251人参与

# 五一假期，你打算“躺”还是“卷”？ #

30649次浏览 436人参与

# 找工作前vs找工作后的心路变化 #

7204次浏览 64人参与

# 面试等了一周没回复，还有戏吗 #

115662次浏览 1074人参与

# 硬件人，你被哪些公司给挂了 #

46726次浏览 722人参与

# 安克创新求职进展汇总 #

32582次浏览 415人参与

# 大疆的机械笔试比去年难吗 #

69653次浏览 603人参与

# 应届生薪资多少才合理？ #

3115次浏览 24人参与

# 牛友们的论文几号送审 #

27273次浏览 623人参与

# 写简历别走弯路 #

714533次浏览 7850人参与

# 你喜欢工作还是上学 #

37679次浏览 413人参与

# 如果有时光机，你最想去到哪个年纪？ #

43342次浏览 769人参与

# 如果不工作真的会快乐吗 #

101241次浏览 867人参与

# 每人推荐一个小而美的高薪公司 #

72851次浏览 1357人参与

牛客网
牛客企业服务