链家2018秋招客户端大数据工程师,今年比较热门的岗位
一、选择题
1、正则表达式”*”和”?”的含义分别是?(D)
A 匹配前一个子表示1次或多次,匹配前一个子表达式0次或多次
B 匹配前一个字表达式0次或多次,匹配前一个子表达式1次或多次
C 匹配前一个字表达式1次或多次,匹配前一个子表达式0次或1次
D匹配前一个子表达式0次或多次,匹配前一个子表达式0次或1次
2、某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?A
A 关联规则发现
B 聚类
C 分类
D 自然语言处理
3、java的NIO,selector的作用是(B)
A 选择ByteBuffer的数据
B 用来处理多个Channel的Operation
C 用来处理多个ByteBuffer的数据
D 用来在Channel间传递数据
4、下面那些不是数据仓库中存的数据类型?C
A 星型模型
B 雪花模型
C 分子模型
D 星座模型
5、数据仓库Hive可以使用下列哪些技术作为查询引擎B
A storm
B mapreduce
C fllnk
D Tez
6、大数据应用需依托的新技术有(D)
A 大规模存储与计算
B 数据分析处理
C 智能化
D 三个选项都是
7、跳跃表(SkipList)的底层数据结构是B
A 大顶堆
B 链表
C 红黑树
D 双端队列
8、大数据的核心就是B
A 告知与许可
B 预测
C 匿名化
D 规模化
9、HDFS不擅长存储大量小文件,最主要的原因是(A)
A会占用NameNode太多内存
B 会占用NameNode太多硬盘
C 会占用DataNode太多内存
D 会占用DataNode太多硬盘
10、相比依赖于小数据和精确性的时代,大数据因为更强调数据的()帮助我们进一步接近事实的真相。D
A 安全性
B 完整性
C 混杂性
D 完整性和混杂性
11、Kafka常被用于采集数据的传输,下列关于Kafka的说法,哪些是正确的?D
A Kafka的元数据存在于单独的MAster的节点上
B Kafka中,topic的partion数量不能超过broker的数量
C Kafka中,topic的replication数量不能超过broker数量
D Kafka中,consumer group中的consumer数量不应该多于要消费得topic的partition的数量。
12、下列安歇情况属于适合MapReduce的应用场景AD
A 海量数据的定时ETL
B 海量数据的定时告警
C 对数据仓库进行交互式查询分析
D 对数据仓库进行离线分析
13、下面哪一项不属于大数据关键技术?D
A 云计算
B 分布式文件系统
C 数据众包
D 关系型数据库
14、假设现在要开发一套做服务日志的采集系统,以下哪种技术不适合做日志采集工具D
A Flume
B Scribe
C Logstach
D Sqoop
15、Hicve可以使用哪种数据库存储元数据?C
A MysSql、HBase
B Derby、Redis
C Derby、MySql
D Redis、MySql
16、大数据是指不用随机分析这样的捷径,而采用(A)的方法
A 所有数据
B 绝大部分数据
C 适量数据
D 少量数据
17、在Spark中,调用persise()方法对RDD进行持久化,下列哪一项不是合法的持久化级别?(B)
A MEMORY_ONLY
B MEMEORY_SER
C DISK_ONLY
D MEMORY_AND_DISK_SER
18、下面陈述不正确的是(C)
A 大数据将实现科学决策
B 大数据使***决策更加精准化
C 大数据彻底将***化解在萌芽状态
D 大数据将实现预测式决策
19、在Spark中,下列哪种操作不会引发数据混选(shuffle)?(B)
A reduceByKey
B mapValues
C groupByKey
D repartition
20、以下哪种技术组合不适用于构建实时计算系统D
A Kafka +Flink
B Kafka +Storm
C HBase+Spark Streaming
D HDFS+MapReduce
二、编程题
1、试题描述:
玥玥带乔乔一起逃亡,现在有许多的东西要放到乔乔的包里面。但是包的大小有限,所以我们只能够在里面放入非常重要的物品,现在给出该物种的数量,体积,价值的数值,希望你能够算出怎样能使背包的价值最大的组合方式,并且算出这个数值,乔乔会非常感谢你
对于30%的数据1<=v<=500 1<=n<=2000 1<=m<=10
1<=w<=20 1<=s<=100
输入
第1行有2个整数,物品种树n和背包装载体积v
第2行到+1行每行3个整数,为第i种物品的数量m,体积w,价值s。
输出
仅包含一个整数,即为能拿到的最大的物品价值总和。
样列说明:选第一种一个,第二种两个,结果为3*1+5*2=13.
输入示例:
2 10
3 4 3
2 2 5
输出示例
13
2、试题描述:
要把m升的水倒入n个相同的容器中(假设容器足够大),允许有的容器是空的,问共有多少种不同的倒法?(用k表示)5,1,1和1,5,1和1,1,5是同一种倒法
输入
第一行是测试数据的数目x(0<=x<=20).以下每行均包含二个整数m和n,以空格分开,1<=m,n<=10
输出
对输入的每行数据m和n,用一行输出相应的k
输入示例:
1
7 3
输出示例:
8
3、试题描述:
小明有n(1<=n<=2000)个美味的食物,他想要卖掉它们来赚钱,这些食物放在一些箱子里,它们有些有趣的特性:
(1)这些食物被编号为1-n,每一天小明可以从这排箱子的头部或者尾部取出食物去卖;
(2)这些食物放的越久,年龄越大。价值越大,食物i有一个初始的价值V(I);
(3)放了a天后,年龄为a,食物最终的价值为V(i)*a.
给定每一个食物的初始价值v(i),请求出小明卖掉它们后可以获得的最大价值,第一天出售的食物的年龄为1,此后每增加一天食物的年龄就增加1.
提示
样例说明:小明出售这些食物(初始价值1,3,1,5,2)的顺序为:第一天卖掉第1个,第二天卖掉第5个,第三天卖掉第2个,第四天卖掉第3个,第5天卖掉第4个,获得最大的价值
1*1+2*2+3*3+4*1+5*5=43.
输入
第1行L一个整数n;
第i+1行:每行为食物i的初始价值V(i)
输出
1行:小明最终可以获得的最大价值。
输入示例:
5
1
3
1
5
2
输出
45
#秋招##大数据开发工程师##笔试题目##链家网#