众安保险-数分笔试
岗位:数据分析师
笔试内容:单选22道,不定项选择3道,编程2道
笔试时间:2025/4/10,时长90分钟;
单选:
1、允许多次从一个字段读取相同的值,描述是Repeatable Read(可重复读)
2、属于聚类算法的问题是k-means
3、intersect实现交集
4、在一个长度为n的顺序表中查找元素,最好情况需要比较1次,最坏情况也需要比较n次
5、对每个子图调用legend()显示图例;ax1.legend(loc='best');fig.add_subplot(2,2,1)将画布划分为 2 行 2 列的子图布局,ax1 选取第 1 个子图位置(从左到右、从上到下编号)。
6、考察函数递归
7、在 Python 中,导入模块的查找顺序如下:
- 内建模块:首先检查是否为 Python 内置模块(如
sys
、os
等)。 - 当前路径:查找执行 Python 脚本所在的当前路径。
- 环境变量 PYTHONPATH:若当前路径未找到,再检查
PYTHONPATH
配置的路径。 - Python 安装路径:最后查找 Python 安装目录(如默认的第三方库安装位置
site-packages
)。
8、考察程序的执行过程
- 变量
a
的创建:a = [['1','2'] for i in range(2)]
,列表推导式生成的两个子列表指向同一个列表对象。执行a[0][1] = '3'
时,由于两个子列表引用同一对象,最终a
变为[['1', '3'], ['1', '3']]
。 - 变量
b
的创建:b = [['1','2']]*2
,两个子列表同样指向同一列表对象。执行b[0][0] = '4'
后,两个子列表均改变,最终b
变为[['4', '2'], ['4', '2']]
。
9、考察前序便历和中序遍历
前序便历的首元素是根,中序遍历中根元素左侧是左子树,根元素右侧是右子树
10、考察pandas的mask方法,当条件是True时,替换成指定值;
11、隔离性保证并发访问时,各事务之间数据相互独立,互不干扰,符合事务特性描述。
12、考察规范化公式
最大最小规范化公式为:\(v' = \frac{v - \text{min}}{\text{max} - \text{min}}\)。
13、考察SQL语法
在 SQL 中,判断字段是否为 NULL
时,不能使用 =
或 ==
,必须使用 IS NULL
或 IS NOT NULL
。
14、sizeof(s)求整个数组的大小;大小=列数 x 行数 x char(字符串) =
15、考察等频(深)划分;等频(等深)划分要求每个箱子的数据数量相同。
16、t检验的条件:总体方差齐性;
u检验的条件:当样本例数n较大时,依据中心极限定理,可近似使用 u 检验;若样本例数小,但总体标准差已知,也适用 u 检验。
17、考察元数据的定义;基本元数据描述数据的结构,如数据源、数据仓库、数据集、应用程序等结构相关信息,
18、考察贝叶斯公式;
19、在经典的二分类器SVM中,0/1 损失函数具有非凸、不连续的特点,这种数学性质会导致优化过程难以求解。
而 SVM 需要高效的优化方法(如凸优化),Hinge 损失是凸函数且连续,数学性质良好,更适合 SVM 的优化框架。
20、np.extract()用于从数组中提取满足条件的元素;通过[ : : -1 ]实现降序
21、明确范式的定义:数据库设计的规范化过程。
22、判断闰年的规则是:能被 4 整除但不能被 100 整除,或能被 400 整除。
不定项选择
1、continue 的作用是跳过当前循环剩余语句,进入下一轮循环;
break 跳出整个循环;
break 和 continue 均可用于while和for循环;
2、归一化公式是(x-min)/(max-min),属于线性变换;
归一化可以消除量纲的影响;
如果模型对数据的取值范围有要求,应该考虑归一化操作;
数据存在异常值,应该考虑标准化;标准化用均值和标准差,异常值对他们的影响较大;
3、设取出n瓶饮料,3瓶不合口味饮料都被取出的概率为\(\frac{C_{7}^{n-3}}{C_{10}^{n}}\),需满足\(\frac{C_{7}^{n-3}}{C_{10}^{n}} \geq 0.6\)。
编程题
1、查询该酒店从6月12日之后开始连续入住多晚的客户信息;
要求输出客户id, 房间id, 房间类型,连续入住天数;
连续入住天数采用函数datediff来计算;datediff(outtime, intime) as days
一般来说,select中不是聚合函数的项都应该在group by中出现;或者聚合函数中使用到的参数也应该出现在group by 中;
(通过率67%,不知道什么原因)
2、小美忘记了密码,需要输出最小和最多尝试次数;
#笔试##众安笔试#