众安保险-数分笔试

岗位:数据分析师

笔试内容:单选22道,不定项选择3道,编程2道

笔试时间:2025/4/10,时长90分钟;

单选:

1、允许多次从一个字段读取相同的值,描述是Repeatable Read(可重复读)

2、属于聚类算法的问题是k-means

3、intersect实现交集

4、在一个长度为n的顺序表中查找元素,最好情况需要比较1次,最坏情况也需要比较n次

5、对每个子图调用legend()显示图例;ax1.legend(loc='best');fig.add_subplot(2,2,1)将画布划分为 2 行 2 列的子图布局,ax1 选取第 1 个子图位置(从左到右、从上到下编号)。

6、考察函数递归

7、在 Python 中,导入模块的查找顺序如下:

  1. 内建模块:首先检查是否为 Python 内置模块(如 sysos 等)。
  2. 当前路径:查找执行 Python 脚本所在的当前路径。
  3. 环境变量 PYTHONPATH:若当前路径未找到,再检查 PYTHONPATH 配置的路径。
  4. Python 安装路径:最后查找 Python 安装目录(如默认的第三方库安装位置 site-packages)。

8、考察程序的执行过程

  1. 变量 a 的创建a = [['1','2'] for i in range(2)],列表推导式生成的两个子列表指向同一个列表对象。执行 a[0][1] = '3' 时,由于两个子列表引用同一对象,最终 a 变为 [['1', '3'], ['1', '3']]
  2. 变量 b 的创建b = [['1','2']]*2,两个子列表同样指向同一列表对象。执行 b[0][0] = '4' 后,两个子列表均改变,最终 b 变为 [['4', '2'], ['4', '2']]

9、考察前序便历和中序遍历

前序便历的首元素是根,中序遍历中根元素左侧是左子树,根元素右侧是右子树

10、考察pandas的mask方法,当条件是True时,替换成指定值;

11、隔离性保证并发访问时,各事务之间数据相互独立,互不干扰,符合事务特性描述。

12、考察规范化公式

最大最小规范化公式为:\(v' = \frac{v - \text{min}}{\text{max} - \text{min}}\)。

13、考察SQL语法

在 SQL 中,判断字段是否为 NULL 时,不能使用 = 或 ==,必须使用 IS NULL 或 IS NOT NULL

14、sizeof(s)求整个数组的大小;大小=列数 x 行数 x char(字符串) =

15、考察等频(深)划分;等频(等深)划分要求每个箱子的数据数量相同。

16、t检验的条件:总体方差齐性;

u检验的条件:当样本例数n较大时,依据中心极限定理,可近似使用 u 检验;若样本例数小,但总体标准差已知,也适用 u 检验。

17、考察元数据的定义;基本元数据描述数据的结构,如数据源、数据仓库、数据集、应用程序等结构相关信息,

18、考察贝叶斯公式;

19、在经典的二分类器SVM中,0/1 损失函数具有非凸、不连续的特点,这种数学性质会导致优化过程难以求解。

而 SVM 需要高效的优化方法(如凸优化),Hinge 损失是凸函数且连续,数学性质良好,更适合 SVM 的优化框架。

20、np.extract()用于从数组中提取满足条件的元素;通过[ : : -1 ]实现降序

21、明确范式的定义:数据库设计的规范化过程。

22、判断闰年的规则是:能被 4 整除但不能被 100 整除,或能被 400 整除。

不定项选择

1、continue 的作用是跳过当前循环剩余语句,进入下一轮循环;

break 跳出整个循环;

break 和 continue 均可用于while和for循环;

2、归一化公式是(x-min)/(max-min),属于线性变换;

归一化可以消除量纲的影响;

如果模型对数据的取值范围有要求,应该考虑归一化操作;

数据存在异常值,应该考虑标准化;标准化用均值和标准差,异常值对他们的影响较大;

3、设取出n瓶饮料,3瓶不合口味饮料都被取出的概率为\(\frac{C_{7}^{n-3}}{C_{10}^{n}}\),需满足\(\frac{C_{7}^{n-3}}{C_{10}^{n}} \geq 0.6\)。

编程题

1、查询该酒店从6月12日之后开始连续入住多晚的客户信息;

要求输出客户id, 房间id, 房间类型,连续入住天数;

连续入住天数采用函数datediff来计算;datediff(outtime, intime) as days

一般来说,select中不是聚合函数的项都应该在group by中出现;或者聚合函数中使用到的参数也应该出现在group by 中;

(通过率67%,不知道什么原因)

2、小美忘记了密码,需要输出最小和最多尝试次数;

#笔试##众安笔试#
全部评论
选择题是正确答案嘛,还是你的答案呀
点赞 回复 分享
发布于 04-10 22:15 湖南

相关推荐

03-26 23:26
上海大学 Java
点赞 评论 收藏
分享
04-08 09:42
南京大学
点赞 评论 收藏
分享
评论
3
5
分享

创作者周榜

更多
牛客网
牛客企业服务