科大讯飞 大数据工程师

笔试过了一个月给捞起来了
一面 45min
1. 自我介绍
2. 细聊项目,很细(一上来就忘了数据量,尴尬)
3. 特征工程怎么做的
4. iv值的计算方法
5. AUC的计算方法
6. 正反例不平衡对auc有影响吗
7. 知道过拟合吗
8. 逻辑回归怎么解决过拟合问题
9. 写个函数指针
10. pandas库有哪些数据类型
11. 怎么取两个dataframe有差异的部分(忘了具体函数了,讲了几种可能的思路)
12. 写一个字典按key排序
13. 简述spark原理,应用场景
14. sql怎么取两张表有差异的部分
15. 反问,扯闲淡
结果通知时间:一周

二面 15min
聊聊爱好和课程
结果通知时间:3-5个工作日

hr唠嗑 30min
闲扯淡
结果通知时间:1天

已offer
全部评论
写一个字典按key排序,这是直接用treemap可以吗?还是说自定义的呀?
1 回复 分享
发布于 2023-05-18 09:29 广东
有ai算法测试的面经吗
点赞 回复 分享
发布于 2023-04-24 15:34 安徽
请问是实习嘛
点赞 回复 分享
发布于 2023-05-17 07:51 上海

相关推荐

牛客464620405号:随便投,随便找,中国经过40多年的改革开放,人才缺口和职位空缺是巨大的,中国现在属于遍地黄金的年代,属于90后和00大机遇的时代
点赞 评论 收藏
分享
03-16 22:00
武汉大学 C++
幸福的小熊猫想要offer:我阿里投的 c++岗,面试官说自己是做 java 的,c++这辈子才有了
点赞 评论 收藏
分享
03-15 20:26
已编辑
电子科技大学 C++
T3题面:给一个3e5数组,每次询问长度为len的子数组乘积的和,如果子数组乘积>1e9,则视为0.赛后一分钟想出来了,比赛时打了个暴力+线段树注意到1e9大约是2^30, 因此len长度如果>30就直接输出0,30以内做一个记忆化就行,复杂度O(30*n)感觉是以前比赛做过的题,忘了怎么做了。。。---upd: 忘了数据范围了,如果有0,1的话那这样也不行
blueswiller:给出一个做法,刚刚才想到,应该没问题,时间复杂度为 O(max(30n, nlogn)): 1. 根据 0 切分数组。2. 现在问题转化为>=1 的情况,我们首先维护每一个数前一个 > 1 的数的位置,同时维护一个长度的差分数组,初始值全为 0。3. 我们从每一个数 i 开始向前跳,至多跳 30 次,维护这个过程中的乘积,于是得到 30 个区间加和。举例:假设从 j1 跳到 j2 ,相当于对查询长度 (i- j1 + 1) 至 (i - j2) 贡献 a_i * ... * a_j1。4. 对于所有区间加和,我们采用差分数组结合树状数组对其进行维护,由于长度至多为 n ,树状数组构建的复杂度为 O(nlogn),于是,构建阶段的复杂度为 O(max(30n, nlogn))。在线单次查询的复杂度为树状数组查询的复杂度 O(logn)。
投递淘天集团等公司10个岗位 > 笔试
点赞 评论 收藏
分享
评论
8
36
分享

创作者周榜

更多
牛客网
牛客企业服务