兴业数金一面 不知道能不能过
兴业数金数据分析一面
1、问了自我介绍中提到的项目
2、union 和 union all 的区别
union会进行去重处理,union all 不会进行去重处理
3、去重操作,一个表筛选出唯一的一个id能想到几种办法
1)distinct
2)开窗函数,用排序涵数rank()然后筛选不重复的
4、口述的sql编程
两个表a,b
select a.id, b.id from a left join b on a.id = b.id where
如果要筛选出只在a中出现的id即在b中出现的以及在a,b中出现的都不要,where应该填什么,不能使用in和not in
回答 b.id = null
*追问,如果where改成and b.id=null 筛选出的结果有什么区别 *
回答 当时没想清楚,然后就答了会返回a中的全部
5、逻辑回归需要其满足什么样的分布
答 正太分布。错了,实际上是二项分布?还是伯努利分布
6、有一个数据中有一列是各种颜色如黄色、红色、蓝色你会对他进行怎样的处理
答 数值化
追问,如果都进行数值化处理,如黄色是0,蓝色1,红色2 会有怎样的问题
不太清楚想问什么,故回答会造成信息度缺失?
和同学之后交流讨论,数值化后的标签代入进去算损失,不同颜色的损失差别很大,即会造成类间差距很大,如红色是0,蓝色是1,黄色是2,红色跟蓝色差的是1,跟黄色差的就是2了这样同级别的类间差距不同
7、反问,有没有什么需要问我的
第一次面试,有点紧张就说没有,但其实我应该问问第六题到底会造成怎样的问题
#兴业数金面试##兴业数金##面经#