阿里集团CTO线 数据研发 实习 一面凉经

我有毛病(自我感叹),我其实不会数据,但内推的时候我没仔细看岗位直接点点点一路点了下去hhhh
然后就面了数据科学家实习生,和我不是很对口,就有点点尴尬
HR和我说一面主要围绕项目经历,统计学原理,数据挖掘技术,数据仓库展开

一面是电话面试,但因为要写代码,所以手边要有一台连得上网的电脑
先是5-10分钟自我介绍,面试官仔细问了我之前在微软STCA的经历,问了下使用的算法和数据分类时选取的特征,最后实现的结果等等。
以及问了下过拟合是怎么判断的这样这样

接着是问了两道智力题:
问题1. 在一个与世隔绝的村子中,有50户人家,每户人家有一匹马,在这50匹马中有病马(病不传染)。于是人们要找出生病的马,每户人可以观察其他的49匹马,并能够判断他们是否生病,只有自己家的马不能看,观察后得出的结果也不能交流,不能通知马的主人。主人一旦推算出自己家的马是病马,当天就要开枪打死它,而且每个人只有权力枪毙自己的马,没有权力枪毙别人的马。第一天、第二天都没有枪响,到了第三天传来一阵***,问有几匹病马,如何推算得出?
问题2. 假如草地上有一群兔子,数量无穷多,但是体重不相同。我们从中选出10只兔子,记其中的最重的兔子的重量为A, 然后再从剩余的兔子中选出20只,记其中的最重的兔子的重量为B, 问A大于B的概率是多少?
这两道都答出来的。

然后问我会不会写SQL,我:不会,只会写微软的scope
面试官:噢,那这个还要再加强加强
我(内心):不是R,python,SQL中有会的就行了么呜呜呜呜另外另个我会啊

再接着是问了几个统计学基础知识:
解释下什么是假设检验,什么是显著性水平,检验统计量和P值
给出一个实际问题,要怎么进行假设检验(给了一道题)
假设检验的两种错误是什么?怎么减少第二类错误,为什么这个方法可以减少第二类错误?

其实问题我都答出来了,而且面试官说是对的,然后我被挂了,我觉得是我不会写SQL的缘故hhhhh


#实习##面经##数据开发工程师##阿里巴巴#
全部评论
智力题第一题小时候遇到过,假设只有一匹病马,那么那个主人第一天看到的就是没有病马于是推断自己的就是病马 假设有两匹病马,则病马的主人就只会看到一匹,第一天之后没有枪响(枪响说明只有一匹)这说明病马不止一匹,于是意识到自己家的是病马 以此类推,三匹第三天,四匹第四天,……
3 回复 分享
发布于 2021-04-13 04:20
这两道智力题是怎么回答的?我想知道答案😂
点赞 回复 分享
发布于 2021-04-11 23:40
第二题你可以换一种思路,每个班有十个人,你想你是你们班的第一名,那你同时也是三个班的第一名的概率是多少。
点赞 回复 分享
发布于 2022-02-02 07:17

相关推荐

01-20 22:47
四川大学 Java
点赞 评论 收藏
分享
断电再接线:1. 简历排版方面,你这内容比较少,一页放完。各模块之间建议用明显的分隔线分开,现在一眼看上去非常乱。教育经历留白太多。项目经历格式不统一。 2. 第一个项目,硬件设计太笼统,硬件架构规划是指板级电路设计还是FPGA逻辑设计?FPGA时序逻辑设计具体指的什么?实现的三个低速协议以及使用协议进行控制时序,是指什么? 3. 第二个项目,我觉得你可以和第一个项目整合一下,合并为一个项目。第二个项目说实话随便买个zynq开发板都有一直petalinux的教程,作为一个独立的项目不合适的,更像是一个小作业。 4. 第三个项目,项目内容这里,其实和环境搭建之类的东西提一嘴就好了,环境准备和编译安装工具链这种东西没多大必要写,实在要写的话可以 说 使用docker 独立sdk环境之类的。你说的这个工具我没用过,我用的比较多的是busybox和buildroot,是基于menuconfig进行配置的,如果scratch也是类似的模式的话,那我觉得这个项目也经不起细推。你可以往内核裁剪那方向靠,我说的这两个工具你也可以看看。 5. 你熟悉这些接口时序的话,你可以进一步去看一下驱动开发,然后面试的时候突出这个作为重点。第三个项目也可以将驱动开发给补充进去。因为单编内核和构建文件系统,其实很多时候是体力劳动。 6. 特长这里,独立成一个荣誉奖项的模块,把你获得的奖学金和竞赛奖项放一起。数模的话,写了国赛,美赛就不用写了。 7. 总的来说可以了,你简历上写的东西你只要都熟悉,找个实习还是没问题的。 8. 嵌入式分为硬件,底层软件和应用软件,看你的经历我建议你往底层靠,多去熟悉常用的通信接口,去看内核和驱动,网络编程这块也可以去了解一下。然后去**刷刷hot100
点赞 评论 收藏
分享
评论
5
25
分享

创作者周榜

更多
牛客网
牛客企业服务