数据分析之机器Python高频面试题及答案
Python
1.python讲自己用过的包的具体用法(滴滴)
参考答案
1.numpy,用来做多维数组的运算的,之前在xx项目中用numpy做一些数据运算的工作。
2.pandas,用来处理表格和复杂数据的,我主要用它在数据清洗这一步。3.matplotlib,用来数据可视化,在对处理好的数据我想简单看一下频数分布或者相关性之类的很轻松的可以画出图片。
4.sklearn,用户机器学习建模,在数据建模这部分用到,我经常用的模型有随机森林和xgb(引导面试官问这两者的区别)。
答案解析
用过的包+用途+用这个做了什么
参考答案
3.python去重(京东)
参考答案
1.set对list去重
2.groupby去重
3.distinct去重
4.介绍自己常用的语言,是否会用python(中银金科)
参考答案
在实习的过程中,主要使用的语言是sql和python,sql主要用于将数据从数据库中提取出来,如果数据量较小的话我就直接用excel处理,但是如果数据量较大的话我就要用python处理。平时除了用python做数据处理外,还会用python做一些可视化的图表和机器学习建模。
答案解析
数据分析常用的语言是sql和python
5.Python的list和numpy的array有什么区别(工商银行)
参考答案
1.list可以存放不同类型的数据,比如int、float和str,甚至布尔型;而一个numpy数组中存放的数据类型必须全部相同,例如int或float。
2.在索引方式上,numpy.array支持比list更多的索引方式。
7.52 Python-2
6.学Python多久(招联金融)
参考答案
python在我的实习中和项目中都是经常用的,在其中用python做数据处理、特征筛选、数据可视化和数据建模。能够熟练使用numpy、pandas、matliplot和sklearn包中的函数。
答案解析
考察python熟练程度
7.Python处理脚本都做过哪些东西呀(经纬恒润)
参考答案
我们要完成网上的实验安全考试。系统快关闭的时候辅导员通知我们必须完成并且必须在90分以上才通过。那时刚好学了点爬虫,然后就先把题库抓下来,保存到本地。然后模拟登录,进入考试,从本地题库里匹配答案,提交表单。然后用py2exe编译成exe可执行文件,出于学习与交流的目的,把程序发给班上的同学了。
8.会用R语言和python是吗?(快手)
参考答案
会的。在学校的xxx课程上,我们是用的R语言进行编程,并且大作业是需要用R语言完成xxx项目,在这门课中我也从一个R语言小白成长了一点。Python是我自己在课外学习的,并且在xx项目/实习中我用python来做数据处理和数据建模的工作,除此之外还会用python做一些可视化的图表。
答案解析
需要说自己会用的模块和使用的地方。
9.Python数据处理的常用函数(小米)
参考答案
数据处理主要用的就是pandas里面的函数。
去重:drop_duplicates()
填充缺失值:fillna()
处理某列:apply(), lambda函数
替换函数:replace()
10.python方面的读取json(美团)
参考答案
如果你要处理的是文件而不是字符串,你可以使用json.dump() 和 json.load()来编码和解码 JSON 数据。 例如: # 写入一个json数据 with open('data.json', 'w') as f:json.dump(data, f) ;with open('data.json', 'r') as f:data = json.load(f)
7.53 python-3
11.python题map一道(MobTech)
参考答案
map() 会根据提供的函数对指定序列做映射。map(function, iterable, ...)---function:函数;iterable:一个或多个序列
12.Python你常用的包有哪些?(字节跳动)
参考答案
numpy,用来做多维数组的运算的,之前在xx项目中用numpy做一些数据运算的工作。
pandas,用来处理表格和复杂数据的,我主要用它在数据清洗这一步。
3.matplotlib,用来数据可视化,在对处理好的数据我想简单看一下频数分布或者相关性之类的很轻松的可以画出图片。
4.sklearn,用户机器学习建模,在数据建模这部分用到,我经常用的模型有随机森林和xgb(引导面试官问这两者的区别)。
答案解析
用过的包+用途+用这个做了什么
13.工作中python会用到哪些?(作业帮)
参考答案
1.做大数据清洗工作,在xx的实习/项目过程中,我用python中的numpy和pandas完成了xx量级的数据清洗工作,也让我对这些函数的参数有了更全面的认识。
2.做数据建模工作,在xxx的项目中,我用sklearn中的xxx算法,完成了xxx,最后精度达到了xxx。
14.python:数组逆序输出(快手)