喜马拉雅笔试题目[回忆版]
1、linux 中grep的作用:全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
2、 more命令是一个基于vi编辑器文本过滤器,它以全屏幕的方式按页显示文本文件的内容,支持vi中的关键字定位***作。
3、删除行的***作
dd 删除一行
d$ 删除以当前字符开始的一行字符
ndd 删除以当前行开始的n行
dw 删除以当前字符开始的一个字
ndw 删除以当前字符开始的n个字
D 与d$同义
4、功能:删除文件或目录
rm xx 删除某一个文件
rm -f xx 删除时候不进行提示,可以于r参数配合使用
rm -rf xx 删除当前目录下叫xx的整个目录
5、mysql中 is null 和 = null 的区别
数据库中null 表示不可知,不确定,所以判断都用字段is null 进行判断,而=null <> null的判断结果任然是不可知,不确定,所以不会返回任何结果,即返回的结果为false.
当数据库中存在确切的值的时候用=null,当表进行连接查询时,某些因为连接没有的值得到null,要用is null去查询。
6、关于python中元祖的***作:
注:元祖是不能直接进行赋值的。
7、TCP的三次握手机制
8、关于蓝绿车的问题:
有一天晚上一辆出租车肇事逃逸了,一个目击者认出那辆车的颜色是蓝色的。已知所在城市有两个出租车公司,一个公司的出租车是绿色的,另一个公司的出租车是蓝色的。绿出租车公司拥有85%的出租车,蓝出租车公司拥有15%的出租车。经测试表明:该目击者可正确辨认车是蓝色的概率是80%,不能正确辩认的概率是20%。问肇事车辆是蓝色而不是绿色的概率是多少?
设:A1表示”出租车是绿的”,A2表示“出租车是蓝的”,B表示“目击者认为是蓝车”
则:
9、随机森林、GBDT和逻辑回归理解与对比
随机森林
随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。
GBDT:
GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。
分类树的结果显然是没办法累加的,所以GBDT中的树都是回归树,不是分类树,这点对理解GBDT相当重要(尽管GBDT调整后也可用于分类但不代表GBDT的树是分类树)。
逻辑回归:
线性回归假设特征和结果满足线性关系。其实线性关系的表达能力非常强大,每个特征对结果的影响强弱可以由前面的参数体现,而且每个特征变量可以首先映射到一个函数,然后再参与线性计算。这样就可以表达特征与结果之间的非线性关系。
logistic回归本质上是线性回归,只是在特征到结果的映射中加入了一层函数映射,即先把特征线性求和,然后使用函数g(z)将最为假设函数来预测。g(z)可以将连续值映射到0和1上。
#笔试题目#