ma1
TCP最主要的特点:
(1) 1)TCP是面向连接的运输层协议。应用进程之间的通信像“打电话”:通话前要先拨号建立连接,通话结束后要挂机释放链接。(A选项,面向连接)
(2) 2)每一条TCP连接只能有两个端点(endpoint),点对点。(B选项,TCP只能提供点对点,不提供多播)
(3) 3)TCP提供可靠交付的服务。无差错、不丢失、不重复,并且按序到达。(C选项)(D选项,TCP提供的是可靠交付,所以TCP首部开销会大;UDP协议只是尽最大努力交付,UDP的首部开销小)
(4) 4)TCP提供全双工通信。双向通信.
(5) 5)面向字节流。“面向字节流“的含义是:虽然应用程序和TCP的交互是一次一个数据块(大小不等),但TCP把应用程序交下来 的数据仅仅看成是一连串的无结构的字节流 。TCP并不知道所传送的字节流的含义。
增量模型融合了瀑布模型的基本成分(重复应用)和原型实现的迭代特征,该模型采用随着日程时间的进展而交错的线性序列,每一个线性序列产生软件的一个可发布的“增量”。在增量模型中,软件被作为一系列的增量构件来设计、实现、集成和测试、每一个构件是由多种相互作用的模块所形成的提供特定功能的代码片段构成。当使用增量模型时,第1个增量往往是核心的产品,即第1个增量实现了基本的需求(C错误,是属于未开发的),但很多补充的特征还没有发布。客户对每一个增量的使用和评估都作为下一个增量发布的新特征和功能,这个过程在每一个增量发布后不断重复(A错误,具有不可回溯性),直到产生了最终的完善产品。增量迭代是RUP统一过程,RUP强调的每次迭代都包含了需求,设计和开发,测试等各个过程,而且每次迭代完成后都是一 个可以交付的原型.迭代不是并行,在每次迭代过程中仍然要遵循需求->设计->开发的瀑布过程.迭代周期的长度跟项目的周期和规模有很大的关 系.(D 错误)
export: 设置环境变量
echo:查看是否成功
env:显示所有的环境变量
set:显示所有本地定义的Shell变量
unset:清除环境变量
数据库事务四大特性:
1、原子性(Atomicity)
原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚,因此事务的操作如果成功就必须要完全应用到数据库,如果操作失败则不能对数据库有任何影响。
2、 一致性(Consistency)
一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。
拿转账来说,假设用户A和用户B两者的钱加起来一共是5000,那么不管A和B之间如何转账,转几次账,事务结束后两个用户的钱相加起来应该还得是5000,这就是事务的一致性。
3、隔离性(Isolation)
隔离性是当多个用户并发访问数据库时,比如操作同一张表时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个并发事务之间要相互隔离。
即要达到这么一种效果:对于任意两个并发的事务T1和T2,在事务T1看来,T2要么在T1开始之前就已经结束,要么在T1结束之后才开始,这样每个事务都感觉不到有其他事务在并发地执行。
4、持久性(Durability)
持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作
索引的特点:
创建索引的好处
(1)通过创建索引,可以在查询的过程中,提高系统的性能
(2)通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性
(3)在使用分组和排序子句进行数据检索时,可以减少查询中分组和排序的时间
创建索引的坏处
(1)创建索引和维护索引要耗费时间,而且时间随着数据量的增加而增大
(2)索引需要占用物理空间,如果要建立聚簇索引,所需要的空间会更大
(3)在对表中的数据进行增加删除和修改时需要耗费较多的时间,因为索引也要动态地维护
关于python中的复数:
1.表示复数的语法是real + image j
2.实部和虚部都是浮点数
3.虚部的后缀可以是 “j” 或者 “J”
4.复数的 conjugate 方法可以返回该复数的共轭复数。
A. Linux touch命令用于修改文件或者目录的时间属性,包括存取时间和更改时间。若文件不存在,系统会建立一个新的文件。
B 不知道
C. 在shell中 '>' 为创建, '>>' 为追加。当文件不存在时,'>'与‘>>’都会默认创建。
D. echo 是一个Shell内建命令,用来在终端输出字符串,并在最后默认加上换行符。单引号包围的字符串中不能解析变量。
linux的逻辑判断
-a,与
-o,或
|,非
Linux/Unix 的文件调用权限分为三级 : 文件拥有者、群组、其他。利用 chmod 可以藉以控制文件如何被他人所调用。
r 表示可读取,w 表示可写入,x 表示可执行,X 表示只有当该文件是个子目录或者该文件已经被设定过为可执行。
数字分别表示User、Group、及Other的权限。
r=4,w=2,x=1
若要rwx属性则4+2+1=7;
若要rw-属性则4+2=6;
若要r-x属性则4+1=5。
判别式模型举例:要确定一个羊是山羊还是绵羊,用判别模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。(logistic回归,>0.5为正例,否则,为反例)
生成式模型举例:利用生成模型是根据山羊的特征首先学习出一个山羊的模型,然后根据绵羊的特征学习出一个绵羊的模型,然后从这只羊中提取特征,放到山羊模型中看概率是多少,在放到绵羊模型中看概率是多少,哪个大就是哪个。(朴素贝叶斯分类就是这样)
常见的模型大多是判别模型,生成模型有:朴素贝叶斯(需要求联合概率分布),隐马尔科夫HMM,高斯混合模型GMM,LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型。
UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节
当使用梯度下降法寻求最优解时,很有可能走“之字型”路线(垂直等高线走),从而导致需要迭代很多次才能收敛;在梯度下降进行求解时能较快的收敛。
所以,使用梯度下降法求解最优解的模型,归一化就非常重要!knn,logistc回归,gbdt,xgboost,adaboost
还有一些模型是基于距离的,所以量纲对模型影响较大,就需要归一化数据,处理特征之间的权重问题,这样可以提高计算精度。比如,knn,svm,kmeans,k近邻,主成分分析;
神经网络对数据分布本无要求,但归一化可以加快训练数据;
那么不需要归一化处理的模型,决策树,随机森林。他们因为它们不关心变量的值,而是关心变量的分布和变量之间的条件概率
从使用技术上来分,可以分为四种类型:基于距离的分类方法、决策树分类方法、贝叶斯分类方法和规则归纳方法。基于距离的分类方法主要有最邻近方法;决策树方法有ID3、C4.5、VFDT等;贝叶斯方法包括朴素贝叶斯方法和EM算法;规则归纳方法包括AQ算法、CN2算法和FOIL算法。
6. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?( A)
A. 探索性数据分析
B. 建模描述
C. 预测建模
D. 寻找模式和规则
7. 为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务? (B)
A. 探索性数据分析
B. 建模描述
C. 预测建模
D. 寻找模式和规则
8. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的
哪一类任务?(C)
A. 根据内容检索
B. 建模描述
C. 预测建模
D. 寻找模式和规则
9. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任
务?(A)
A. 根据内容检索
B. 建模描述
C. 预测建模
D. 寻找模式和规则
基本的运算和表达式包括有:算术,关系,逻辑)运算,优先级别是算术>关系>逻辑
其中关系运算是用来比较两个数据大小,结果是逻辑值(true,false)
而字符串之间的比较,优先判断大小(它是先比较对应字符的大小(ASCII码顺序)
,然后前面都相同了,再看长度了
比较的时候,从字符串左边开始,一次比较每个字符,直接出现差异、或者其中一个串结束为止。
比如ABC与ACDE比较,第一个字符相同,继续比较第二个字符,由于第二个字符是后面一个串大,所以不再继续比较,结果就是后面个串大。
再如ABC与ABC123比较,比较三个字符后第一个串结束,所以就是后面一个串大。
所以,长度不能直接决定大小,字符串的大小是由左边开始最前面的字符决定的。
而对于本题字符串”ABCD”和字符串”DCBA”进行比较,先比较最左边的,字母A比字母Z要小,并按A到Z顺序递增,A小于D,事实也是,就不再看后面的比较了,结果是真。
A”为65;“a”为97;“0”为48;
第一步:函数运算; ——————————————————————第二步:算术运算:指数(^)→ 取负(-)→ 乘浮点除(*、/)→ 整除(\)→ 取模(Mod)→ 加、减(+、-)→ 连接(&); ——————————————————————第三步:关系运算:等于(=)→不等于(!=)→小于(<)→大于(>)→ 小于等于(≤)→大于等于(≥)→Like→Is; ——————————————————————第四步:逻辑运算:Not→And→Or→Xor→Eqv(等价)→Imp(蕴含)
美团营收渠道:广告费-商家服务费 交易提成-合作费
1、麦子取数:首先评估业务部门的需求,涉及到客户敏感信息的取数需求需要先走一下审批
确认是否是必须的 然后评估完成难度 给出完成的时间 然后进行取数
举例 比如给定一批用户 获取他们最近的投资信息 登录信息等
2、麦子报表:
sql中on和where的区别:先由on过滤出一张临时表,再由条件where进行过滤
inner join时两者一样 left join时on后面的条件只对右表有效 必须返回左表
right join时on后面的条件只对左表有效 必须返回右表
B-树(B树) 平衡多叉树
红黑树 平衡二叉查找树:
性质1. 节点是红色或黑色。
性质2. 根节点是黑色。
性质3. 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
性质4. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。