20180904 携程 KL散度 和 单变量信息增益,求讨论




KL距离,两分布距离不一样长咋搞?
单变量信息增益是和决策树有关么。。。

#携程#
全部评论
信息增益直接计算两个类的概率,计算信息熵就可以了吧
点赞 回复 分享
发布于 2018-09-04 20:56
概率统计题,但是我也只过了66.67%
点赞 回复 分享
发布于 2018-09-04 20:56
KL也是一样的,计算每个类的概率,按照公式把每一类加起来就可以
点赞 回复 分享
发布于 2018-09-04 20:57
我感觉没有ac是因为精度问题,对于题目我觉得我的理解应该是对的
点赞 回复 分享
发布于 2018-09-04 20:57
膜拜中,已经慌得不行,感觉没理解题目。。
点赞 回复 分享
发布于 2018-09-04 20:59
三道题都是把公式打一遍
点赞 回复 分享
发布于 2018-09-04 21:00
不明白为什么KL散度一直是66.7%?大佬有知道为什么么的吗
点赞 回复 分享
发布于 2018-09-04 21:04
第一题信息熵稳定0%,劝退,第二题66.7%,第三题90%,选择随便选233
点赞 回复 分享
发布于 2018-09-04 21:08
第一题,信息增益代码 #include <bits/stdc++.h> #include <map> #include <math.h> using namespace std; typedef struct data{     int clas[2]; }data; int n; map<int,data> mp; int classify[2] = {0}; double cpt_entroy(int m[]){     int nu = m[0] + m[1];     double first = 0;     double second = 0;     if(m[0] != 0){         double tmp = 1.0 * m[0] / nu;         first = -1 * tmp * log(tmp) / log(2);     }     if(m[1] != 0){         double tmp = 1.0 * m[1] / nu;         second = -1 * tmp * log(tmp) / log(2);     }     double entroy = 1.0 * nu / n * (first + second);     return entroy; } int main() {     int a, b;     char indep;     cin >> n;     for(int i=0; i<n; ++i){         cin>>a>>indep>>b;         classify[b]++;         if(mp.find(a) == mp.end())             mp[a].clas[b] = 0;         mp[a].clas[b] += 1;     }     double gain_all = cpt_entroy(classify);     double ans = gain_all;     map<int, data>::iterator it;     for(it = mp.begin(); it != mp.end(); ++it) {         double pro = cpt_entroy(it->second.clas);         ans -= pro;     }     int dans = (ans + 0.005) * 100;     double res = double(dans) / 100;     printf("%.2f\n",res);     return 0; }
点赞 回复 分享
发布于 2018-09-05 09:22

相关推荐

深睿医疗算法实习生面经(凉经)是我的第一场面试,从没面过,也确实一直没做过分割,但是面试官一点我自己的项目都没有问😭😭😢😢感觉像是完全没看简历,干提问,并且好凶……最后已经绷不住了😭😭😭😭分类目标检测分割的区别,什么是语义分割和实例分割,什么是细粒度分割,回归性问题是什么,diffusion比gan好在哪里,pair的gan训练和不pair的gan有哪些模型,怎么加速diffusion训练和测试,cnn和transformer和diffusion有什么区别,分别举例模型,多头attantion会不会增加复杂度,会不会便难以训练,应该怎么训练的,解释pytorch和tensorflow的动态图和静态图是什么意思什么是影像组学,ctmri超声这些分别介绍,影响采集图像质量的原因有什么,python深拷贝和浅拷贝有什么区别,每种数据类型(int,dict,元祖等)用深拷贝还是浅拷贝,怎么用发散性问题:和医院合作做一个ct肿瘤分割项目,全流程计划编程问题:有两个表格,怎么从一个表格查询另一个表格是否存在这个数据,用一层循环哎其实都是很基础的问题,但是因为是第一个面试确实准备的太不充分了🥲给我吓鼠了。💩但是为什么不问我我的项目经历呢,我也不懂😱😱最后这个算法题说实话我没听懂他问的是啥,所以……最后他告诉我答案其实我也没听懂……emmmm……祝大家好运 #面经#深睿医疗&nbsp;&nbsp;&nbsp;#算法实习生#牛客AI配图神器#
查看15道真题和解析
点赞 评论 收藏
分享
02-18 15:03
已编辑
门头沟学院 算法工程师
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务