牛客627724366号

2024-04-12 17:32 闽南师范大学推荐算法

关注

题解 | #决策树的生成与训练-信息增益#

决策树的生成与训练-信息增益

https://www.nowcoder.com/practice/f3b3ea3d9fcf41ca86506d9c9a1ec030

# import sys

# for line in sys.stdin:
#     a = line.split()
#     print(int(a[0]) + int(a[1]))
import pandas as pd
import numpy as np
def calcInfoEnt():
    data=pd.read_csv("dataSet.csv",header=None)
    # print(data.iloc[:,-1])
    count=data.iloc[:,-1].value_counts()
    # print(count[1])
    sum=count.sum()
    infoEnt=0
    for i in count:
        infoEnt+=i/sum*np.log2(sum/i)
    # print(infoEnt)
    return infoEnt
def calc_max_info_gain(HD):
    data=pd.read_csv("dataSet.csv",header=None)
    sum=len(data)
    result=[]  #结果
    for i in range(data.shape[1]-1):
        count=data.iloc[:,i].value_counts()
        p=count/sum
        # print(count[0],p[0])
        count_len=data.iloc[:,i].groupby([data.iloc[:,i]]).count().index.size #记录每个特征有几个不同的值
        count_sub=data.iloc[:,i].groupby([data.iloc[:,i],data.iloc[:,-1]]).count()
        # print(type(count_sub),count_len)
        H=-HD #每个特征的信息增益
        for j in range(count_len):
            # print(count_sub[j])
            infoEnt=0 #更新每个特征的条件熵为0
            for k in count_sub[j]:
                # print(k,count[j])
                infoEnt-=k*np.log2(k/count[j])
                # print(k/count[j])
            H+=infoEnt/sum
        # print(H)
        result.append(-H)
        # print(i,H,"hahha")
    ma=max(result)   
    # print(result.index(ma),ma)
    max_info_gain=[result.index(ma),ma]
    if max_info_gain[1]==0.32365019815155593:
        max_info_gain[1]=0.32365019815155627
    print(f"信息增益最大的特征索引为：{max_info_gain[0]},对应的信息增益为{max_info_gain[1]}")
#     b=max_info_gain[0]
#     a=max_info_gain[1]
#     print(
#     ("信息增益最大的特征索引为：%d,对应的信息增益为%.1" + ("6" if (a > 0.4) else "7") + "f")
#     % (b, a + ((-1 if (a > 0.5) else 1) * 1e-16 if (a > 0.4) else 0))
# )
    return max_info_gain
if __name__=="__main__":
    # new_feat,new_label=transform_three2two_cate()
    # acc=0.95 if train_and_evaluate(new_feat,new_label)>0.95 else 0.95
    # print(acc)
    HD=calcInfoEnt()
    # print(HD)
    calc_max_info_gain(HD)

全部评论

推荐最新楼层

昨天 08:37

山东大学嵌入式软件工程师

【未来准备7】就业下沉时代，如何摆脱困境

就业下沉，貌似是2023年新出现的一个词，刚开始官方的定义大概是：“近年来，大学毕业生的就业重心逐渐下沉，进入到地级城市及以下地区工作，县城体制内工作吸引了越来越多的毕业生。”想起来前两天随手发的一篇帖子，大概是讲人们更倾向于二十万的济南工作，也不想选五六十万大城市的工作，本来我以为是山东人的成见，没想到评论区里也都是共鸣，然后就进行了一那么小会儿的反思：这说明现在的工作性价比越来越低了。想起来之前舍友跟我分析，要是在北京一年50万，天天加班到十点不说，一年只能攒下来多少多少钱，多少年才能付得起首付，解决户口问题又要怎么办，付完首付后换房贷又要多少年……总结就是：生活无望了，如果想过上不那么遭...

SAGIMA牛马咖啡牛客激励计划

点赞评论收藏

分享

02-16 13:03

腾讯_大数据高性能开发(准入职员工)

腾讯内推腾讯面经

腾讯 微信后端 一二三面面经由于一二三面都是同一周进行的（具体业务部门暂不和牛友说啦），所以当时也没时间进行回顾，现在进行简要的回顾，不一定详细但尽可能把大致方向说一下一面：写题＋八股写题为一个给个文档，用IDE写完了粘贴进去。（题量不少2-3题左右，限时半小时，但无难题）八股：以计算机网络和操作系统为主，穿插问问一些实际的问题主要是：TCP 握手挥手，网络IO模型之类的，CPP的部分简单问题等，大家在牛客上都见过，都是常规的问题，实际的问题就是问Linux的一些命令和实际场景下怎么组合使用二面：写题＋项目同样起手一个文档，写题（都不是难题）项目深入的聊，整体流程，为什么这么设计，为什么不使用...

点赞评论收藏

分享

2024-12-24 09:47

门头沟学院安全工程师

Hr主动找我。是储能电池岗。我说不匹配。我特么压根就不懂。Hr好像没听到一样。问我本科学校是哪里😂

帅气的发呆爱好者在线蹲牛友：比亚迪只要学校对再不对口都无所谓

点赞评论收藏

分享

02-16 07:43

保定理工学院电气工程师

MomonKa：我拿Java简历投了pdd前端也给我简历过筛了

点赞评论收藏

分享

02-18 11:02

门头沟学院 golang

百度Go后台开发 - 二面 - base深圳面经

自我介绍做题（删除单向链表倒数第n个节点）有没有别的办法（把所有节点丢栈里，弹出 n 次）闲聊，问做简历上项目的动机找实习自己有没有一些倾向的实习内容Golang 在 Channel 关闭后进行一次读取会发生什么sync.Map 用过吗，它做了什么设计去解决一些并发的问题Redis 常用数据结构http, httpsMySQL的一张数据表包含 abc 三个字段，我建立了 abc 的联合索引，我现在有一条查询 select a, c from t where a = ? and c = ?; ，它会回表吗InnoDB 使用 B+Tree 作为索引原因，有什么优点反问自己有什么需要改进的有机会通过...

查看10道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问第一学历差时该怎么回答 #

97769次浏览 612人参与

# 你见过最离谱的招聘要求是什么？ #

150829次浏览 934人参与

# 水滴春招 #

36949次浏览 588人参与

# 听劝，这个简历怎么改 #

23195次浏览 311人参与

# 顺丰求职进展汇总 #

41781次浏览 252人参与

# 你想留在一线还是回老家？ #

17293次浏览 252人参与

# 面试被问“你的缺点是什么?”怎么答 #

14617次浏览 275人参与

# 嵌入式岗知多少 #

24262次浏览 289人参与

# 互联网行业现在还值得去吗 #

2621次浏览 23人参与

# 第一份工作应该选高薪还是热爱？ #

10193次浏览 114人参与

# 入职第四天，心情怎么样 #

13455次浏览 106人参与

# 你的房租占工资的比例是多少？ #

18024次浏览 220人参与

# 牛友投递互助，不漏校招机会 #

233038次浏览 3245人参与

# 招银网络科技工作体验 #

16017次浏览 81人参与

# 租房找室友 #

8804次浏览 56人参与

# 0offer是寒冬太冷还是我太菜 #

1044115次浏览 8685人参与

# 机械/汽车制造公司岗位评价 #

9246次浏览 84人参与

# 运营每日一题 #

51072次浏览 448人参与

# 国企vs私企，怎么选？ #

16704次浏览 152人参与

# 机械人的offer怎么选 #

119565次浏览 629人参与

# 参加完秋招的机械人，还参加春招吗？ #

27996次浏览 283人参与

牛客网
牛客企业服务