小水滴真的是太可爱了吧

2020-09-22 20:26 门头沟学院产品经理

关注

【机器学习笔记day17】3.5. 逻辑回归算法案例分析+良／恶性乳腺癌肿瘤预测

文章目录

3.5. 逻辑回归算法案例分析
逻辑回归算法案例分析
- 良／恶性乳腺癌肿瘤预测

3.5. 逻辑回归算法案例分析

逻辑回归算法案例分析

良／恶性乳腺癌肿瘤预测

原始数据的下载地址为：https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

数据预处理

import pandas as pd
import numpy as np

# 根据官方数据构建类别
column_names = ['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class'],

data = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/',names = column_names)

# 将？替换成标准缺失值表示
data = data.replace(to_replace='?',value = np.nan)

# 丢弃带有缺失值的数据（只要一个维度有缺失）
data = data.dropna(how='any')

data.shape

处理的缺失值后的样本共有683条，特征包括细胞厚度、细胞大小、形状等九个维度

准备训练测试数据

from sklearn.cross_validation import train_test_split

X_train,X_test,y_train,y_test = train_test_split(data[column_names[1:10]],data[column_names[10]],test_size=0.25,random_state=42)

# 查看训练和测试样本的数量和类别分布
y_train.value_counts()

y_test.value_counts()

使用逻辑回归进行良／恶性肿瘤预测任务

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression


# 标准化数据，保证每个维度的特征数据方差为1，均值为0。使得预测结果不会被某些维度过大的特征值而主导
ss = StandardScaler()

X_train = ss.fit_transform(X_train)
X_test = ss.transform(X_test)

# 初始化 LogisticRegression

lr = LogisticRegression(C=1.0, penalty='l1', tol=0.01)

# 跳用LogisticRegression中的fit函数／模块来训练模型参数
lr.fit(X_train,y_train)

lr_y_predict = lr.predict(X_test)

性能分析

from sklearn.metrics import classification_report

# 利用逻辑斯蒂回归自带的评分函数score获得模型在测试集上的准确定结果
print '精确率为：',lr.score(X_test,y_test)

print classification_report(y_test,lr_y_predict,target_names = ['Benign','Maligant'])

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

12-01 21:30

酷狗实习体验

先说说福利待遇吧，本科生一天120元，研究生150元，听起来不算多，但酷狗的隐形福利不少，每天早上9:50之前到公司可以领免费的早餐，先到先得。中午有20元的餐补，晚上7:30下班还有30元的补贴，晚上9:30之后能拿免费的夜宵。而且每天都有下午茶，水果和鸡蛋是标配，偶尔还有肯德基、麦当劳的甜点。午休时间是强制关灯的，椅子能放平。同事之间的关系也很随意，沟通起来没压力。楼下还有个小凉亭，午餐时我常常和实习伙伴在那儿吃饭，聊聊天。工作氛围也不错，我所在的组团队氛围很好，虽然老板有点严厉，但他对实习生还算宽容，其他同事都很友好，不会把脏活累活推给你。带我的姐姐还让我独立负责一些项目。

彳亍云力：转人工

点赞评论收藏

分享

11-29 17:00

大连理工大学机械设计/制造

西门子-机械工程师-ai面试

面试分三个部分：个人基本信息（打字的）、6道面试题（说的）、心理健康测试 6道面试题是： 1. 曾经遇到的一个复杂问题以及怎么解决的它？大概思路就是讲个项目中遇到的困难以及通过合理沟通解决 2.描述一次通过沟通，使最开始被误解或拒绝到被对方认可和支持的例子。 3. 描述一个遇到困难，通过积极学习获取进步的例子，什么困难以及最后的结果是什么 4. 大学生活中感到压力和困难的时候，怎么解决的，最后的结果是什么 5. 大学有没有参加过学生活动/志愿者，都做了什么 然后AI有个追问：根据上个问题提到的组织活动，当时怎么组织的，如何调动组员们的积极性，最后达到了什么效果。 6. 英文回答：为什么想要加入...

查看6道真题和解析

点赞评论收藏

分享

10-20 14:11

中国地质大学（武汉）产品经理

今天终于是我发感谢信了

简历已读不回，女朋友也是已读不回，算了，总不能方方面面都当小丑吧，让我也发份感谢信吧！#你都收到了哪些公司的感谢信？#

ccgugu：抱抱兄弟，感觉这种聊天氛围好窒息啊，祝福遇到更好的另一半！！

你都收到了哪些公司的感谢信？

点赞评论收藏

分享

11-14 17:25

门头沟学院数字IC前端设计

华为 这是保温吗

球球别再泡了：坏，我单9要了14

点赞评论收藏

分享

11-28 22:51

北京科技大学自动化

现在公职岗位性价比很好了

真的值得搏一搏，比考研有用的多，当然竞争也比考研激烈，但是珠三角 长三角的公职单位待遇福利性价比真高，旱涝保收无裁员，没有35岁下岗烦恼，棒棒棒！

牛客在线求职答疑中心牛客解忧铺

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 25届秋招总结 #

465315次浏览 4772人参与

# 晒一晒我的offer #

10032731次浏览 106380人参与

# 地方国企笔面经互助 #

8763次浏览 19人参与

# 如何排解工作中的焦虑 #

73696次浏览 1046人参与

# 同bg的你秋招战况如何？ #

90801次浏览 691人参与

# 找工作时遇到的神仙HR #

568748次浏览 3888人参与

# 实习，投递多份简历没人回复怎么办 #

2465715次浏览 34934人参与

# 虾皮求职进展汇总 #

131346次浏览 954人参与

# 你上一次加班是什么时候？ #

23268次浏览 186人参与

# 你投了多少份简历了？ #

68522次浏览 817人参与

# 提前批简历挂麻了怎么办 #

150975次浏览 1988人参与

# 面试被问第一学历差时该怎么回答 #

80343次浏览 516人参与

# 现在还是0offer，延毕还是备考 #

828313次浏览 6930人参与

# 大疆求职进展汇总 #

421282次浏览 2970人参与

# 比亚迪工作体验 #

45609次浏览 215人参与

# 来聊聊你目前的求职进展 #

522072次浏览 6228人参与

# 什么专业适合考公 #

15276次浏览 118人参与

# 总结:哪家公司面试体验感最好 #

20597次浏览 94人参与

# 如果公司给你放一天假，你会怎么度过？ #

5123次浏览 65人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

149231次浏览 1659人参与

牛客网
牛客企业服务