2021-10-25 17:03 已编辑滴滴_测试开发工程师

关注

基于基站定位数据的商圈分析

数据集链接: https://pan.baidu.com/s/1lYtcc2zlk07Cv9fnto99DA 提取码: sy92
去除冗余属性以及数据离差标准化

#-*- coding: utf-8 -*-
#数据标准化到[0,1]
import pandas as pd

#参数初始化
filename = 'D:/下载/data/input/business_circle.xls' #原始数据文件
standardizedfile = 'D:/下载/data/output/standardized.xls' #标准化后数据保存路径

data = pd.read_excel(filename, index_col = u'基站编号') #读取数据

data = (data - data.min())/(data.max() - data.min()) #离差标准化
data = data.reset_index()

data.to_excel(standardizedfile, index = False) #保存结果

模型构建并画出谱系聚类图

#-*- coding: utf-8 -*-
#谱系聚类图
import pandas as pd

#参数初始化
standardizedfile = 'D:/下载/data/input/standardized.xls' #标准化后的数据文件
data = pd.read_excel(standardizedfile, index_col = u'基站编号') #读取数据

import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage,dendrogram
#这里使用scipy的层次聚类函数

Z = linkage(data, method = 'ward', metric = 'euclidean') #谱系聚类图
P = dendrogram(Z, 0) #画谱系聚类图
plt.show()

采用层次聚类算法分析数据

#-*- coding: utf-8 -*-
#层次聚类算法
import pandas as pd

#参数初始化
standardizedfile = 'D:/下载/data/input/standardized.xls' #标准化后的数据文件
k = 3 #聚类数
data = pd.read_excel(standardizedfile, index_col = u'基站编号') #读取数据

from sklearn.cluster import AgglomerativeClustering #导入sklearn的层次聚类函数
model = AgglomerativeClustering(n_clusters = k, linkage = 'ward')
model.fit(data) #训练模型

#详细输出原始数据及其类别
r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1)  #详细输出每个样本对应的类别
r.columns = list(data.columns) + [u'聚类类别'] #重命名表头

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

style = ['ro-', 'go-', 'bo-']
xlabels = [u'工作日人均停留时间', u'凌晨人均停留时间', u'周末人均停留时间', u'日均人流量']
pic_output = 'D:/下载/data/output/type_' #聚类图文件名前缀

for i in range(k): #逐一作图，作出不同样式
  plt.figure()
  tmp = r[r[u'聚类类别'] == i].iloc[:,:4] #提取每一类
  for j in range(len(tmp)):
    plt.plot(range(1, 5), tmp.iloc[j], style[i])
  
  plt.xticks(range(1, 5), xlabels, rotation = 20) #坐标标签
  plt.title(u'商圈类别%s' %(i+1)) #我们计数习惯从1开始
  plt.subplots_adjust(bottom=0.15) #调整底部
  plt.savefig(u'%s%s.png' %(pic_output, i+1)) #保存图片

全部评论

推荐最新楼层

11-20 20:15

南方科技大学网页产品经理

移动公司秋招经验分享

请做一个自我介绍，简要说明你的背景和经历。你为什么选择申请中国移动这个岗位？你能接受被分配到区县基层工作几年吗？请说明理由。请谈谈你对网络协议的理解。你能解释一下通信原理的基本概念吗？在你的实习经历中，有没有遇到过困难？你是如何解决的？

查看6道真题和解析非技术面试记录

点赞评论收藏

分享

昨天 11:10

卓越里程_中台运营(准入职员工)

头部教育内推

国内头部教培25届秋招信息集合23-25届同学均可投递！目前大部分企业的秋招进入尾声，而教培行业仍有大量需求。教培老师的薪资待遇可观，offer率较高！在今年秋招难度上升的背景下，现阶段还未收获理想offer的同学们，欢迎投递，教培不失为性价比之选！学而思教育 综合年收入10~30万；每年2-6次涨薪，入职2~3年平均涨幅40%~50%全科类，素养类，竞赛类教师内推链接：https://app.mokahr.com/m/campus-recruitment/tal/148080?recommendCode=DS74UTFd&hash=%23%2Fjobs#/jobs内推码：DS74UT...

投递卓越教育等公司10个岗位 >

点赞评论收藏

分享

11-20 10:43

门头沟学院嵌入式软件开发

中石油的压迫感太强了

不愧是全球top的央企

整顿职场的柯基很威猛：这种不可怕，最可怕的是夹在一帮名校里的二本选手，人家才是最稳的。

点赞评论收藏

分享

10-30 13:45

南京理工大学 C++

幽默深信服

开出来仨瓜俩枣还要逼签

懂了哥：卓越雇主

点赞评论收藏

分享

11-24 11:40

北京城市学院项目经理

在拼多多工作的体验

首先，厕所简直是稀缺资源，建议直接去商场的厕所，省得在公司里排队。 工时也是个硬指标，基本上是11点到晚上8点，周日加班的话，薪水是单倍的，但请假多了，领导可就会找你谈话。工作强度大是常态，但这也算是变相实现8小时工作制吧。至于裁员，快满三年合同的员工，可能会被优先不续签，赔偿也就那样。 竞业协议也是个麻烦事，股票的竞业计算方式很麻烦，未行权的股票就只能放弃

拼多多集团-PDD工作强度 281人发布

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

310756次浏览 2834人参与

# 海康威视求职进展汇总 #

399601次浏览 3406人参与

# 阿里云管培生offer #

34151次浏览 413人参与

# 地方国企笔面经互助 #

4081次浏览 11人参与

# 学历or实习经历，哪个更重要 #

51988次浏览 412人参与

# 选完offer后，你后悔学本专业吗 #

20650次浏览 146人参与

# 百度开奖 #

170367次浏览 1063人参与

# 如何一边实习一边秋招 #

993265次浏览 12646人参与

# 正在实习的你，几点下班 #

52547次浏览 394人参与

# 米哈游求职进展汇总 #

176463次浏览 1460人参与

# 美的求职进展汇总 #

206874次浏览 1619人参与

# 2023毕业生求职有问必答 #

120796次浏览 1302人参与

# 国央企薪资爆料 #

9586次浏览 74人参与

# 投递实习岗位前的准备 #

1180448次浏览 18400人参与

# 机械制造秋招总结 #

30306次浏览 353人参与

# 机械制造面试记录 #

149572次浏览 1931人参与

# 求职遇到的搞笑事件 #

71111次浏览 577人参与

# 如果不工作真的会快乐吗 #

59888次浏览 525人参与

# 得物求职进展汇总 #

66706次浏览 684人参与

# 0offer是寒冬太冷还是我太菜 #

900206次浏览 8017人参与

# 腾讯求职进展汇总 #

196348次浏览 1645人参与

# 数据人offer决赛圈怎么选 #

117034次浏览 1468人参与

牛客网
牛客企业服务