2019-08-09 22:08 门头沟学院前端工程师

关注

商铺数据的清洗

商铺数据的清洗

2019/8/9

#项目描述：将爬取下来的数据进行清洗，删除无效数据。

def c_comment(s):
    if "条" in s:
        return float(s.split("条")[0])
    else:
        return "缺失数据"

def c_price(s):
    if "￥" in s:
        return s.split("￥")[1]
    else:
        return "缺失数据"

def c_commentlist(s):
    st1 = s.split("                                ")
    if len(st1) == 3:
        a = float(st1[0][2:5])
        b = float(st1[1][2:5])
        c = float(st1[2][2:5])
        return ([a,b,c])
    else:
        return "缺失数据"

f = open("F:\\360MoveData\\Users\\20122\\Desktop\\商铺数据.csv","r",encoding="utf8")
data = []
n = 0 # 清洗后的总条数
f.seek(0)
for line in f.readlines()[1:]:
    st1 = line.split(",")
    classify = st1[0]
    name = st1[1]
    comment_num = c_comment(st1[2])
    star = st1[3]
    price_num = c_price(st1[4])
    address = st1[5]
    commentlist_kouwei = c_commentlist(st1[-1])[0]
    commentlist_huanjing = c_commentlist(st1[-1])[1]
    commentlist_fuwu = c_commentlist(st1[-1])[2]
    if "数据缺失" not in line:
        data_lst1 = [["classify",classify],
                     ["name",name],
                     ["comment_num",comment_num],
                     ["star",star],
                     ["price_num",price_num],
                     ["address",address],
                     ["commentlist_kouwei",commentlist_kouwei],
                     ["commentlist_huanjing",commentlist_huanjing],
                     ["commentlist_fuwu",commentlist_fuwu]]
        data.append(dict(data_lst1))
        n +=1
    else:
        continue
print(data)
print("成功加载%i条数据" %n)

import pickle
pic = open("F:\\360MoveData\\Users\\20122\\Desktop\\商铺数据1.pkl","wb")
pickle.dump(data,pic)
f.close()

总结：
1、通过函数的定义，将那些数据清洗的方法进行包装，方便代码的阅读。
2、记得在每次在打开文件后要将文件关闭。
3、记得将清洗后的数据保存为.pkl的格式。
要清晰的数据.scv的截图。
图片说明
清洗后的截图：

全部评论

推荐最新楼层

昨天 11:28

浙江大学算法工程师

末流本科华为OD：6个月GAP期，Python开发岗通关全攻略

个人情况广州大学计算机科学与技术（末985），毕业后无计算机相关经验，GAP 6个月（用于系统学习Python）。2025年3月开始专攻Python全栈开发（Django/Flask + Pandas + 算法），8月通过华为OD机考（Python开发岗），技术面通过，11月入职。整个流程3个月（比常规长，因GAP期学习效率低），但最终拿下Offer，核心是精准避坑+高效准备。🔥 对接HR避坑指南：血泪教训只认官方外包HR，拒接“内部推荐”“第一次面试时，一个自称‘华为HR’的微信加我，要求先交200元‘培训费’。最后发现是黑中介！现在只对接德科/科锐的官方HR，他们全程走正规流程。”身份证...

点赞评论收藏

分享

02-21 10:58

已编辑

门头沟学院 C++

博雷顿科技股份公司 C++ 一面复盘

1. 自我介绍我之前在某某公司实习，主要参与 C++ 后端相关开发工作。 实习期间参与消息处理和服务端模块开发，涉及功能迭代、问题排查和性能优化。 技术栈以 C/C++ 为主，熟悉 STL、Linux 多线程和网络编程（TCP/IP），了解 MySQL、Redis 组件。 整体偏工程实践，关注代码质量、稳定性及性能优化，期待在 C++ 后端方向继续提升2. 项目介绍我参与开发了一个分布式实时流处理平台，负责事件数据的实时计算和多维聚合。项目难点在于高并发写入时线程锁竞争严重，导致延迟不稳定；同时状态同步复杂，内存容易泄漏。我主要通过以下方式解决了问题： 用无锁队列替代传统锁，减少线程竞争。 设...

查看15道真题和解析

点赞评论收藏

分享

02-27 22:04

广东工业大学 Java

美团测开->腾讯后端，感谢那个不愿放弃的自我

现在是2026.2.27，距离我2025.8.16在boss上投出第一份简历以来已经过去了半年多时间了。可能许多牛友对我并不陌生，在去年的89月份，深陷实习焦虑的我不停的在牛客上发帖求助，改过的简历不知道发了多少次。因为双非本的缘故，在实习这条路上可谓是处处碰壁。boss上四位数的沟通只换来两位数的回复，好不容易约到的面试很多还因为各种原因被挂。最终在9月底遇到了我实习过程中的第一个贵人：美团实习的ld。尽管那是个测开岗，但是没有关注我实际的技术栈，而是用专业的提问让我感受到了前所未有的面试体验，发掘了自己的技术闪光点。最终让我决定放弃了另一家中小厂的后端。他们非常尊重我对开发学习的热情，也给足了我自由发挥的空间，如果不是他们让我深度参与的用例生成项目，我或许连接到后面面试的机会都没有。尽管岗位不是开发，但这个过程中对大厂工作流程的深度参与以及对业务，项目，和技术的思维提升对我后续的开发面试一样提供了巨大的帮助。时代的洪流让我们每个人都被迫卷入其中，错过了互联网的红利时期，无论实习还是秋招都令不同背景的同学倍感压力，尽管如此我们依旧要相信：努力定有回报最后祝各位27的兄弟姐妹们，在暑期实习的面试路上一路披荆斩棘，策马扬鞭，用梦中情司的offer回应自己一直以来不愿放弃的拼搏timeline：2.6一面2.11 二面2.12 三面 当天转hr面2.26 hr面，面完云证+录用评估2.27 offer

点赞评论收藏

分享

02-24 14:50

广东工业大学 Java

28届后端157沟通9投递0约面，简历出什么问题了么？

😭求锐评😭找不到实习好伤心

点赞评论收藏

分享

02-27 13:37

安克创新 Anker_软件开发-业务运维(准入职员工)

安克创新内推，安克创新内推码

（已offer）‖安克创新春招四轮面经分享timeline：5.8一面—5.10二面—5.11三面—5.17终面—5.19offer call—5.21谈薪 ps：终面本来是5月14号，后面因为大老板的时间冲突改到了5月17号，整体面试节奏较快 —————————————— 每个面试官都有自己不同的面试方法和提问偏好，但往往都是结合简历和经历进行提问，所以我只分享一些在安克面试准备时用到的通用方法论，以及穿插一些在面试中被问到的问题 面试准备核心围绕两个逻辑展开，即回答“why you&why anker”两个问题 拆解来看可以分为企业了解、经历复盘、行为面准备三个板块 -简历深挖：把...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# xx岗简历求拷打 #

27775次浏览 232人参与

# 我的求职精神状态 #

435060次浏览 3094人参与

# 你最讨厌面试被问什么 #

16505次浏览 178人参与

# 应届生，你找到工作了吗 #

112987次浏览 687人参与

# 有转正机会的小厂实习值得去吗？ #

15223次浏览 137人参与

# 工作丧失热情的瞬间 #

363423次浏览 2552人参与

# 工作两年想退休了 #

252306次浏览 2034人参与

# 牛友的志愿填报指南 #

51661次浏览 286人参与

# 业务面应该做哪些准备 #

97149次浏览 1075人参与

# 实习最晚的一次下班是几点 #

26854次浏览 134人参与

# 听劝，这个简历怎么改 #

385450次浏览 1840人参与

# 实习的你做了哪些离谱的工作 #

31418次浏览 234人参与

# 开工第一帖 #

81615次浏览 1339人参与

# 我和xx公司的爱恨情仇 #

54230次浏览 332人参与

# 你找工作的时候用AI吗？ #

179778次浏览 923人参与

# 当你问AI“你会取代我的工作吗”，它说_？ #

24178次浏览 281人参与

# 今年形式下双非本找得到工作吗 #

289544次浏览 1653人参与

# 打工人的精神状态 #

138168次浏览 1509人参与

# 掌握什么AI技能，会为你的求职大大加分 #

17719次浏览 626人参与

# 你怎么看待AI面试 #

154493次浏览 824人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务