小水滴真的是太可爱了吧

2020-09-22 21:53 已编辑门头沟学院产品经理

关注

【数据分析学习笔记day20】实战案例：全球食品数据分析

文章目录

- 全球食品数据分析

全球食品数据分析

项目参考：https://www.kaggle.com/bhouwens/d/openfoodfacts/world-food-facts/how-much-sugar-do-we-eat/discussion

# -*- coding : utf-8 -*-

# 处理zip压缩文件
import zipfile
import os
import pandas as pd
import matplotlib.pyplot as plt


def unzip(zip_filepath, dest_path):
    """ 解压zip文件 """
    with zipfile.ZipFile(zip_filepath) as zf:
        zf.extractall(path=dest_path)


def get_dataset_filename(zip_filepath):
    """ 获取数据集文件名 """
    with zipfile.ZipFile(zip_filepath) as zf:
        return zf.namelist()[0]


def run_main():
    """ 主函数 """
    # 声明变量
    dataset_path = './data'  # 数据集路径
    zip_filename = 'open-food-facts.zip'  # zip文件名
    zip_filepath = os.path.join(dataset_path, zip_filename)  # zip文件路径
    dataset_filename = get_dataset_filename(zip_filepath)  # 数据集文件名（在zip中）
    dataset_filepath = os.path.join(dataset_path, dataset_filename)  # 数据集文件路径

    print('解压zip...', end='')
    unzip(zip_filepath, dataset_path)
    print('完成.')

    # 读取数据
    data = pd.read_csv(dataset_filepath, usecols=['countries_en', 'additives_n'])

    # 分析各国家食物中的食品添加剂种类个数
    # 1. 数据清理
    # 去除缺失数据
    data = data.dropna()    # 或者data.dropna(inplace=True)

    # 将国家名称转换为小写
    # 课后练习：经过观察发现'countries_en'中的数值不是单独的国家名称，
    # 有的是多个国家名称用逗号隔开，如 Albania,Belgium,France,Germany,Italy,Netherlands,Spain
    # 正确的统计应该是将这些值拆开成多个行记录，然后进行分组统计
    data['countries_en'] = data['countries_en'].str.lower()

    # 2. 数据分组统计
    country_additives = data['additives_n'].groupby(data['countries_en']).mean()

    # 3. 按值从大到小排序
    result = country_additives.sort_values(ascending=False)

    # 4. pandas可视化top10
    result.iloc[:10].plot.bar()
    plt.show()

    # 5. 保存处理结果
    result.to_csv('./country_additives.csv')

    # 删除解压数据，清理空间
    if os.path.exists(dataset_filepath):
        os.remove(dataset_filepath)

if __name__ == '__main__':
    run_main()

全部评论

推荐最新楼层

11-17 21:35

青岛理工大学供应链其他

希音上班的真实体验

先说说工作强度吧，这里的节奏真快。我在分拣岗位，基本上从上班开始就没停过。再说薪资，希音的待遇还是挺吸引人的，收入相当可观，我身边不少同事每个月都能过万。而且福利也不错，有餐补和高温补贴，工资发放也很准时。工作环境方面，仓库整体挺整洁有序的，设备也比较先进，工作起来很方便。宿舍条件也还行，虽然是多人间，但有空调、洗衣机、热水器，基本生活需求都能满足。团队氛围方面，我的团队都是年轻人，有活力。大家互相帮助，遇到问题一起讨论解决。偶尔有小摩擦，但大家都能很快化解，不会影响工作。在希音这段时间，我学到了很多，不仅是工作技能，还有对物流行业的深入了解。公司定期组织培训，让我们了解最新的行业动态，个人成...

SHEIN希音公司福利 25人发布

点赞评论收藏

分享

11-17 18:55

海口经济学院内容运营

23届往届生求帮看简历，想找运营工作

本人23届毕业生，学校背景不好民办本科，专业是旅游管理。由于本专业同学大多去往酒店、旅行社之类的，而我不想找本专业工作然后到现在还没有正式工作，想问问各位前辈我这个简历能找什么方向的运营工作，可以提一些建议吗？一开始了解到的运营岗位是看《从零开始做运营》这本书，但我发现这里面运营岗基本上是从开发出一款互联网产品才衍生出来的，比如内容运营、用户运营、活动运营和产品运营，但现在市面上运营工作名称好多压根不知道都是干什么的要怎么选择，真的不知道怎么下手，那我的问题是看我的背景和经历的话要怎么选择运营岗位呢，是不是旅游行业的运营会好进一些，还有我的简历需要怎么优化呢？职场小白真心求助

我想象的工作vs实际工作

点赞评论收藏

分享

不愿透露姓名的神秘牛友

09-30 19:49

汇川又开始骂人了

起名星人：蛮离谱的，直接要求转投销售

投递汇川技术等公司10个岗位

点赞评论收藏

分享

昨天 16:15

武汉工程大学数值策划

职场中的“知心大姐姐”陷阱

刚踏入职场的小伙伴们，可能会遇到一些看起来特别温暖、善良、贴心的同事，尤其是那些总是愿意倾听你心事的“知心大姐姐”。她们会让你觉得职场也可以像家一样温暖，但我要提醒你们，千万别轻易放下戒备。不要轻易交心我记得刚开始工作的时候，有一个同事特别热情，总是关心我，问我工作顺不顺利，生活上有没有什么困难。那时候我觉得她特别好，就什么都跟她说，工作上的烦恼、生活中的琐事，甚至连自己的小秘密也毫无保留地告诉她。结果没过多久，我发现她开始在一些场合用我说过的话来“指导”我，甚至有时候还会在领导面前提到我的一些弱点，让我特别尴尬。保持适度距离所以，大家在职场上一定要保持适度的距离。你可以和同事们友好相处，但不...

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

247775次浏览 2012人参与

# 学历or实习经历，哪个更重要 #

41080次浏览 299人参与

# 北方华创开奖 #

22786次浏览 259人参与

# 地方国企笔面经互助 #

2539次浏览 6人参与

# 你最想要的公司福利是？ #

39970次浏览 126人参与

# 选完offer后，你后悔学本专业吗 #

10433次浏览 75人参与

# 面试题刺客退退退 #

137141次浏览 2092人参与

# 国企/银行/研究所公司爆料 #

89720次浏览 412人参与

# 应届生被毁约被毁意向了怎么办 #

27133次浏览 238人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2894次浏览 35人参与

# 机械应届生薪资要多少才合适？ #

12390次浏览 60人参与

# 查收我的offer竞争力报告 #

16773次浏览 228人参与

# 校招入职后的感受 #

156938次浏览 1961人参与

# 你觉得第一学历对求职有影响吗？ #

14882次浏览 121人参与

# 没有实习经历，还有机会进大厂吗 #

805071次浏览 13814人参与

# 我的工作日记 #

21182次浏览 270人参与

# 不给转正的实习，你还去吗 #

1516959次浏览 16965人参与

# 寒假躺平还是提前实习 #

58429次浏览 438人参与

# 总结:哪家公司面试体验感最差 #

25747次浏览 129人参与

# 秋招OC许愿 #

226588次浏览 1871人参与

# 如何写一份好简历 #

602140次浏览 8441人参与

牛客网
牛客企业服务