2023-01-31 16:14 未填写教育信息数据分析师发布于北京

关注

Python小案例（四）批量操作文件

Python小案例（四）批量操作文件

顾名思义，这次分享的内容是如何进行文件批处理操作。

批量生成文件

import os 
import pandas as pd
import random

下面代码的结果：在当前路径下新建batch_files文件夹，在该文件夹下批量生成三个日期的文件夹，每个日期文件夹里写入abcd四个txt文件，文件内容是随机的10个100以内的随机数。

dates = pd.date_range('2022-01-01','2022-01-03').strftime("%Y-%m-%d").to_list()
init_path = './batch_files/'

# 生成3个日期的文件
for i in dates:
    isExists = os.path.exists(init_path+str(i)) # 判断文件是否存在
    if not isExists:
        os.makedirs(init_path+str(i))
    else:
        continue

dirs = os.listdir(init_path)

for file in dirs:
    sub_path = os.path.join(init_path, file)
    if file.startswith("."): # mac生成的隐藏文件夹报错
        continue
    for cl in ['a', 'b', 'c', 'd']:
        if not os.path.exists(sub_path+'/'+cl+'.txt'):
            with open(sub_path+'/'+cl+'.txt', 'a') as f:
                seq = range(1, 100) # 生成1-100间的随机数
                for line in random.sample(seq, 10): # 任意取10个不同样本
                    f.write(str(line)+'\n')

批量操作文件

下面代码的结果：将上述batch_files里的文件内容全部写入df中

# 初始化空df
df_init = pd.DataFrame(columns=['nums', 'date', 'class', 'data_type'])

g = os.walk('./batch_files')  # 全部路径

for path,dir_list,file_list in g:  
    for file_name in file_list: # 获取文件名
        if file_name.endswith(".txt") and not file_name.endswith(".DS_Store.txt"):
            file_name_path = os.path.join(path, file_name) # 文件完整路径
            df = pd.read_csv(file_name_path, header=None)
            df['date'] = os.path.split(os.path.dirname(file_name_path))[-1] # 上级文件夹名称
            df['class'] = os.path.split(os.path.splitext(file_name_path)[-2])[-1] # 文件名称
            df['data_type'] = os.path.splitext(file_name_path)[-1] # 文件后缀
            df.columns = ['nums', 'date', 'class', 'data_type']
            df_init = pd.concat([df_init, df], axis=0)
            
df_init.head()

	nums	date	class	data_type
0	26	2022-01-03	c	.txt
1	42	2022-01-03	c	.txt
2	48	2022-01-03	c	.txt
3	95	2022-01-03	c	.txt
4	51	2022-01-03	c	.txt

共勉～

#数据分析教程#

数据分析实用手册文章被收录于专栏

微信知乎搜索HsuHeinrich，第一时间更新～最真实的数据分析教程，SQL、Python、Tableau、Excel、数据基建、BI报表、埋点、专题分析、数据挖掘、A/B试验。日常分析师涉及的方方面面，这里都有～

全部评论

推荐最新楼层

11-19 12:14

柠檬微趣_数据库内核测试工程师(准入职员工)

柠檬微趣内推，柠檬微趣内推码

面经：暑假投递，面试时间线拉的比较长自我介绍实习经历介绍问了我他们公司有什么产品，让我说一款的细节设置，以及和竞品的细节差异在这个游戏设计一个中秋节主题关卡，应该怎么设计，什么思路？现在的关卡设置有什么需要改进的地方？休闲游戏的目标客户群体？有什么理解？休闲游戏符合设置付费点？什么品类的游戏是经久不衰的？🍋【柠檬微趣26届秋招】火热开启！一周极速Offer，职等柠来！✔ 研发发行《宾果消消消》《浪漫餐厅》《梦幻旅行》等爆款手游✔ 中国手游发行商出海收入排行榜Top 5✔ 合成手游赛道全球收入No.1的发行商📍 工作地点：北京市西城区🔥 秋招亮点✅ 岗位全覆盖：游戏开发、数据分析、游戏策划...

点赞评论收藏

分享

11-19 15:47

百度_高级研发工程师

北京挣钱北京花，一分别想带回家

这边单独说一下北京吧，别的地方我住的不是很久，也不是很了解，从我2020年来北京，到现在也有五年了，五年期间，我换了4套房子，整体的租金是一直上升的，因为由俭入奢易，由奢入俭难。 接下来，我将从衣食住行来讲讲，北京最低生存消费在多少。一、衣 这里不光说穿衣服的事啊，就是包括日化用品，服装被套，都算在内，如果不多话的话，几百到一千应该是够了，这块没有什么好太多说的，就按最低成本来算吧，毕竟每个人花销不一样。二、食 嗯，大城市的吃饭是真的贵，当初我在大学，一份炒面6块钱，吃的饱饱的，现在吃饭，20多起步，这算普通的了，遇到贵的，30多，40-50都不稀奇，算一天吃饭50（已经很省了），一个月也要1...

点赞评论收藏

分享

10-14 12:20

门头沟学院 Java

自己被自己这句话整乐了

迷茫的大四🐶：摊牌了，我是25届的，你们也不招我

点赞评论收藏

分享

09-23 12:40

重庆邮电大学 Java

不是哥们，这对吗，给我干哪来了

Sigma429：极兔啊，薪资开的巨低，还在上海，索性不做笔试了

点赞评论收藏

分享

11-18 17:14

浙江大学算法工程师

毕业的这一年真的变了很多

眼看自己毕业也马上一年了回想当初走出校园找房子 找工作 适应独居憔悴了也成长了很多由于就业形势压力大去年秋招因为工作问题整个人会在焦虑那段的日子真的挺难忘…回想起来 “在逆境中才能真正成长”这句话一点儿没错自己也变得更加坚定和成熟

点赞评论收藏

分享

评论

1

1

招聘动态

宝时得科技

2026届校园招聘

MiniMax

2026校园招聘

字节跳动火山引擎

2026校园招聘

字节跳动

2026校园招聘

牛客官网投递工具共创者招募

快手

2026届校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 那些年，我收到的‘奇葩’回复 #

13944次浏览 124人参与

# 材料人，你最希望上岸的是？ #

10007次浏览 54人参与

# 百度秋招 #

48534次浏览 380人参与

178680次浏览 1278人参与

# 秋招你经历过哪些无语的事 #

15050次浏览 182人参与

# 职场中那些令人叹为观止的八卦 #

24027次浏览 218人参与

# 小红书开奖了 #

29094次浏览 150人参与

# AI时代，哪些岗位最容易被淘汰 #

8190次浏览 74人参与

# 秋招吐槽大会 #

74189次浏览 652人参与

# 你找工作想离家近 or 离家远？ #

13722次浏览 219人参与

# 我的职场社死时刻 #

17595次浏览 152人参与

# 实习学不到东西怎么办？ #

262842次浏览 2483人参与

# 你秋招最后悔的选择 #

13710次浏览 106人参与

# 校招薪资来揭秘 #

58402次浏览 385人参与

# XX请雇我工作 #

12860次浏览 108人参与

# 哪些公司开始补录了 #

17919次浏览 148人参与

# 来聊聊机械薪资天花板是哪家 #

153543次浏览 829人参与

# 得物求职进展汇总 #

133767次浏览 961人参与

# 小马智行求职进展汇总 #

16723次浏览 54人参与

# 实习心态崩了 #

90745次浏览 480人参与

# 租房前辈的忠告 #

286172次浏览 7256人参与

# 你父母给过你哪些不靠谱的职场建议？ #

13001次浏览 177人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务