2023-05-21 00:03 已编辑哈尔滨工业大学算法工程师

关注

数据分析学习记录-----DAY5

25.修补缺失的用户数据:

该题不写 dtype=object 会报错

print的时候不可以直接写print（Nowcoder['Achievement_value'].fillna(value=mean_achievement,inplace=True)）

要先：

Nowcoder['Achievement_value'].fillna(value=mean_achievement,inplace=True

print（Nowcoder）

26.解决牛客网用户重复的数据：

判断是否为重复：

Nowcoder.duplicated()

删除重复数据：

Nowcoder.drop_duplicates()

27.统一最后刷题日期的格式:

该题不写 dtype=object 会报错

pandas库中的to_datetime()函数可以将字符串或者数字转换为日期格式的数据。

df[''date]数据类型为“object”，通过pd.to_datetime将该列数据转换为时间类型，即datetime

df['Last_submission_time']=pd.to_datetime(df['Last_submission_time'],format='%Y-%m-%d')

28.将用户的json文件转换为表格形式:

读取Json文件：df=pd.read_json('Nowcoder.json',dtype=dict)

29.牛客网的每日练题量:

groupby（）的常见用法

df.groupby(‘key1’):一列聚合分组键为列名（可以是字符串、数字或其他Python对象）

df.groupby([‘key1’,‘key2’]):多列聚合分组键为列名，引入列表list[]

df[‘data1’].groupby(df[‘key1’]).mean():按某一列进行一重聚合求均值分组键为Series

A=df[‘订单编号’].groupby([ df[‘运营商’], df[‘分类’], df[‘百度圣卡’] ]).count() 按某一列进行多重聚合计数分组键为Series，引入列表list[]

df[‘data1’].groupby([states,years]).mean() 分组键与原df无关，而是另外指定的任何长度适当的数组分组键是数组，state和year均为数组

df['date']=pd.to_datetime(df['date'],format='%Y-%m-%d')

print(df['date'].groupby(df['date']).count())

30.牛客网用户练习的平均次日留存率:

df["date"] = pd.to_datetime(df["date"]).dt.date 将date信息里面的时间信息去掉，仅留下日期信息

datetime.timedelta：表示时间间隔，即两个时间点之间的长度。datetime.timedelta(days=1) 表示时间间隔为一天。

import pandas as pd

from datetime import timedelta

nowcoder=pd.read_csv('nowcoder.csv',dtype=object)

pd.set_option('display.max_columns', None)# 显示所有的列，而不是以……显示

pd.set_option('display.max_rows', None)# 显示所有的行，而不是以……显示

pd.set_option('display.width', None) # 不自动换行显示

df = pd.merge(nowcoder,nowcoder,on='user_id',suffixes=['_a','_b']) #将同一个表合并一次.(这个合并操作：同一个id在不同日期，有a,b两种表现，则合并为aa,ab,ba,bb)

df.date_a = pd.to_datetime(df.date_a).dt.date #去除信息中的时间信息

df.date_b = pd.to_datetime(df.date_b).dt.date

df = df[(df.date_a+timedelta(days=1))==df.date_b] #将date_b赋值为后一天的信息，并且在这个过程中完成了去重操作（每一个id只有一个时间信息了）

all_num = nowcoder.user_id.count() 计算操作前的user数量

again_num = df.user_id.count() 计算操作后的

print(round(again_num/all_num,2))

全部评论

推荐最新楼层

02-13 17:54

牛客运营

【租房进阶版】如何从租房萌新到租房大佬？北利亚全都讲清楚

租房萌新版：（全时间段）暑期租房攻略来啦！全是干货！经过一年的淬炼，我又成长了，作为一个毕业就来北京北漂的打工人，积累的经验也算是前车之鉴，如果你即将要面对实习租房，未来工作当地租房，那么这份租房攻略对你肯定有用！当然是适用全国各地的！认准牛客刘北（北利亚）！接下分享一些我的租房心得，献给各位即将开始漂泊的牛友们！一、租房渠道1）线上房源其实现在任何一个平台都能成为你线上的租房渠道，比如小红书、牛客、甚至咸鱼、抖音搜转租你也可以找到很多租房的；牛客：目前牛客也是有很多转租房子的，基本上都是大学生自己住的，然后实习结束之后转租的，这些基本都是没有任何问题的，相对其他地方的转租贴会遇到中介，但在牛...

刘北の杂谈&经验... 牛客创作赏金赛

点赞评论收藏

昨天 10:19

已编辑

香港中文大学数据分析师

真的有春招么。。

昨天有个25届学弟问我们有春招么，说他去年秋招一直忙学校的事情，没有秋招的意识，错过了秋招的最佳时间，后面机会已经非常渺茫了，最近家里也在不停的催他，能感受到他压力非常大，我也来看看牛客，发现大家都很迷茫我看甚至已经有同学发出了“有春招吗”的质疑，其实我想说真的有的，而且还不少，因为我就是去年通过春招拿到offer进水滴的，可能自己淋过雨，就想给别人撑把伞吧，把我知道的我司的一些春招情况分享给大家，希望能帮到你们。一、 春招进行时，25届可以冲就我的经验，春招还是有很多机会的，但是得需要自己搜集，所以有机会就可以冲，因为这个时候机会更宝贵。我确定了我司春招是开启了的，给你们提炼一下重点：● 面...

在查重的劳伦斯：佬再出出春招的求职攻略吧

投递水滴等公司10个岗位 >

点赞评论收藏

01-15 20:49

宝鸡三和职业学院算法工程师

永远化身华黑子

西松屋：说明原部门有机会把

点赞评论收藏

02-15 16:33

中金所技术公司_业务

26届实习招聘信息汇总 | 02.15更新

随着25届秋招结束，26届的小伙伴们已经按捺不住了，有些同学已经疯狂开始刷项目、刷八股、刷编程、刷实习了，哨哥赶紧就开始更新26届的实习校招信息啦！以现在的就业形势压力、减少信息差确实很重要，赶紧跟着哨哥开工吧！【哨哥的往期热帖推荐】：★ 哨哥置顶帖：如何从零准备到收获offer★ 历届求职黑名单：毁意向毁约裁员黑名单★ 25届招聘信息更新：实习&校招社招信息汇总★ 感兴趣银行等金融科技：哨哥的金融科技学习笔记★ 银行等金融科技&国企求职：金融科技&国企校招攻略（记得关注哨哥，跟踪互联网&国央企的招聘~）一、银行等金融科技 & 国企央企（实习...

牛客吹哨人：26届需要组织的话，可以主动私聊哨哥哈~

投递Optiver等公司10个岗位 > 实习校招社招信息汇总

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 面试被问“你的缺点是什么?”怎么答 #

# 简历无回复，你会继续海投还是优化再投？ #

# 参加完秋招的机械人，还参加春招吗？ #

# 22届毕业，是读研还是拿外包offer先苟着 #

4650次浏览 27人参与

# 招聘要求与实际实习内容不符怎么办 #

46574次浏览 493人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

20512次浏览 413人参与

# 软开人，你觉得应届生多少薪资才算合理？ #