牛客259336889号

2022-08-26 14:34 已编辑北京交通大学数据分析师

关注

题解 | #牛客网连续练习题目3天及以上的用户#

本人数据分析方向，完全按照SQL次日留存率的步骤来求解。看到很多大佬用循环写，再次感叹，数据分析和计算机算法两种类型的思路的不同。之前代码有点bug，少写了一个date2，现在已纠正。

import pandas as pd
from datetime import timedelta
nowcoder = pd.read_csv('nowcoder.csv')
# 先转时间
nowcoder['date'] = pd.to_datetime(nowcoder['date'])
# 先提取年月
nowcoder['date1'] = nowcoder['date'].dt.strftime("%Y-%m")
data = nowcoder[nowcoder['date1'] == '2021-12']
# 再获取年月日
data['date2'] = pd.to_datetime(data['date'].dt.date)
# 根据日排序
data['rk'] = pd.to_timedelta(data.groupby(['user_id']).date2.rank(),unit='d')
# 作差并获取出现次数最多的值，SQL的思路
data['cha'] = data['date2']-data['rk']
data1 = data.groupby(['user_id','cha']).count().groupby('user_id').rk.max()
print(data1[data1>=3])

全部评论

推荐最新楼层

手臂不够粗

上海大学数据分析师

请教下楼主，为什么data['cha'] = data['date1']-data['rk']，这里是用date1列去减rk，而不是date列去减呢。 date列去减的话，cha就能有连续三天相等的值，但date1的时间格式是'2021-12'，减rk的话，cha的值每天都不同啊

1 回复分享

发布于 2022-07-22 15:25

牛客584458596号

广东外语外贸大学运营

其实用窗口函数很快就可以解出来了，唉~

点赞回复分享

发布于 2022-08-19 11:03 广东

牛客106661868号

武汉学院数据分析师

大佬，我为什么data['rk'] = pd.to_timedelta(data.groupby(['user_id']).date1.rank(),unit='d')这一行会'NoneType' object is not callable对象不可调用。rank（）函数有什么用？

点赞回复分享

发布于 2022-08-08 15:28

牛客164895901号

河北经贸大学 Java

大佬可以解释一下rank的作用吗，不太理解。本地端建了个数据表跑了一下提示我“No numeric types to aggregate”是啥意思呀？求教呀，万分感谢

点赞回复分享

发布于 2022-08-03 17:17

成都理工大学图像识别

楼主有空时可以稍微解释下吗，有些没看太懂。感谢。比如第8 行date1.rank()。 date1不是只有年月吗，没有天，rank了也没意义啊。

点赞回复分享

发布于 2022-08-03 15:14

牛客259336889号

楼主

北京交通大学数据分析师

第十行的max的意思是找到最大的连续登录天数（例如出现两次连续，但是这两次中间有几天是不连续的，就会产生两个cha值，找最大的即可），最后一行的data是一个Series，是通过布尔值来进行值的筛选。

点赞回复分享

发布于 2022-07-18 14:38

牛客272337311号

门头沟学院数据分析师

第10什么要加个max哇，还有最后一行这个代码没有看懂哎，虽然我知道是count>=3,求助楼主

点赞回复分享

发布于 2022-07-16 15:51

04-25 18:59

已编辑

门头沟学院测试开发

双非本暑期实习5 6月还有机会吗

本人bg双非本，一段制造业大厂实习，各中大厂暑期开了之后就投了，但是投了两个月面试机会少的可怜，一只手数的过来。日常实习的hc也明显变少了，想问问各位佬们，5 6月中大厂是否还有机会呢，如果没有的话准备找小厂了之前边背八股和刷算法题边投简历，现在都没什么动力学下去了引流 腾讯字节美团

点赞评论收藏

分享

04-21 10:15

华中师范大学 Java

字节-TikTok-后端一面

自我介绍项目介绍针对项目细节展开追问，我的项目中涉及 RAG，因此这部分问得比较多，主要会围绕整体方案、检索流程、效果优化，以及为什么这样设计来展开Java 基础，主要是结合一些常见八股去问，看看基础是否扎实Synchronized 锁升级机制，一般会从对象头、偏向锁、轻量级锁、重量级锁这些点往下问，追问锁膨胀过程和不同场景下的性能差异Java 集合框架，通常会从常见集合类的特点、底层数据结构、适用场景开始问，再延伸到 ArrayList、LinkedList、HashMap、ConcurrentHashMap 等具体实现Java 垃圾回收机制，这一块问得比较系统，通常会先问怎么判断对象是否存...

查看10道真题和解析

点赞评论收藏

分享

04-22 17:55

山东女子学院 Java

字节飞书一面，面得我想死

😭😭被拷打麻了，手撕还不是hot100

字节求职进展汇总

点赞评论收藏

分享

04-07 21:14

已编辑

北京交通大学前端工程师

27届前端找实习，求大佬拷打简历

BOSS沟通了好多都是已读不回，求大佬拷打拷打

点赞评论收藏

分享

04-24 09:20

北京邮电大学嵌入式工程师

从夯到拉机器人嵌入式项目排名

2026春招机器人/嵌入式项目分档盘点结合校招面试真实反馈，以及牛客上百篇机器人/嵌入式岗上岸学长学姐的经验，给大家做了一份2026春招机器人嵌入式项目分档盘点，精确到项目名称、适配岗位、核心亮点、面试加分点、避雷提示，帮大家精准避坑，知道哪些项目闭眼做，哪些项目千万别碰。先给核心分类标准，完全贴合校招面试的考察逻辑：【S级 高含金量】：系统完整+技术前沿+工程化落地，面试差异化拉满，90%的面试官都会感兴趣，闭眼冲【A级 有亮点】：场景明确+有优化深度+易上手，面试有加分，适合补项目经历，放心做【B级 烂大街慎做】：同质化严重+无差异化+demo级，10个应届生9个做，没亮点慎做【C级 纯浪...

点赞评论收藏

分享

评论

6

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你和你的mentor相处模式是__ #

144次浏览 2人参与

# 如果公司降薪，你会跳槽吗？ #

159695次浏览 929人参与

# 华泰星战营，提前锁定校招offer #

15340次浏览 671人参与

# 实习第一天，你在干什么 #

138次浏览 2人参与

# 简历上如何体现你的“AI”能力？ #

18123次浏览 389人参与

# 你总挂在第__面？ #

13192次浏览 155人参与

# 工作不开心辞职是唯一出路吗 #

18449次浏览 60人参与

# 哪些AI项目值得做？ #

28146次浏览 666人参与

# 找不到大厂实习可以去小厂吗？ #

23821次浏览 280人参与

# 远程面试的尴尬瞬间 #

360418次浏览 2056人参与

# 你是怎么和mt相处的？ #

102355次浏览 502人参与

# 拼多多集团-PDD笔试 #

88007次浏览 596人参与

# 实习时最怕听到的一句话 #

25017次浏览 227人参与

# 26年哪些行业会变好/更差 #

65978次浏览 533人参与

# 打工人的工作餐日常 #

96386次浏览 556人参与

# 没有面试的日子里，你在做什么 #

15477次浏览 389人参与

# 0offer互助地 #

770969次浏览 4730人参与

# 网易游戏雷火笔试 #

11738次浏览 109人参与

# 运营面经 #

172554次浏览 1365人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

200985次浏览 1192人参与

# 你知道最慷慨和最抠的公司分别是 #

12323次浏览 119人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务