整顿职场的他很认真

2020-05-06 21:48 重庆大学算法工程师

关注

虾米音乐榜单（不是音乐）爬爬爬

爬取虾米音乐热歌榜

本来还想着么得素材来写，今天就出来了，给人写了个简单的爬虫，就发上来吧

import time
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
from selenium.webdriver.common.action_chains import ActionChains

url = "https://www.xiami.com/"
driver = webdriver.Chrome()
driver.get(url)
#进入排行榜
xrank_all = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div/div/div[1]/a[2]'
rank_all = driver.find_element_by_xpath(xrank_all)
ActionChains(driver).click(rank_all).perform()
time.sleep(1)
#进入热歌榜
xrank_all = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div[1]/div[1]/div/div/div[2]'
rank_all = driver.find_element_by_xpath(xrank_all)
ActionChains(driver).click(rank_all).perform()
time.sleep(1)
#进入详细//*
xrank_New = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div[1]/div[2]/div[2]/div[1]/div[2]/a'
rank_New = driver.find_element_by_xpath(xrank_New)
ActionChains(driver).click(rank_New).perform()
time.sleep(5)
#获取榜单
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")

songs = soup.find_all("div", class_="song-name em")
singers = soup.find_all("div",class_="singers COMPACT")
albums = soup.find_all("div",class_="album")
times = soup.find_all('div',class_='duration-container ops-container')

song_name = []
singers_name = []
albums_name = []
time_list = []

for singer in singers:
    singers_name.append(singer.text)
for song in songs:
    song_name.append(song.text)
for album in albums:
    albums_name.append(album.text)
for time in times:
    time_list.append(time.text)

singers_name.pop(-1)

index = [i for i in range(1,101)]

data = {'排名':index,'歌曲名字':song_name,'歌手':singers_name,'专辑':albums_name,'时长':time_list}
dataframe = pd.DataFrame(data)
dataframe.to_csv('Xiami_hot.csv',index=False,sep=',',encoding='utf-8-sig')

driver.close()

本来想的是爬音乐的，就是内种MP3文件，但是不知道虾米的下载路径是什么，无奈就爬了文本了。

全部评论

推荐最新楼层

02-03 20:02

浙江大学算法工程师

大华C++ 二面总结

1. 介绍一下你在一面提到的XX项目，重点说说架构设计答案要点：整体架构：采用分层架构（接口层、业务层、数据层），模块间通过接口解耦技术选型：说明为什么选择某个框架/库，考虑了哪些因素（性能、可维护性、团队熟悉度）难点突破：如何解决高并发、数据一致性、性能瓶颈等关键问题优化迭代：项目上线后做了哪些优化，效果如何（用数据说话）2. 如果让你设计一个线程池，你会怎么实现？答案要点：核心组件：任务队列（存储待执行任务）、工作线程数组、同步机制（mutex+condition_variable）任务提交：通过模板函数接收任意可调用对象，返回future获取结果线程管理：固定线程数或动态调整，线程从队列...

查看16道真题和解析

点赞评论收藏

分享

02-03 11:16

郑州大学测试开发

爱学习自动化测试一面面经

听从牛友的意见，修改了简历，隔了几个月，重新开始找实习；面试官没有会议室，等了一会，不知道为什么没面多久，大概40min结束战斗；几乎没有八股，主要对上一段实习的拷打；1、自我介绍2、如何进行性能测试3、web网页测试和app测试有什么区别；4、上一段实习的测试流程；5、前司的自动化框架如何搭建；6、怎么判断什么时候使用自动化；7、罗列几个你用过的python第三方库；7、针对一个可在android、ios使用的app，有一个视频播放器功能，如何对其进行测试；8、算法：如何对一个字符串进行倒序（点名表扬，不用敲代码，直接口述就可以）9、sql：有一个数据库，里面有多个表，是各部门的薪水，现在想...

查看14道真题和解析

点赞评论收藏

分享

02-07 12:06

已编辑

华侨大学测试开发

最近看到很多 92 的，甚至是硕士，开始往测开赛道卷，说实话有点看不懂。先把话说清楚，大厂里的测开，绝大多数时间干的还是测试的活，只是写点自动化脚本、维护测试平台、接接流水线，真正像开发一样做系统、做架构、做核心平台的测开少得可怜，基本都集中在核心提效组，而且人很少，外面进去的大概率轮不到你，我想真正干过人都清楚。很多人被洗脑了，以为测开也是开，和后端差不多，只是更简单、更轻松、还高薪。现实情况是，测开和开发的职业路径完全不一样。开发的核心是业务和系统能力，测开的核心是稳定性和覆盖率，前者是往上走，后者天花板非常明显。你可以见到很多开发转测开，但你很少见到干了几年测开还能顺利转回开发的。更现实一点说，92 的高学历如果拿来做测开，大部分时间就是在做重复性很强的杂活，这种工作对个人能力的放大效应非常弱。三年下来，你和一个双非的，甚至本科的测开差距不会太大，但你和同龄的后端、平台开发差距会非常明显。这不是努不努力的问题，是赛道问题。所谓测开简单高薪，本质上是把极少数核心测开的上限，当成了整个岗位的常态来宣传。那些工资高、技术强的测开，本身就是开发水平，只是挂了个测开的名。普通人进去，99% 做的都是项目兜底型工作，而不是你想象中的平台开发。测开不是不能做，但它绝对不是开发的平替，也不是性价比最优解。如果你是真的不想做开发，追求稳定，那测开没问题。但如果你只是觉得测开比后端容易，还能进大厂，那我劝你冷静一点，这只是在用短期安全感换长期天花板。有92的学历，如果你连测开这些重复性工作都能心甘情愿接受，那你把时间精力用在真正的开发、系统、业务深度上，回报大概率比卷测开要高得多。想清楚再下场，别被岗位名和话术带偏了，就算去个前端客户端也是随便占坑的，测开是一个坑位很少赛道，反而大面积学历下放，不用想也能知道会是什么结果，我想各位在JAVA那里已经看到了

烤点老白薯：测测你的

点赞评论收藏

分享

01-13 18:50

杭州师范大学 Java

字节春招这就开始捞人了

下午五点多给我打电话问还看不看春招机会

点赞评论收藏

分享

昨天 17:17

三一重能_机械工程师(准入职员工)

格力电器内推，格力电器内推码

格力电器硬件面经1. 个人背景介绍；2. 单片机最小构成；3. 项目底板有哪些功能；4. 复位原理；5. 电源有哪几种；6. LDO工作原理；7. LDO效率多大；8. 反激变换器；9. 研究生阶段学过哪些硬件课程；10. 工作地点在珠海怎么看；11. 有接触过电机相关的吗；12. MOS导通条件；13. 反问。格力电器26届春招2月6日正式启动啦！企业简介：作为世界500强企业，格力电器现已发展成为多元化、科技型的全球工业制造集团，产业覆盖家用消费品和工业装备两大领域。【福利待遇】人才公寓及家属过渡房、免费通勤班车、无限流量免费电话卡、科技进步奖、周末双休、健康体检、年休假、五险一金及丰富津...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客吐槽大会 #

25676次浏览 324人参与

# 工作前VS工作后，你的心态变化 #

38529次浏览 267人参与

# 秋招想进国企该如何准备 #

125465次浏览 617人参与

# 你的mentor是什么样的人？ #

51612次浏览 741人参与

# 从mentor身上学到了__ #

55641次浏览 886人参与

# 我和mentor的爱恨情仇 #

106718次浏览 969人参与

# 我的省钱小妙招 #

37604次浏览 446人参与

# 机械人避雷的岗位/公司 #

44895次浏览 320人参与

# 在大厂上班是一种什么样的体验 #

15301次浏览 224人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

7706次浏览 217人参与

# 职场上哪些行为很加分？ #

323201次浏览 3619人参与

# 通信/硬件求职避坑tips #

139995次浏览 1087人参与

# 论秋招对个人心气的改变 #

16303次浏览 251人参与

# 你觉得mentor喜欢什么样的实习生 #

48778次浏览 1002人参与

# 你现在会用到哪些AI技能？ #

24849次浏览 137人参与

# 牛客AI体验站 #

9472次浏览 230人参与

# 毕业论文进行时 #

27710次浏览 153人参与

# 运营来爆料 #

77460次浏览 467人参与

# 程序员找工作至少要刷多少题？ #

24435次浏览 315人参与

# 过年最难忘的一件事 #

23345次浏览 179人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务