虾米音乐榜单(不是音乐)爬爬爬

爬取虾米音乐热歌榜

本来还想着么得素材来写,今天就出来了,给人写了个简单的爬虫,就发上来吧

import time
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
from selenium.webdriver.common.action_chains import ActionChains

url = "https://www.xiami.com/"
driver = webdriver.Chrome()
driver.get(url)
#进入排行榜
xrank_all = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div/div/div[1]/a[2]'
rank_all = driver.find_element_by_xpath(xrank_all)
ActionChains(driver).click(rank_all).perform()
time.sleep(1)
#进入热歌榜
xrank_all = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div[1]/div[1]/div/div/div[2]'
rank_all = driver.find_element_by_xpath(xrank_all)
ActionChains(driver).click(rank_all).perform()
time.sleep(1)
#进入详细//*
xrank_New = '//*[@id="app"]/div/div[2]/div[1]/div[1]/div[1]/div[2]/div[2]/div[1]/div[2]/a'
rank_New = driver.find_element_by_xpath(xrank_New)
ActionChains(driver).click(rank_New).perform()
time.sleep(5)
#获取榜单
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")

songs = soup.find_all("div", class_="song-name em")
singers = soup.find_all("div",class_="singers COMPACT")
albums = soup.find_all("div",class_="album")
times = soup.find_all('div',class_='duration-container ops-container')

song_name = []
singers_name = []
albums_name = []
time_list = []

for singer in singers:
    singers_name.append(singer.text)
for song in songs:
    song_name.append(song.text)
for album in albums:
    albums_name.append(album.text)
for time in times:
    time_list.append(time.text)

singers_name.pop(-1)

index = [i for i in range(1,101)]

data = {'排名':index,'歌曲名字':song_name,'歌手':singers_name,'专辑':albums_name,'时长':time_list}
dataframe = pd.DataFrame(data)
dataframe.to_csv('Xiami_hot.csv',index=False,sep=',',encoding='utf-8-sig')

driver.close()

本来想的是爬音乐的,就是内种MP3文件,但是不知道虾米的下载路径是什么,无奈就爬了文本了。

全部评论

相关推荐

02-07 12:06
已编辑
华侨大学 测试开发
最近看到很多 92 的,甚至是硕士,开始往测开赛道卷,说实话有点看不懂。先把话说清楚,大厂里的测开,绝大多数时间干的还是测试的活,只是写点自动化脚本、维护测试平台、接接流水线,真正像开发一样做系统、做架构、做核心平台的测开少得可怜,基本都集中在核心提效组,而且人很少,外面进去的大概率轮不到你,我想真正干过人都清楚。很多人被洗脑了,以为测开也是开,和后端差不多,只是更简单、更轻松、还高薪。现实情况是,测开和开发的职业路径完全不一样。开发的核心是业务和系统能力,测开的核心是稳定性和覆盖率,前者是往上走,后者天花板非常明显。你可以见到很多开发转测开,但你很少见到干了几年测开还能顺利转回开发的。更现实一点说,92 的高学历如果拿来做测开,大部分时间就是在做重复性很强的杂活,这种工作对个人能力的放大效应非常弱。三年下来,你和一个双非的,甚至本科的测开差距不会太大,但你和同龄的后端、平台开发差距会非常明显。这不是努不努力的问题,是赛道问题。所谓测开简单高薪,本质上是把极少数核心测开的上限,当成了整个岗位的常态来宣传。那些工资高、技术强的测开,本身就是开发水平,只是挂了个测开的名。普通人进去,99% 做的都是项目兜底型工作,而不是你想象中的平台开发。测开不是不能做,但它绝对不是开发的平替,也不是性价比最优解。如果你是真的不想做开发,追求稳定,那测开没问题。但如果你只是觉得测开比后端容易,还能进大厂,那我劝你冷静一点,这只是在用短期安全感换长期天花板。有92的学历,如果你连测开这些重复性工作都能心甘情愿接受,那你把时间精力用在真正的开发、系统、业务深度上,回报大概率比卷测开要高得多。想清楚再下场,别被岗位名和话术带偏了,就算去个前端客户端也是随便占坑的,测开是一个坑位很少赛道,反而大面积学历下放,不用想也能知道会是什么结果,我想各位在JAVA那里已经看到了
烤点老白薯:测测你的
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务