小水滴真的是太可爱了吧

2020-09-22 21:36 门头沟学院产品经理

关注

【爬虫学习笔记day26】3.4. 案例二：动态页面模拟点击

文章目录

3.4. 案例二：动态页面模拟点击
- 案例二：动态页面模拟点击

3.4. 案例二：动态页面模拟点击

案例二：动态页面模拟点击

爬取斗鱼直播平台的所有房间信息：

#coding=utf-8
from selenium import webdriver
import json
import time
class Douyu:
    # 1.发送首页的请求
    def __init__(self):
        self.driver = webdriver.PhantomJS()
        self.driver.get("https://www.douyu.com/directory/all") #请求首页

    #获取没页面内容
    def get_content(self):
        time.sleep(3) #每次发送完请求等待三秒，等待页面加载完成
        li_list = self.driver.find_elements_by_xpath('//ul[@id="live-list-contentbox"]/li')
        contents = []
        for i in li_list: #遍历房间列表
            item = {
   }
            item["img"] = i.find_element_by_xpath("./a//img").get_attribute("src") #获取房间图片
            item["title"] = i.find_element_by_xpath("./a").get_attribute("title") #获取房间名字
            item["category"] = i.find_element_by_xpath("./a/div[@class='mes']/div/span").text #获取房间分类
            item["name"] = i.find_element_by_xpath("./a/div[@class='mes']/p/span[1]").text #获取主播名字
            item["watch_num"] = i.find_element_by_xpath("./a/div[@class='mes']/p/span[2]").text #获取观看人数
            print(item)
            contents.append(item)
        return contents
    #保存本地
    def save_content(self,contents):
        f = open("douyu.txt","a")
        for content in contents:
            json.dump(content,f,ensure_ascii=False,indent=2)
            f.write("\n")
        f.close()

    def run(self):
        #1.发送首页的请求
        #2.获取第一页的信息
        contents = self.get_content()
            #保存内容
        self.save_content(contents)
        #3.循环 点击下一页按钮，知道下一页对应的class名字不再是"shark-pager-next"
        while self.driver.find_element_by_class_name("shark-pager-next"): #判断有没有下一页
            #点击下一页的按钮
            self.driver.find_element_by_class_name("shark-pager-next").click() #
            # 4.继续获取下一页的内容
            contents = self.get_content()
            #4.1.保存内容
            self.save_content(contents)

if __name__ == "__main__":
    douyu = Douyu()
    douyu.run()

全部评论

推荐最新楼层

02-16 22:57

四川大学 Java

26届末211本中9硕电子信息，无党员无实习

刚开始学java还有戏吗，不知道找什么工作了，谁能指导一下

点赞评论收藏

分享

02-14 14:15

VIVO25春招&vivo26实习内推

哥几个过完年又来上班了！！，第一周完全没啥工作效率，做点简单的事情内推一下同学们春招基本没啥人投，毕竟当初这个点大家都已经确定完在写论文了，确实是个捡漏的好机会，春招岗位满了会下线，所以尽快投吧 投递看这里，记得内推码要手写！！！ 不然我没办法跟进进度 内推后有啥问题可以评论区留言 也记得帮我点个赞，谢谢！实习投递链接：https://hr-campus.vivo.com/intern/jobs春招投递链接：hr-campus.vivo.com/campus/jobs入职vivo有一段时间了，强度是有一些，但是平时总有一些时候比如一些活动，聚会之类的能让人感觉到放松，上班的心态和学生...

vivo公司氛围 186人发布

点赞评论收藏

分享

01-22 16:31

门头沟学院产品经理

看到hr回的话想哭了

一直以为自己是个fw，第一次听到别人夸我很优秀😢 #牛客创作赏金赛# #牛客激励计划#

none_c：hr刚想掏出东南亚公司联系方式，你给他整不会了

牛客创作赏金赛牛客激励计划

点赞评论收藏

分享

2024-12-27 10:21

已编辑

海南师范大学媒介策划

求大佬锐评，一个初筛都过真的绷不住了

到我怀里来：身高体重住址这些就别写了，留几个关键的就行，工作经历突出重点写详细点

点赞评论收藏

分享

02-12 16:41

深信服_远程技术服务工程师(准入职员工)

深信服内推深信服面经

一面自我介绍实习中遇到的最大困难分批处理数据问题：如何分批处理数据？回答：一开始COUNT总的条数，然后使用LIMIT和OFFSET进行分批查询。每个线程处理一个固定范围的数据，若范围内无数据则停止。追问：若多线程分批查询过程中有数据插入或者删除，则数据缺漏，如何解决问题？回答：维护事务。追问：多线程共享事务存在问题，不合适，有其他方式吗？回答：上锁，但是效率低下（面试官看我给出的两个方案都不满意，没再追问）CSRF攻击防护：问题：什么是CSRF攻击？如何防止？手撕：程序输出解释：问题：解释这个程序的输出（Java的值传递还是引用传递的例子）。绘图程序的改进：问题：如何改进绘图程序使其输出连续...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 读研or工作，哪个性价比更高？ #

24655次浏览 333人参与

# 如果重来一次你还会读研吗 #

154721次浏览 1701人参与

# 科大讯飞求职进展汇总 #

258966次浏览 2595人参与

# 秋招感动瞬间 #

11021次浏览 103人参与

# 阿里巴巴创始人马云回国 #

14268次浏览 87人参与

# 职场新人生存指南 #

195889次浏览 5398人参与

# 你最满意的offer薪资是哪家公司？ #

11968次浏览 109人参与

# 长光卫星求职进展汇总 #

27606次浏览 184人参与

# 文科生还参加今年的春招吗 #

3439次浏览 29人参与

# 追觅科技求职进展汇总 #

8551次浏览 58人参与

# 选择和努力，哪个更重要？ #

42375次浏览 472人参与

# 招聘要求与实际实习内容不符怎么办 #

41645次浏览 469人参与

# 打工人的工作餐日常 #

24756次浏览 221人参与

# 机械制造岗投递时间线 #

19332次浏览 324人参与

# 小红书求职进展汇总 #

40472次浏览 346人参与

# 影石Insta360求职进展汇总 #

107733次浏览 969人参与

# 如果再来一次，你还会学硬件吗 #

102857次浏览 1236人参与

# 机械人选offer，最看重什么？ #

68633次浏览 433人参与

# 机械人怎么评价今年的华为 #

180373次浏览 1485人参与

# 滴！实习打卡 #

554972次浏览 6010人参与

牛客网
牛客企业服务