平步青云win

2020-04-12 12:43 已编辑东南大学 C++

关注

Python爬去豆瓣电影Top250

import requests
import bs4

def open_url(url):
    #使用***
    #proxies = {"http": "127.0.0.1:1000", "https":"127.0.0.1:1000"}
    headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}

    #res = requests.get(url, headers = headers, proxies = proxies)
    res = requests.get(url,headers = headers)

    return res

def find_movies(res):
    soup = bs4.BeautifulSoup(res.text, "html.parser")

    #电影名
    movies =[]
    targets =soup.find_all("div", class_="hd")
    for each in targets:
        movies.append(each.a.span.text)

    #评分
    ranks = []
    targets =soup.find_all("span", class_="rating_num")
    for each in targets:
        ranks.append(each.text)
   
    #资料
    messages = []
    targest = soup.find_all("div", class_="bd")
    for each in targets:
        try:
            messages.append(each.p.text.split('\n')[1].strip()+each.p.text.split('\n')[2].strip())
        except:
            continue

    #每个电影的地址
    id = []
    targets =soup.find_all("a", href="https://movie.douban.com/subjext/")
    for each in targets:
        print(each.a)
        id.append(each.a)
    

        
    print(len(movies), len(ranks), len(messages))
    result = []
    length = len(movies)
    for i in range(length):
        result.append(movies[i]+ranks[i]+'\n')
   
    return result
        
def find_depth(res):
    soup = bs4.BeautifulSoup(res.text, 'html.parser')
    depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text
    return (int(depth))

def main():
    host = "https://movie.douban.com/top250"
    res = open_url(host)
    depth = find_depth(res)
    

    result = []
    for i in range(depth):
        url = host + '?start=' + str(25*i)
        res = open_url(url)
        result.extend(find_movies(res))

        with open("豆瓣top2250电影.txt", "w", encoding="utf-8") as f:
            for each in result:
                f.write(each)

if __name__ == "__main__":
    main()

全部评论

推荐最新楼层

07-09 16:05

华中科技大学全栈开发

算法大模型才是天花板

不过很卷学历 ，学历不太行的还是走后端吧

计算机有哪些岗位值得去？

点赞评论收藏

分享

07-07 14:12

浙江工商大学 Java

晕。0个人在看我的简历对吗

我说boss 牛客 猎聘 51 你们给我点钱吧要不，我每天屏幕使用时间都在你们身上了

如珩NanoShik...：好臭的沟通数

点赞评论收藏

分享

06-12 10:50

门头沟学院 Java

为了提高就业率不挑食了

你的不定积分没加C：我怎么在学院群看到了同样的话

点赞评论收藏

分享

06-24 17:38

已编辑

哈尔滨工业大学产品经理

26硕找实习找了三个月，至今0offer

我愿称为实习悖论➡️大公司实习经历不够➡️小公司说我稳定性差（实习时长我只能3个月，还要回尔滨秋招）求大佬帮看看简历🙏求推荐的岗位🙏工资一点要求都没有，自费实习我都愿意全国可飞，租房子实习

vicky_023：先说能干六个月进去了再润呗太老实啦

0offer是寒冬太冷还...

点赞评论收藏

分享

07-10 15:31

杭州电子科技大学大数据开发工程师

公司来了一个女开发，感觉我又行了

最近公司新来了一个后端开发，而且还是女生，但我觉得绝对不是因为是女生，所有被招进来了肯定是因为实力强劲，因为在计算机这个行业来说，女生几乎都集中在前端岗位多一点后端开发岗位，几乎都是清一色的纯爷们，女生少之又少目前计算机行业的岗位来说开发已经趋于过饱和了，各大培训机构半年速成，一年两批学员流入市场，在各个地方，开发岗位都是卷目前 最建议的是算法岗位，因为门槛高的许多，就导致竞争很小，随之而来的也是技术的深入，对自己的要求非常高，但是薪资也是蛮可观的，在短时间内，也不会被代替

计算机有哪些岗位值得去？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

55366次浏览 413人参与

# 运营面经 #

115653次浏览 1250人参与

# 你认为小厂实习有用吗？ #

21032次浏览 250人参与

# 说说你知道的学历厂 #

39862次浏览 240人参与

# 应届生，你找到工作了吗 #

21472次浏览 154人参与

# 三一重工求职进展汇总 #

13384次浏览 61人参与

# 你的领导最像哪种动物，为什么? #

14435次浏览 107人参与

# 材料人，你们签了哪个公司 #

7499次浏览 18人参与

# 哪一瞬间觉得自己长大了 #

10168次浏览 229人参与

# 计算机有哪些岗位值得去？ #

17170次浏览 160人参与

# 面试尴尬现场 #

32853次浏览 219人参与

# 你找工作的时候用AI吗？ #

19038次浏览 233人参与

# 下班后的时间你怎么安排 #

10423次浏览 141人参与

# 烟草笔面经互助 #

17854次浏览 184人参与

# 硬件人秋招的第一个offer #

80209次浏览 1154人参与

# 社会教会你的第一课 #

37109次浏览 467人参与

# 秋招最大的收获是什么？ #

36121次浏览 309人参与

# 电网笔面经互助 #

36921次浏览 357人参与

# lastday知无不言 #

58350次浏览 475人参与

# 硬件应届生薪资是否普遍偏低？ #

75440次浏览 520人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务