整顿职场的他很认真

2020-05-06 21:49 中国石油大学（华东）嵌入式工程师

关注

爬取豆瓣电影新片榜

python爬虫 — 豆瓣电影新片榜

豆瓣电影新片榜

import requests
import csv
import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from urllib3.exceptions import RequestError

def get_one_page(url):
    try:
        headers = {
           "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36 Edg/80.0.361.66"
        }
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestError:
        return None

def parse_one_page(html):
    soup = BeautifulSoup(html, "html.parser")
    messages = soup.find_all("tr",class_="item")
    top10 = []
    for message in messages:
        top10.append(message.a['title'])
    return top10

def write_to_file(content):
    index = [1,2,3,4,5,6,7,8,9,10]
    #用pandas保存csv文件
    test = pd.DataFrame({"index":index,'top10':content})
    test.to_csv(r'Douban_top10_movie.csv',sep=',',encoding='utf-8-sig',index=False)
    #用csv保存csv文件
    """with open("Douban_top10_movie.csv", "w",newline='',encoding='utf-8-sig') as csvfile: writer = csv.writer(csvfile) writer.writerow(["index", "top10"]) writer.writerows([index,content])"""

if __name__ =='__main__':
    html = get_one_page('https://movie.douban.com/chart')
    content = parse_one_page(html)
    write_to_file(content)

爬取结果：

全部评论

推荐最新楼层

11-24 12:19

三峡大学自动驾驶系统工程师

了解一下大家都在哪里投的简历？

双非硕，0offer, 简历投了200多，不是我不勤快，实在是投简历太麻烦，每次都要弄那个在线简历，近视度数又加深了，还特别占时间。而且最近几天我发现，居然没有可投的啦。看到大家都说投了上千份，我就想请教一下，大家都是在哪里投的？要岗位多，投简历轻松一些的。或者说，投了以后有反馈的，我这边投出去基本石沉大海，就是拿不到offer，多几个面试长长经验也好呀😁

点赞评论收藏

分享

11-26 14:26

南京信息工程大学 Java

momenta测试开发实习生一面1126

30min1.自我介绍2.写过python吗3.实习中用数据库做什么？4.了解过从发验证码到接收的数据流吗？redis和db数据库是怎么交互的？“验证码一分钟内失效“这个是怎么做的呢？5.做过web开发吗？6.http和https的区别大概5分钟过去，接下来25分钟都是共享屏幕在idea上做题，一道数据库设计题和一道力扣mid。7.数据库设计：优惠券的接受、使用、以及使用后的增减变化，应该怎么设计数据库实现这个功能？用户表(userId, name, phone)优惠券表(优惠券id, price, expire过期时间)用户优惠券表(userId, 优惠券id，优惠券状态(0,1,2), 优...

查看12道真题和解析

点赞评论收藏

分享

11-12 10:25

武汉晴川学院 Java

这家公司咋样啊哥姐们

我见java多妩媚：大外包

点赞评论收藏

分享

10-18 00:17

第一拖拉机制造厂拖拉机学院 Java

hr天天给我发消息😅

牛客279957775号：铁暗恋

点赞评论收藏

分享

11-26 11:35

已编辑

华南农业大学后端

途虎后端开发秋招一面面经

31min，纯八股自我介绍了解了一下实习经历是具体做什么八股类加载过程类加载器每一个类都可以被类加载器加载吗集合有了解吗？hashmap的底层原理？链表和红黑树的时间复杂度的比较？spring的IOC和AOPAOP一般用于什么场景？AB方法上面事务注解，A调用B，B的事务起作用吗?springMVC的执行流程Mysql的事务Mysql建立索引的原则算法121. 买卖股票的最佳时机

查看12道真题和解析软件开发笔面经牛客创作赏金赛

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 拼多多求职进展汇总 #

237926次浏览 2040人参与

# ai智能作图 #

29899次浏览 356人参与

# 阿里云管培生offer #

63197次浏览 1764人参与

# 25届秋招总结 #

413640次浏览 4151人参与

# 实习，投递多份简历没人回复怎么办 #

2441895次浏览 34748人参与

# 地方国企笔面经互助 #

7064次浏览 17人参与

# 北方华创开奖 #

67238次浏览 553人参与

# 我在牛爱网找对象 #

74947次浏览 556人参与

# 虾皮求职进展汇总 #

93859次浏览 765人参与

# 机械求职避坑tips #

23759次浏览 249人参与

# 发工资后，你做的第一件事是什么 #

9465次浏览 43人参与

# 我的实习求职记录 #

6136000次浏览 84028人参与

# 25届机械人为了秋招做了哪些准备？ #

26376次浏览 363人参与

# 投格力的你，拿到offer了吗？ #

47489次浏览 337人参与

# 机械人怎么评价今年的华为 #

158052次浏览 1352人参与

# 华为工作体验 #

111877次浏览 867人参与

# 如果再来一次，你还会选择这个工作吗？ #

116613次浏览 1147人参与

# 国央企笔面经互助 #

88626次浏览 897人参与

# 在职场上，你最讨厌什么样的同事 #

6201次浏览 92人参与

# 产运销实习日记 #

28276次浏览 326人参与

# 软件开发投递记录 #

1482192次浏览 23949人参与

# 硬件兄弟们甩出你的华为奖状 #

78674次浏览 629人参与

牛客网
牛客企业服务