小白一枚,记录自己学习的过程。 今日的目的是爬取起点小说网的一章小说。 首先我们把需要的包导入 from bs4 import BeautifulSoup import urllib.request 为了防止反爬虫,还是得先模拟浏览器访问该网站。 模拟浏览器查看另一篇博。 req.add_header('User-Agent','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36') urllib中包括了四个模块,包括 u...