<span>python爬取淘宝信息，第三方库批量安装</span>

今天在写代码时，发现之前有好多都忘记了。就复习总结了一下。
python——目前计算机最热门的计算机语言之一。人们大多都认为这是一门很好入门的语言，确实如此。但，入坑容易，出坑难。python就是一部伤心泪。好了，不废话。爬虫开始：

爬虫要想运行，少不了第三方库，爬虫的第三方库中，更是逐年递增。各种库其实到最后不过大同小异，各有优异，都是进行数据采集。第三方库太多了，我又懒得一个一个去慢慢安装，所以，方法如下：

第一种：在键盘上按住win+R，输入cmd命令行，回车。再输入：pip instell
第三方库名，回车即可等待。如果无法安装pip命令一般是python文件不全，重新安装python。以下是两个爬虫最基本的第三方库

EG：`pip install requests` OR

 pip install BeautifulSoup4

这只是第一种常用方法，第二种用python代码批量安装。代码如下

import os  #引入os
libs = {"numpy","matplotlib","pillow","sklearn","requests",\
		"jieba","beautifulsoup4","wheel","networkx","sympy",\
		"pyinstaller","django","flask","werobot","pyqt5",\
		"pandas","pyopengl","pypdf2","docopt","pygame"} #这里面都是python第三方库的名称
try:
	for lib in libs:
		os.system("pip3 install "+lib) #python命令格式
	print("Successful")
except:
	print("Failed Somehow")

如果需要安装其他库，只需更改第三方库的名称即可。

以下就是python爬取淘宝的信息代码，但我发现淘宝需要用chrome浏览器运行时，需扫码登陆账号，这是反爬代码。虽然网上有很多反爬技术，但我目前没找到比较简洁的python反爬代码，所以就不多做赘述了。另外，我的python用的是chrome浏览器的chrome driver驱动，所以，如果浏览器有差异，请另安装驱动，相关代码如下：
安装

pip install selenium

下载浏览器驱动

火狐浏览器驱动，其下载地址是：https://github.com/mozilla/geckodriver/releases

谷歌浏览器驱动，其下载地址是：http://chromedriver.storage.googleapis.com/index.html

opera浏览器驱动，其下载地址是：https://github.com/operasoftware/operachromiumdriver/releases

对照自己电脑安装的浏览器和对应的版本，分别从上面的地址下载驱动文件，下载解压后，将所在的目录添加系统的环境变量中。当然你也可以将下载下来的驱动放到python安装目录的lib目录中，因为它本身已经存在于环境变量（我就是这么干的）。
使用python代码模拟浏览器行为

要使用selenium先需要定义一个具体browser对象，这里就定义的时候就看你电脑安装的具体浏览器和安装的哪个浏览器的驱动。这里以chrome浏览器为例，

<span>python爬取淘宝信息，第三方库批量安装</span>

EG：pip install requests OR

模拟打开B站首页

模拟滚动条滚动到底部

模拟自动搜索内容

最后爬取淘宝信息

以下是优化版

个人感觉扒评论比较有价值，可以调查一下大家买的都是什么型号这样子。

可是想写才发觉，今天周六，等有空再说吧。

全站热榜

EG：`pip install requests` OR