Python(学习笔记—网络爬虫)
Python网络爬虫(学习笔记)——First Day——初识爬虫
这篇呢作为学习笔记吧,应该不是太官方的
那就开始吧,不太正式,就不注重格式了
一、引言
首先我们应该想这么个问题,学Python的目的是什么,最近我们开了python这门课,有好多同学的学习方法我感觉出了问题,有的同学问我怎么学,说实在我也不知道,因为我也是新手,C语言也是刚及格,菜鸡一枚。但是就我自己而言,python可能会不同于C,由于python的运行速度是比C要慢的,所以python并不是一个太看重算法的语言(个人理解),这就导致了一个问题:刷题有用吗?我的回答是:当然有用,但是如果你想锻炼你的算法能力的话,不如去刷C语言的题,因为它更加复杂,所有的函数更加的少,可以更好的培养你的思维。(好像跑题了)算了不重要了,我最近在GitHub里找到一个很好地学习python的项目可供参考:
https://github.com/jackfrued/Python-100-Days
可以参考一下,毕竟访问量还是挺多的
二、正文
(一)什么是爬虫
嗯嗯正文到了!
所以,网络爬虫到底是什么呢
通俗的解释就是:你把内个网站上面的东西扣下来自己用。
如果再文明一点的话那就是:请求网站并提取数据的自动化程序
(二)爬虫的基本流程
一般的爬虫是分为四步的
发起请求—>解析内容—>获取相应内容—>保存数据
这是一个大致上的流程,具体的一些比较细致的流程咱们下次再说
三、结尾
由于这可能是篇水文,就不往外发了,你们几个看到就好了,莫喷,后期会有干货