【爬虫学习笔记day02】1.爬虫原理与数据抓取+为什么要做网络爬虫?+网络爬虫是什么?+爬虫的更多用途+关于Python网络爬虫,我们需要学习的有什么
文章目录
1.爬虫原理与数据抓取
为什么要做网络爬虫?
首先请问:都说现在是"大数据时代",那数据从何而来?
企业产生的用户数据
:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数数据平台购买数据
:数据堂、国云数据市场、贵阳大数据交易所政府/机构公开的数据
:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、纳斯达克。数据管理咨询公司
:麦肯锡、埃森哲、艾瑞咨询爬取网络数据
:如果需要的数据市场上没有,或者不愿意购买,那么可以选择招/做一名爬虫工程师,自己动手丰衣足食。拉勾网Python爬虫职位
网络爬虫是什么?
爬虫的更多用途
- 12306抢票
- 网站上的头票
- 短信轰炸