Python秃头虫

2022-09-19 20:27 西安理工大学前端开发其它发布于广西

关注

python超简单爬虫教程

python超简单爬虫教程

python超简单爬虫教程
- 七大步骤：
- - - 4存储数据
      
      5数据可视化
      - 6数据分析
      7公司决策

python超简单爬虫教程

大家好！在这里给大家交流一下小编总结得python超简单爬虫教程，废话不多说，直接上代码

七大步骤：

1发送数据请求

2请求网站源码

3数据筛选

4存储数据

5数据可视化

6数据分析

7公司决策

完整代码如下：

import request
import re
import xlwt
#获取源码
def get_content(page):
	url = 'https://www.zhipin.com/c101010100-p100109/?page='+str(page)+'&ka=page-'+str(page)+''
	headers = {
		"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2727.400"
 	}
	req = request.get(url,headers=headers)
	req.encoding = 'utf-8'
	html = req.text
	return html 	
#筛选数据 获取满足正则表达式所爬去的目标
def get(html):
	reg = re.compile(r'class="job-tab".*?<div class="job-title">(.*?)</div>.*?<span class="red">(.*?)</span>.*?target="_blank">(.*?)</a>',re.S)
	item = re.findall(reg,html)
	return items
datalist = []
def saveDataToDatalist():
	for j in range(1,6)
		print('正在爬取第'+str(j)+'页数据内容。。。')
		html get_content(j)
		for i in get(html)
			data = []
			for j in range(0,5):
				data.append(i[j])
			datalist.append(data)
	return
#创建方法将datalist内容写入excel文件
def saveDataToExcel(savePath):
	book = xlwt.Workbook(encoding='utf-8',style_compression=0)
	sheet = book.add_sheet('boss',cell_overwrite_ok=Ture)
	col = ('职位','薪资','公司名称')
	for i in range(0,5)
		sheet.wirte(0,i,col[i])
	for i in range(0,len(0,len(datalist)):
		data = datalist[i]
		for j in range(0,5):
		sheet.wirte(i+1,j,data[j])
	book.save(savePath)
saveDataToDatalist()
saveDataToExcel('boss.xls')

就这样了，都看到这里了，点赞关注走一走吧，谢谢大家！

#Python##python爬虫##前端入门教程##技术##职场经验#

全部评论

推荐最新楼层

胖墩墩的大白菜在写面经

重庆工程学院 Python

不涉及逆向。很多东西都爬不到

点赞回复分享

发布于 2023-01-16 23:48 上海

重庆工程学院 Python

这种不太难，真正的爬虫是逆向

点赞回复分享

发布于 2022-11-30 00:42 重庆

华南理工大学前端工程师

这个python好学不，难不难

点赞回复分享

发布于 2022-09-30 23:55 山西

12-18 17:44

浙江大学 Java

Elasticsearch中，什么是停顿词过滤？

图解Elasticsea...

点赞评论收藏

分享

12-17 14:09

浙江大学全栈开发

介绍一下Java的泛型。

图解Java基础-牛客面...

点赞评论收藏

分享

11-26 13:03

已编辑

西安交通大学算法工程师

不面试直接发offer是可能的

暑期实习拿到了某家大厂没去，秋招没投这家。10月份的时候hr打电话说。说暑期评价非常高，可以只面一场来发offer，我说ok的。结果又过了一周没什么消息，我以为说说而已。这两天call我说不用面了，直接看邮箱有offer，又是股票又是签字费的，总包60+，如图上次短信还是四月的面试邀请。ps：最后拒了，选了字节，只能说良心有点不安了。

蛀虫害虫：强的我害怕

点赞评论收藏

分享

12-01 11:47

已编辑

广东海洋大学 Java

标题五个字

这就是Boss直聘原本的样子，任何职业都可以在上面找到自己的岗位，包括技术间谍。

如何用一句话描述你的职业

点赞评论收藏

分享

12-19 18:00

北京理工大学珠海学院数据分析师

2025入职游戏运营具体情况

从我3月份入职，居然已经年底了，那就写一下我入职公司的面试情况吧......🕐面试公司：不到100人的游戏发行公司💻面试岗位：数据分析师（实际进去后是在运营部干活，相当于数据运营工作）先来说一下我自己的bg：学院本软工女大数据方向，大学学的做的都很简单，包括爬虫、机器学习和数据挖掘，SQL之类的，基本上是没有学过真正数据分析要学的东西的（如：留存率、LTV之类的）。游戏数据分析的知识是面试前一个星期恶补的。之所以来面这个公司，还是因为亲戚推荐简历给了我们老板（简历还是面向Python岗写的.....），因为简历上写着日语n3和会数据分析，老板让HR联系我直接进入电话面试环节了....一开始...

2025年终总结

点赞评论收藏

分享

评论

5

6

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 2025年终总结 #

148464次浏览 2525人参与

# 秋招落幕，你是He or Be #

3342次浏览 76人参与

# 应届生进小公司有什么影响吗 #

109148次浏览 1116人参与

# 比亚迪工作体验 #

70251次浏览 254人参与

# 你面试体验感最差/最好的公司 #

3224次浏览 56人参与

# 工作中听到最受打击的一句话 #

2649次浏览 61人参与

# 大厂VS公务员你怎么选 #

71376次浏览 660人参与

# 重来一次，你会对开始求职的自己说 #

3096次浏览 71人参与

# 一人说一个提前实习的好处 #

3535次浏览 71人参与

# 团建是“福利”还是是 “渡劫” #

4125次浏览 110人参与

# 实习没事做是福还是祸？ #

8511次浏览 135人参与

# 如何排解工作中的焦虑 #

244046次浏览 2241人参与

# 从顶到拉给所有面过的公司评分 #

144830次浏览 518人参与

# 今年你最想重开的一场面试是？ #

1484次浏览 25人参与

# 你小心翼翼的闯过多大的祸？ #

7079次浏览 109人参与

# 联影求职进展汇总 #

123869次浏览 781人参与

# OPPO求职进展汇总 #

755967次浏览 5390人参与

# 互联网公司爆料 #

158626次浏览 724人参与

# 产品实习，你更倾向大公司or小公司 #

189147次浏览 2053人参与

# 秋招结束之后的日子 #

113928次浏览 1039人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务