Python秃头虫

2022-09-19 20:27 西安理工大学前端开发其它发布于广西

关注

python超简单爬虫教程

python超简单爬虫教程

python超简单爬虫教程
- 七大步骤：
- - - 4存储数据
      
      5数据可视化
      - 6数据分析
      7公司决策

python超简单爬虫教程

大家好！在这里给大家交流一下小编总结得python超简单爬虫教程，废话不多说，直接上代码

七大步骤：

1发送数据请求

2请求网站源码

3数据筛选

4存储数据

5数据可视化

6数据分析

7公司决策

完整代码如下：

import request
import re
import xlwt
#获取源码
def get_content(page):
	url = 'https://www.zhipin.com/c101010100-p100109/?page='+str(page)+'&ka=page-'+str(page)+''
	headers = {
		"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2727.400"
 	}
	req = request.get(url,headers=headers)
	req.encoding = 'utf-8'
	html = req.text
	return html 	
#筛选数据 获取满足正则表达式所爬去的目标
def get(html):
	reg = re.compile(r'class="job-tab".*?<div class="job-title">(.*?)</div>.*?<span class="red">(.*?)</span>.*?target="_blank">(.*?)</a>',re.S)
	item = re.findall(reg,html)
	return items
datalist = []
def saveDataToDatalist():
	for j in range(1,6)
		print('正在爬取第'+str(j)+'页数据内容。。。')
		html get_content(j)
		for i in get(html)
			data = []
			for j in range(0,5):
				data.append(i[j])
			datalist.append(data)
	return
#创建方法将datalist内容写入excel文件
def saveDataToExcel(savePath):
	book = xlwt.Workbook(encoding='utf-8',style_compression=0)
	sheet = book.add_sheet('boss',cell_overwrite_ok=Ture)
	col = ('职位','薪资','公司名称')
	for i in range(0,5)
		sheet.wirte(0,i,col[i])
	for i in range(0,len(0,len(datalist)):
		data = datalist[i]
		for j in range(0,5):
		sheet.wirte(i+1,j,data[j])
	book.save(savePath)
saveDataToDatalist()
saveDataToExcel('boss.xls')

就这样了，都看到这里了，点赞关注走一走吧，谢谢大家！

#Python##python爬虫##前端入门教程##技术##职场经验#

全部评论

推荐最新楼层

华南理工大学前端工程师

这个python好学不，难不难

点赞回复分享

发布于 2022-09-30 23:55 山西

重庆工程学院 Python

这种不太难，真正的爬虫是逆向

点赞回复分享

发布于 2022-11-30 00:42 重庆

胖墩墩的大白菜在写面经

重庆工程学院 Python

不涉及逆向。很多东西都爬不到

点赞回复分享

发布于 2023-01-16 23:48 上海

11-22 16:57

明源云_财务管培生(准入职员工)

明源云内推明源云面经

面经：面试官让我先简单自我介绍一下，然后问我学习经历中有没有遇到过难以解决的问题，当时具体是遇到了什么样的困难，我做了什么努力最后化解了这个困难，然后我把我在学校搞比赛遇到的一些专业知识在实操过程中遇到的困难说了一下，提到了盈亏平衡点这个概念，然后她就立马追问我是怎么解决盈亏平衡点这个问题的，包括当时我作为这个项目的财务负责人我是怎么向其他团队成员说明帮助他们更好的理解这个概念的，然后我又简单说了一下，然后这个小点才算过去。后面又问了一些对于企业的了解啊还有一些心理方面的问题明源云25届校招11月持续中，速来网申关于我们：明源云诞生于1997年，2020年于香港联交所主板上市，是不动产行业数字...

点赞评论收藏

分享

不愿透露姓名的神秘牛友

11-21 17:16

求帮选校招Offer：科大讯飞、金山办公

科大讯飞算法工程师 28.0k*14.0, 百分之三十是绩效，惯例只发0.9

点赞评论收藏

分享

09-30 12:39

门头沟学院 C++

简历挂的离谱

真离谱啊，在这个公司这个岗位实习半年，秋招竟然直接简历挂！！！

去B座二楼砸水泥地：海康威视不相信眼泪

点赞评论收藏

分享

11-19 12:10

湖南财政经济学院 Java

ACM金牌找不到工作

这种人到底是什么心理？ #牛客创作赏金赛# #我的求职思考# #双非本#

我已成为0offer的糕手：给我五毛我能吹的比他还离谱

牛客创作赏金赛我的求职思考

点赞评论收藏

分享

11-22 16:49

已编辑

北京邮电大学 Java

offer帮选，顺便求问oppo测开强度

美团质效，测开 n*15.5

点赞评论收藏

分享

评论

5

6

招聘动态

字节跳动

2025校园招聘

阿里云管培生

2025届校园招聘

快手Star

2025届招聘

快手

销售类投递专区

富士通（西安）

2025校园招聘

全站热榜

正在热议

# 25届秋招总结 #

376161次浏览 3734人参与

# 如果再来一次，你还会选择这个工作吗？ #

100780次浏览 1015人参与

# 北方华创开奖 #

64538次浏览 503人参与

# 地方国企笔面经互助 #

6009次浏览 14人参与

# 简历被挂麻了，求建议 #

2524318次浏览 33455人参与

# 发工资后，你做的第一件事是什么 #

4615次浏览 19人参与

# 阿里云管培生offer #

46133次浏览 1376人参与

# ai智能作图 #

10932次浏览 174人参与

# 我的实习求职记录 #

6104081次浏览 83826人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

8759次浏览 179人参与

# 上班到公司第一件事做什么？ #

14567次浏览 164人参与

# 阿里求职进展汇总 #

71791次浏览 780人参与

# 如何写一份好简历 #

615778次浏览 8700人参与

# 听到哪句话就代表面试稳了or挂了？ #

96703次浏览 810人参与

# 还记得你第一次面试吗？ #

29498次浏览 416人参与

# 华为工作体验 #

109358次浏览 852人参与

# 面试体验感最好的是哪家？ #

91529次浏览 921人参与

# 网易求职进展汇总 #

38877次浏览 334人参与

# 如果有时光机，你最想去到哪个年纪？ #

27027次浏览 559人参与

# 腾讯求职进展汇总 #

205529次浏览 1687人参与

# 硬件兄弟们甩出你的华为奖状 #

75703次浏览 612人参与

# 上班苦还是上学苦呢？ #

106699次浏览 865人参与

牛客网
牛客企业服务