Python秃头虫

2022-09-19 20:27 西安理工大学前端开发其它发布于广西

关注

python超简单爬虫教程

python超简单爬虫教程

python超简单爬虫教程
- 七大步骤：
- - - 4存储数据
      
      5数据可视化
      - 6数据分析
      7公司决策

python超简单爬虫教程

大家好！在这里给大家交流一下小编总结得python超简单爬虫教程，废话不多说，直接上代码

七大步骤：

1发送数据请求

2请求网站源码

3数据筛选

4存储数据

5数据可视化

6数据分析

7公司决策

完整代码如下：

import request
import re
import xlwt
#获取源码
def get_content(page):
	url = 'https://www.zhipin.com/c101010100-p100109/?page='+str(page)+'&ka=page-'+str(page)+''
	headers = {
		"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2727.400"
 	}
	req = request.get(url,headers=headers)
	req.encoding = 'utf-8'
	html = req.text
	return html 	
#筛选数据 获取满足正则表达式所爬去的目标
def get(html):
	reg = re.compile(r'class="job-tab".*?<div class="job-title">(.*?)</div>.*?<span class="red">(.*?)</span>.*?target="_blank">(.*?)</a>',re.S)
	item = re.findall(reg,html)
	return items
datalist = []
def saveDataToDatalist():
	for j in range(1,6)
		print('正在爬取第'+str(j)+'页数据内容。。。')
		html get_content(j)
		for i in get(html)
			data = []
			for j in range(0,5):
				data.append(i[j])
			datalist.append(data)
	return
#创建方法将datalist内容写入excel文件
def saveDataToExcel(savePath):
	book = xlwt.Workbook(encoding='utf-8',style_compression=0)
	sheet = book.add_sheet('boss',cell_overwrite_ok=Ture)
	col = ('职位','薪资','公司名称')
	for i in range(0,5)
		sheet.wirte(0,i,col[i])
	for i in range(0,len(0,len(datalist)):
		data = datalist[i]
		for j in range(0,5):
		sheet.wirte(i+1,j,data[j])
	book.save(savePath)
saveDataToDatalist()
saveDataToExcel('boss.xls')

就这样了，都看到这里了，点赞关注走一走吧，谢谢大家！

#Python##python爬虫##前端入门教程##技术##职场经验#

全部评论

推荐最新楼层

胖墩墩的大白菜在写面经

重庆工程学院 Python

不涉及逆向。很多东西都爬不到

点赞回复分享

发布于 2023-01-16 23:48 上海

重庆工程学院 Python

这种不太难，真正的爬虫是逆向

点赞回复分享

发布于 2022-11-30 00:42 重庆

华南理工大学前端工程师

这个python好学不，难不难

点赞回复分享

发布于 2022-09-30 23:55 山西

03-24 14:18

已编辑

1天1个项目介绍｜对话式RAG Agent

想做AI项目但不知道从哪入手？今天给大家推荐一个非常适合入门+简历包装的开源项目：Agentic RAG for Dummies。 这个项目是干嘛的？ 简单说就是一个能对话、能检索、能自我纠错的智能问答 Agent。你给它喂一堆文档（比如 PDF），它就能根据文档内容跟你聊天，而且还会：  记住上下文，多轮对话不断片 遇到模糊问题会反问你，不瞎答 检索不到好结果会自动重试 复杂问题拆成小问题并行查，再汇总回答  技术栈：LangGraph + Qdrant向量库 + HuggingFace嵌入 + 支持Ollama/OpenAI/Claude多种LLM 怎么做？手把手教你 第一步：环境准备 g...

点赞评论收藏

分享

03-27 08:29

蚌埠坦克学院嵌入式软件开发

荣耀嵌入式软件一面，底层问得很深，差点被问哑

投的是荣耀终端的嵌入式软件开发岗，方向是 RTOS 和底层驱动。一面是视频面试，面试官是个做底层系统的工程师，上来自我介绍完直接开始问技术，没有任何寒暄。整体风格是问得不多但每道都很深，基本上你答完他会继续追问细节，答不上来他会换个角度再问，感觉是在摸你的知识边界。RTOS 相关的问题占了将近一半，MCU 底层和驱动也问了不少，C++ 只问了一道但追问了很久。总时长大概五十分钟，底层基础不扎实的话会很难受。1. RTOS 的任务调度器是怎么工作的？抢占式调度和时间片轮转的区别是什么，FreeRTOS 里是怎么实现的？答：任务调度器的核心职责是决定在任意时刻哪个任务占用 CPU。调度器维护一个就...

嵌入式面试八股文全集

点赞评论收藏

分享

03-10 17:03

太原科技大学嵌入式软件开发

我觉得我经历很丰富啊，为什么在西安只有7k😭

点赞评论收藏

分享

03-05 12:11

已编辑

西南交通大学 C++

27届简历求拷打

刚刚丢了简历过去tx提前批，燃尽了😓感觉这年头保研考研考公都难。今晚海投看看能不能刷点经验，八股一点没看。冲冲冲。

提前批简历挂麻了怎么办

点赞评论收藏

分享

03-25 18:47

北京外国语大学平台产品

春招/暑期实习就投这些！

447家互联网公司在招AI岗！

找AI工作可以去哪些公司...

点赞评论收藏

分享

评论

5

6

招聘动态

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

米哈游2026校园招聘

应届生春招&全年实习生专项

新华三

2026届春季校园招聘

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

27届校招宝典

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

2701次浏览 30人参与

# 金融银行求职进展汇总 #

329003次浏览 1785人参与

# 厦门银行科技岗值不值得投 #

11181次浏览 276人参与

# 大厂实习和小厂实习最大的区别是什么？ #

10369次浏览 73人参与

# AI Coding实战技巧 #

1189次浏览 38人参与

# 如果人生可以debug你会改哪一行? #

1863次浏览 49人参与

# 招商银行数字金融训练营 #

42730次浏览 613人参与

# 你都用vibe coding做过什么？ #

1430次浏览 52人参与

# Vibe Coding 会干掉初级岗位吗？ #

3144次浏览 71人参与

# 你见过哪些招聘隐形歧视？ #

1879次浏览 28人参与

# 做完笔试后你收到面试了吗？ #

2914次浏览 40人参与

# 面试被问到不会的问题，你怎么应对？ #

2347次浏览 22人参与

# 牛友の3月总结 #

6807次浏览 66人参与

# 你现在一天AI几次？ #

1016次浏览 39人参与

# 选完offer后，你后悔学本专业吗 #

66459次浏览 262人参与

# 实习学到最有价值的工作习惯 #

66755次浏览 541人参与

# 哪些公司真双非友好？ #

71150次浏览 305人参与

# 七猫笔试 #

5623次浏览 37人参与

# 快手工作体验 #

321248次浏览 2930人参与

# 找AI工作可以去哪些公司？ #

23000次浏览 1010人参与

# 金三银四，你的春招进行到哪个阶段了？ #

26233次浏览 305人参与

# 从事AI岗需要掌握哪些技术栈？ #

18430次浏览 1127人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务