张立梵

2022-08-18 17:08 江西科技职业学院设计发布于安徽

关注

网络爬虫与 http+ssl（1）

端口

查看 IP 的方式：打开命令行输入 cmd，然后在端口中输入 ipconfig，可以看到 IP 地址

端口号 mysql 3306 mongodb 27017 nosql，端口号为独立标识

通讯协议

TCP 通信协议/IP 协议/Robot 协议（规定爬虫不能爬取这个协议的文件）在 srapy 框架

超文本传输协议，端口 80（HTTP 协议）设置—网络—属性—看到已安装的协议，可以在这里添加新的协议

osm 模型

⽬标 Objective；策略 Strategy；衡量指标 Measurement

OSM 模型，就是把宏⼤的⽬标拆解，对应到部门内各个⼩组具体的、可落地、可度量的⾏为上，从保证执⾏计划没有偏离⼤⽅向。

封包与解包的过程

http 访问更快因为是明文传输就是不需加密，国家税务总局就是 http，是没有加证书的

https=http+ssl 为加密的过程，是一个安全版的访问过程，是加了证书的

HTTP 请求与响应

客户端的请求与进行与服务器的请求与进行，个人手机电脑是客户端

全球统一资源定位符（URL）

html 文件，学了前端才能看懂源代码，网页会根据 HTML

css 文件处理格式，位置

js 处理跳转，点击事件，动画效果，走马灯

images 文件，图片存放点

（F12 弹出抓包工具）

（Ctrl+u 页面源码）

抓包工具

elements 元素

console 控制台，js 语法（全称 javascript）

sources 资源（js 解密用）

network 网络数据包 XHR 动态加载

这个如果是动态页面这个 request 就要使用 Ajax 请求动态加载 json 文件数据（Ajax 异步加载）静态页面的网页都在源代码中。

爬虫就是模拟人去访问浏览器，避免让系统默认为自动化的爬虫程序

general 全部的请求头

response headers 服务器的是交投

request headers 请求对象的请求头客户端的请求

host 主机和端口号

user—agent 标识，如果不带服务器，会认为你是一个自动化的爬虫程序

cookie 有时间限制（动态）记录用户信息

referer 副级的 URL

请求方式

GET 请求（用于向服务器查询某些信息）

POST 请求（数据隐藏）Payload—form data 隐藏的数据，百度翻译为 post 请求

红点

stop recording network log 停止记录网络日志

clear，清空网络日志

preserve log，保留日志

disable cache 禁用缓存（js 逆向需要进行调试用）

#python爬虫#

全部评论

推荐最新楼层

蔓越莓饼饼

电子科技大学后端

就很羡慕会爬虫的

点赞回复分享

发布于 2022-08-30 21:44 陕西

02-16 22:03

湘潭大学项目经理

SHEIN的迁移与无奈

日前，因杭州宇树科技、DeepSeek的“六小龙”企业崛起，不少地方开始反思，为什么本地没有留住创始人，或者发展出类似的企业。例如DeepSeek创始人梁文锋和Kimi创始人杨植麟都是广东人，但都在其他地区创业成功。而还有媒体三连发问，为什么同在长三角，杭州却能有DeepSeek和六小龙？这也牵扯出一些陈年往事。有博主回忆道，其实南京曾经有过一家现在可称为巨头的企业。快时尚行业的全球知名公司SHEIN（希音）就出自南京。不过SHEIN的迁移行动却开始得更早和更复杂。据自媒体@奔流财经社复盘，SHEIN2008年在南京创立，公开消息显示当时其创始人许仰天等人共同创立南京点唯信息技术有限公司，最初...

点赞评论收藏

02-14 16:31

电子科技大学 Java

导师约我情人节见面

他是不是要给我表白啊啊啊啊啊啊啊啊啊啊！！！！

Yki_：又疯一个

点赞评论收藏

02-13 17:05

菏泽学院嵌入式硬件工程师

24届女生，感觉考研二战要失败，急需大佬指点！🥺🥺🥺

穿件外套出门：这简历一眼太水了，前面有的没的直接删，写项目亮点

点赞评论收藏

01-16 20:22

北京邮电大学硬件开发

释放小米offer

手机部

小狗吃臭臭：以后用不到你设计的手机了，可惜！

点赞评论收藏

02-16 13:03

腾讯_大数据高性能开发(准入职员工)

腾讯内推腾讯面经

腾讯 微信后端 一二三面面经由于一二三面都是同一周进行的（具体业务部门暂不和牛友说啦），所以当时也没时间进行回顾，现在进行简要的回顾，不一定详细但尽可能把大致方向说一下一面：写题＋八股写题为一个给个文档，用IDE写完了粘贴进去。（题量不少2-3题左右，限时半小时，但无难题）八股：以计算机网络和操作系统为主，穿插问问一些实际的问题主要是：TCP 握手挥手，网络IO模型之类的，CPP的部分简单问题等，大家在牛客上都见过，都是常规的问题，实际的问题就是问Linux的一些命令和实际场景下怎么组合使用二面：写题＋项目同样起手一个文档，写题（都不是难题）项目深入的聊，整体流程，为什么这么设计，为什么不使用...

点赞评论收藏

招聘动态

400+企业岗位投递合集

京东 TET管培生

全站热榜

创作者周榜

正在热议

# 听劝，这个简历怎么改 #

14178次浏览 183人参与

# 面试被问“你的缺点是什么?”怎么答 #

# 参加完秋招的机械人，还参加春招吗？ #

27089次浏览 276人参与

# 读研or工作，哪个性价比更高？ #

26229次浏览 356人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

# 简历无回复，你会继续海投还是优化再投？ #

# 22届毕业，是读研还是拿外包offer先苟着 #

4656次浏览 27人参与

# 秋招感动瞬间 #

11963次浏览 105人参与