2018-05-14 21:48 东南大学产品经理

关注

如何处理反爬？

自己做了个爬虫，每次面试都会被问到反爬的问题，但是我用的webmagic爬取的过程中没有遇到过反爬这个问题（可能爬的比较少），想问问大家怎么处理反爬的情况（爬取大量数据），除了***ip，这个貌似不稳。

全部评论

推荐最新楼层

江山如画君

吉林大学 golang

1. 明确网站是对单位时间访问量还是一段时间内访问总量做限制 2. ip***池，轮询 3. 修改http头模拟浏览器访问 4. 从小到大逐步提高线程数目去探测网站的临界值

点赞回复分享

发布于 2018-05-14 23:29

给个offer养家糊口

红棉小冰_平台工程部门_Java开发

这个。。百度一搜一大把的吧。。

点赞回复分享

发布于 2018-05-14 22:03

阿喵喵萌萌哒

南京大学数据分析师

常见的就是换useragent+ip，ip验证有效过后再用，不稳定的情况具体看下，一般抓取失败的网页保存下来再次请求就好。一般建议降低请求次数，如果几天能够抓完应该也在可接受范围之内。

点赞回复分享

发布于 2018-05-14 22:42

上海电子信息职业技术学院 Java

速度不要太快啊多线程模拟随机时间一定不要太快了拉别人数据还要速度就真的。。

点赞回复分享

发布于 2018-05-14 23:16

二手牛仔裤

哔哩哔哩_Java高级研发工程师

好像有个叫布隆过滤器的结构专门处理反爬虫

点赞回复分享

发布于 2018-05-16 02:08

朱磊201805161402107

青岛科技大学 Java

***IP

点赞回复分享

发布于 2018-05-16 16:50

朱磊201805161402107

青岛科技大学 Java

分布式爬取，设置间隔时间

点赞回复分享

发布于 2018-05-16 16:51

11-27 11:29

小红书_社区技术部_前端开发(实习员工)

10.30字节一面

【再再再再再再再战字节，摆烂了，这次一面都没过（手撕做出来了前面还有几轮字节面试忘记录音了，就不记录了。1.自我介绍2.主要技术栈是3.是否了解react4.做题【建议下次做这种题目拿个草稿纸！！】 console.log('start'); setTimeout(() => { console.log('children2'); setTimeout(function() { console.log('children8'); }, 0) ; Promise.resolve().then(() => { console.log('chil...

查看16道真题和解析面经烤面筋

点赞评论收藏

分享

不愿透露姓名的神秘牛友

11-24 20:53

求校招Offer比较：阿里国际VS京东VS虾皮VS华为

Offer1：阿里国际,杭州,Java工程师,2.7k*16.0,sp, n * (13+3), toB广告部门，业务复杂CRUDOffer2：京东,北京,Java工程师,2.9k*19.0,sp，(n+2)*(12+2+5), 零售国际，薪资高Offer3：虾皮,深圳,Java工程师,1.5k*12.0,鸡架部门，池子，未开Offer4：华为,上海,Java工程师,2.6k*12.0,(n-2 ~ n) * (12+?)，计算产品线，晟腾，未开，做的内容感兴趣

投递阿里国际数字商业集团等公司10个岗位 >

点赞评论收藏

分享

10-07 23:57

已编辑

电子科技大学 Java

说给的多，没说给这么多呀

八街九陌：博士？客户端？开发？啊？

点赞评论收藏

分享

11-01 11:02

门头沟学院后端

终于到我捡漏啦！哈哈哈！11月要开始准备收割啦！

康8：是我疯了，还是大伙疯了

点赞评论收藏

分享

昨天 14:58

重庆邮电大学测试工程师

秋招结束！！！

终于还是给哥们泡出来啦！化身O孝子！！！终于可以休息啦！！！回顾一下流程：9.11：投递9.13：测评10.16：专业面试11.4：综合面试11.8：hr面试11.25：等了两周，周一看到offer排序啦11.26：晚上7点左右收到签约沟通会邮件11.27：下午参加签约沟通会11.28：收到录用通知书，秋招结束！只要不放弃，一定能找到合适的工作的！！！大家加油！！！不要放弃！！！

是天烛：！！！泡出来啦！泡出来啦！

不知道为什么，看到你终于拿到自己满意的offer我就是很感动

可能从看你有勇气拒唯一的海康开始，我就被你折服了

这真的是最好的结局！

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

正在热议

# 拼多多求职进展汇总 #

229859次浏览 2025人参与

# 哪些公司校招卡第一学历 #

32253次浏览 100人参与

# 阿里云管培生offer #

56945次浏览 1735人参与

# 25届秋招总结 #

390183次浏览 3895人参与

# ai智能作图 #

18316次浏览 236人参与

# 地方国企笔面经互助 #

6357次浏览 15人参与

# 北方华创开奖 #

65489次浏览 545人参与

# 硬件兄弟们甩出你的华为奖状 #

77509次浏览 624人参与

# 实习，投递多份简历没人回复怎么办 #

2433278次浏览 34687人参与

# 在职场上，你最讨厌什么样的同事 #

5477次浏览 78人参与

# 实习与准备秋招该如何平衡 #

721730次浏览 8542人参与

# 我的实习求职记录 #

6115122次浏览 83915人参与

# 工作中，你有没有遇到非常爱骂人的领导？ #

4591次浏览 46人参与

# 如果再来一次，你还会选择这个工作吗？ #

107578次浏览 1081人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

9584次浏览 200人参与

# 腾讯求职进展汇总 #

206942次浏览 1693人参与

# 实习想申请秋招offer，能不能argue薪资 #

35605次浏览 308人参与

# 牛客租房专区 #

4340次浏览 119人参与

# 中兴求职进展汇总 #

467575次浏览 2439人参与

# 华为工作体验 #

109877次浏览 855人参与

# 如果有时光机，你最想去到哪个年纪？ #

27393次浏览 569人参与

# 实习中的菜狗时刻 #

280438次浏览 2761人参与

牛客网
牛客企业服务