胡思乱想的新手牛

04-28 10:37 门头沟学院前端工程师发布于湖南

关注

爬虫的这些东西你知道吗

#牛客创作赏金赛##牛客激励计划#今天上级跟我说之前做的一个项目需要优化，大概问题就是从网页上打开项目源代码，源代码前面有很多css代码，他说这样不利于爬虫，别人搜我们的网站上的东西就会搜不到，因为爬虫有字数限制，前面的css太多，主要的content就会爬不到了，让我去优化一下这个bug，感觉很新奇他说爬虫的时候，之前略有了解，今天特意去重新搜了一下关于爬虫的知识，欢迎各位牛爷爷牛奶奶牛婶婶牛叔叔牛哥哥牛姐姐来评论区交流！！！！

1.核心：偷数据但别被抓

2.步骤：
a. 模拟“人”的行为上网

假装是浏览器（设置 User-Agent，告诉网站“我是 Chrome 浏览器”）。
像人一样操作：比如自动点击按钮、下拉滚动条。
b.破解网站的“防盗门”

代理 IP 池
验证码--OCR 识别（让机器“看图识字”）--花钱雇人（打码平台）--行为验证（滑块、点选）
c.动态加载 (抓取网页，但发现数据是空的，因为内容是通过 JavaScript 动态生成的)

控制浏览器加载页面，等 JS 执行完抓取数据
找到网页和服务器通信的 API 接口，直接请求接口获取数据。

3.爬虫与前端结合：
动态内容爬取（核心：找到返回数据的 API 接口，并模拟请求（携带正确的参数和 Headers））

补充：为什么网页内容需要 JavaScript 异步加载？
传统网页：服务器一次性返回所有 HTML、CSS、JS 和数据，导致首屏加载慢。

异步加载：先返回基础的 HTML 骨架（比如顶部导航栏），再通过 JavaScript 动态请求数据，用户能更快看到部分内容。
类比：外卖平台先显示店铺列表（骨架），等你点击店铺后，再加载菜单（异步数据）。

全部评论

推荐最新楼层

04-08 20:12

哔哩哔哩_游戏算法工程师(准入职员工)

哔哩哔哩内推bilibili内推

不知不觉已经在哔哩实习马上一年了，实话实说哔哩实习的体验感真的蛮好的，今年也成功在哔哩顺利转正，拿到正式的offer了。 首先是实习强度💢 ，这块哔哩确实挺好的，实习的时候组内的大佬都不内卷，每天各自完成自己的工作就能下班回家啦，每天晚上8点半可以拿免费的加班餐，9点半能免费打车回家（我住的近，根本用不到） 🫶️ 团队氛围这块真的没话说，团队内的大佬都很乐意帮助我快速成长，犯错的时候，及时找mentor沟通，mentor真的无所不能，而且还会给自己许多思考的空间 公司还有免费的健身房可以锻炼，我今天从五月份到9月份和同事一起去健身房锻炼已经减掉15斤了，而且最近一段时间又新换了一批设备 哔...

哔哩哔哩公司福利 357人发布

点赞评论收藏

分享

04-28 10:34

邵阳职业技术学院后端

找实习需要几个项目啊

我只有一个管理端项目（上线），还有一个是抄的网上的项目，能找到实习吗

点赞评论收藏

分享

04-18 16:43

门头沟学院算法工程师

1、问项目推荐算法是自己实现的吗如何处理特征YouTubeDNN如何把回归问题转化为分类问题Faiss加速的原理还有哪些加速算法2、问实习一lstm是否有多元输入cnn经过maxpooling后特征不连续，如何处理激活函数的作用如何解决过拟合欠拟合如何解决过梯度消失梯度爆炸正则化的作用还了解哪些机器学习模型，介绍一下原理3、问实习二LoRA微调的原理是什么为什么能减少参数，提高效率4、代码求根号（自己写函数）条件概率手撕梯度下降

点赞评论收藏

分享

04-02 13:50

无锡高等师范学校 Web前端

暑期实习前端美团 or 京东

投票

京东云面试官感觉很好，很开放尊重的感觉，在北京美团深圳好，境外业务部我也喜欢，之后能看看外企，但是好像工资低PS：我的眼光可能不够长远，想看看大家的想法，因为不太了解公司的加班强度，薪资构成这些，求建议🙏

投递美团等公司8个岗位

点赞评论收藏

分享

04-02 14:45

韶音科技_电子工程师(准入职员工)

韶音科技内推

韶音科技-嵌入式面经韶音给我的感受还是很不错的，分享一手面经一面-hr面-30分钟主要聊聊家常，问题都比较常规吧，真诚回答就行二面-专业面-30分钟自我介绍想聊一聊哪个项目？项目是如何进行通信的？有哪些措施来保证数据的可靠性？讲一讲CRC校验讲一讲你了解的linux操作系统项目能实现哪些功能？多线程开发需要注意些什么？遇到哪些困难？为什么选择嵌入式开发方向？反问原本想去营销做数据分析岗的 但还是水平差点 所幸我被产品hr姐姐捞了 两轮面试很快 半天就给了offer · 入职有leader哥哥姐姐一对一带教 项目制创造性工作 非常合我的胃口 而且同事们也很友善 团队氛围也很好 每周的分享会都有说...

韶音科技二面86人在聊

点赞评论收藏

分享

评论

点赞

1

招聘动态

26届实习软件笔试必刷题单

26届实习求职交流群

字节跳动Tik Tok

26届实习招聘

26届投递链接合集

快手

25届补录+26届实习

字节跳动-Tik Tok

26届实习生招聘

25届春招专场

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 找工作，行业重要还是岗位重要？ #

6520次浏览 84人参与

# 盲审过后你想做什么？ #

12225次浏览 107人参与

# 五一之后，实习真的很难找吗？ #

43788次浏览 311人参与

# 领导秒批的请假话术 #

9414次浏览 72人参与

# 安克创新求职进展汇总 #

32436次浏览 412人参与

# 如果不工作真的会快乐吗 #

100778次浏览 860人参与

# 每人推荐一个小而美的高薪公司 #

72786次浏览 1357人参与

# 京东工作体验 #

12927次浏览 90人参与

# 五一假期，你打算“躺”还是“卷”？ #

24272次浏览 386人参与

# 考研可以缓解求职焦虑吗 #

20274次浏览 241人参与

# 如何缓解入职前的焦虑 #

171504次浏览 1267人参与

# 面试等了一周没回复，还有戏吗 #

115106次浏览 1072人参与

# 找工作前vs找工作后的心路变化 #

7072次浏览 64人参与

# 应届生薪资多少才合理？ #

3021次浏览 24人参与

# 写简历别走弯路 #

713951次浏览 7848人参与

# 你喜欢工作还是上学 #

37217次浏览 407人参与

# 如果有时光机，你最想去到哪个年纪？ #

43142次浏览 765人参与

# 牛友们的论文几号送审 #

27105次浏览 622人参与

# 扒一扒那些奇葩实习经历 #

41400次浏览 770人参与

# 24届的你们现状如何了？ #

64451次浏览 377人参与

牛客网
牛客企业服务