2022-08-17 10:04 湖南师范大学 Java 发布于湖南

关注

大型电商网站详情页是如何支撑亿级流量访问的？

前言

我们小伙伴们在访问淘宝、网易等大型网站时有没有考虑到，网站首页、商品详情页以及新闻详情页面是如何处理的？怎么能够支撑这么大流量的访问呢？

很多小伙伴们就会提出他们都采用了静态化的方案，这样用户请求直接获取静态数据html，就不需要访问数据库了，性能就会大大提高；而且提高网站SEO优化。

那今天就带着大家聊一下静态化。把之前工作场景中静态化方案遇到的问题，以及如何演变的，分享给小伙伴。

方案一：网页静态HTML化

这个方案是最早使用的方案，我们就拿CMS系统举例，类似网易的新闻网站

核心流程图:

上图的核心思想：

管理后台调用新闻服务创建文章成功后，发送消息到消息队列
静态服务监听消息，把文章静态化，也就是生成html文件
在静态服务器上面安装一个文件同步工具，此工具的功能可以做到只同步有变动的文件，即做增量同步
通过同步工具把html文件同步到所有的web服务器上面

这样的话就达到了，用户访问一些变化不大的页面时，是直接访问的html文件，直接在web服务器那边直接返回，不需要在访问数据库了，系统吞吐量比较高。

这个方案的问题：

1、网页布局样式僵化，无法修改

如果产品经理觉得新闻详情页面的布局要调整一下，现在的不够美观，或者加个其他模块，那就坑爹了

我们需要把所有的已经静态html化的文章全部重新静态化。这个是不现实的，因为像网易这么大的体量，新闻量是很大的，会被搞死。

2、页面会出现暂时间不一致

会出现用户刚刚再看最新的新闻，刷新一下又不存在了。这个是因为同步工具在同步到web服务器是要有时间的，同步到web服务器A上面了，但web服务器B还没有来得及同步。

用户在访问的时候通过 nginx进行负载均衡，随机把请求分配给web服务器的导致的。当然可以调整nginx负载均衡策略去解决。

3、Html文件太多，无法维护

这个是很明显的问题，html文件会越来越多，对存储空间要求很大，而且每台web服务器都一样，浪费磁盘空间；将来迁移维护也会带来很大的麻烦。

4、同步工具的不稳定

因为文件一旦多之后，同步工具稳定性就出现了问题

这个方案应该是比较传统的（不推荐）

方案二：伪静态化

什么是伪静态？

一般我们可以采用nginx对url进行rewrite。小伙伴如何有兴趣可以自行了解，比较简单。之所以是伪静态其实也是需要动态处理的。

针对方案一上面问题，方案进一步的演化，如下图：

此方案的核心思想

管理后台调用新闻服务创建文章成功后，发送消息到消息队列
缓存服务监听消息，把文章内容缓存到缓存服务器上面
用户发起请求，web服务器根据id，直接查询缓存服务器
获取数据返回给用户

此方案就解决了方案一的一个大问题，就是html文件多的问题，因为不需要生成html，而且用缓存的方式，解决不需要访问数据库，提升系统吞吐量。

不过此方案的问题：

网页布局样式维护成本比较高，因为此方案照样是把所有的内容放到了缓存中，如果需要修改布局，需要重新设置缓存。
分布式缓存压力比较大，一旦缓存故障就导致所有请求会查询数据库，导致系统崩溃

还有个小问题，就是实时数据处理，就是页面中如价格，库存需要到后台读取的。

当然小伙伴也许就会说，也可以处理啊，用户把商品内容请求到后，然后在用浏览器发送异步的ajax请求获得商品数量就好了啊。这样就是无形的增加了一次请求。（此问题可以忽略）

此方案类似很多公司都在使用，如：同程旅游等

方案三：布局样式模板化

针对方案二的问题，我们可以采用openresty技术方案进行，利用http模板插件lua脚本进行解决

如下图：

这里说明一下上图中我们小伙伴不需要全部都要了解，这个是比较全的商品详情页的解决方案，涉及到了三级缓存这个概念

我们主要看的是上面怎么会有两层ngnix，分发层和应用层，这个是什么意思？

应用层nginx

应用层nginx是什么意思？nginx一般被用做负载均衡，其实nginx还有很多的功能，尤其他的openresty扩展 + lua脚本语言结合起来可以完成很多功能

小伙伴可以理解为lua脚本语言就是类似java语言，可以动态处理业务，如：本地缓存处理，远程http访问，访问redis等。

应用层nginx就是利用了http模板 + 缓存通过lua脚本完成的网页渲染

http模板

应用层nginx通过lua脚本语言先获取本地商品数据，然后和http模板进行渲染，形成最终商品详情页返回给用户
如果应用层nginx本地的缓存没有此商品数据，就通过lua脚本发起http请求访问web服务器，获取商品数据。
web服务器会向redis或本机的ehcache请求商品数据（这里涉及三级缓存概念），如果存在此商品数据，直接返回给用户；如果不存在则请求微服务访问数据库

这个思路就是通过http模板，解决了方案二中的布局样式的问题，如果需要调整布局，只要改一下模板就行了，非常方便。也解决了实时性问题。

这边涉及到的nginx本地缓存其实就是为了保证不需要访问数据库，提升系统吞吐量。小伙伴只要了解一下思路，如果不了解openresty和lua可以自行上网了解

分发层ngnix

为什么上面还有一层分发层呢？这个是因为大型网站的商品数太多了，应用层nginx的本地缓存是有限的，不可能把所有的商品数据缓存在同一个服务器的本地缓存

一台应用层nginx只能缓存部分商品数据，说到这里小伙伴是不是应该就知道为什么了吧？就是利用hash一致性算法，根据商品id路由分发到同一个应用层ngnix服务器。

分发层ngnix的作用就是 hash策略的负载均衡，保证了商品id路由到固定的应用层服务器。

三级缓存保证了系统的稳定性，即使redis缓存崩溃，还有其他2个缓存保障。

总结：

方案三是比较完整的方案，很多大厂都在使用，能够承受亿级流量，但系统比较复杂。
如果对实时性要求不高，布局样式调整不频繁，可以考虑方案二，系统比较简单

#java##互联网#

全部评论

推荐最新楼层

曼城雨季

北京工业大学 C++

特别佩服这些电商，双11仍然杠杠的啊

点赞回复分享

发布于 2022-08-18 21:19 陕西

致幻z

哈尔滨理工大学人工智能

flink或者clickhouse的功劳

点赞回复分享

发布于 2022-09-16 18:22 美国

11-24 15:00

Columbia University Java

北美字节oc

bg：水硕，一段大厂一段中厂实习碎碎念：秋招一直处于半摆烂的状态，本来都打算回国直接当团小子了，结果最后开奖开了个挺低的包，感觉有点侮辱人，就重新捡起了好几个月没看的八股和算法重新开始投，但确实有点晚了所以基本也没面上几家。每天熬到凌晨三四点面试，早上六七点爬起来笔试，虽然好几家都走到了最后的hr面，但搞了这么久也就拿了个阿里云边缘部门的小sp，属实有点不甘心。不过幸运的是，朋友帮我找人推了个北美tt的开发岗，之前我自己投都是做完笔试就直接没消息了，没想到这次内推了下还真被捞起来进面了，三轮技术面+一轮hr面也都比较顺利，不得不感叹找工真的是9分看运气1分看实力（这里真得吐槽下sb淘天...

安多纳德：恭喜老哥这是以后留在北美了吗

点赞评论收藏

11-20 23:18

Fachhochschule lübeck Erlang

深圳数篷科技软件研发-客户端方向，能开到这么高真的假的

点赞评论收藏

10-07 20:48

门头沟学院 Java

#看又疯了一个

从工位起来，看到了后面哥们的电脑。顿时笑了，看来后面的哥们也是真emo 了。

听说改名就会有offer：可能是实习上着班想到后面还要回学校给导师做牛马，看着身边都是21-25的年纪，突然emo了了

点赞评论收藏

11-11 19:29

华中科技大学嵌入式软件工程师

以前真的是被华子打包带走啊 形势变太快了

joe2333：怀念以前大家拿华为当保底的日子

点赞评论收藏

11-22 00:40

美团_后端开发(准入职员工)

忙完了工作，又要毕业论文……

工作基本定了，比较满意。这深度学习真是难搞啊，论文看不懂，代码看不懂，不会改，创新点？？？ 还有一个月中期，怎么搞，已经抑郁了，没有小论文要求，我真是非常幸运了，不然就我这科研能力………… 感觉自己对自己失去信心，无时无刻不在否定自己取得一些成绩都是运气好罢了，真的能顺利毕业吗？严重内耗、无力感爆棚啊…………

AI牛可乐：哎呀，听起来你最近压力好大呀，毕业论文和工作的双重压力一定让你感觉像是背了两座山呢。深度学习确实挺复杂的，就像是要在一片迷雾中找到出路一样。但是，你已经很棒了，工作都定好了，这是很大的成就呢！论文的事情，别太担心。每个人都有看不懂代码和论文的时候，这是正常的。至于创新点嘛，有时候灵感就像小猫一样，需要一点一点地哄出来的。你可以先试试把你看过的资料整理一下，说不定就能找到新的思路呢。中期答辩前，你可以列个计划，一步一步来，把大问题分解成小问题，一点一点克服。记得，你不是一个人在战斗，你的导师、同学都是你的战友哦。至于信心嘛，别否定自己，每个人都会有低谷的时候。你已经取得的成绩，都是你实力的体现。毕业不是问题，只要你不放弃，就一定能顺利走过去的。加油哦，我相信你可以的！对了，如果你愿意的话，可以点击我的头像，我们私信聊，也许我能帮你出出主意，或者就是简单地聊聊天，分散一下你的注意力也好呀。🐮💪🌟

你们的毕业论文什么进度了牛客解忧铺

点赞评论收藏