[性能]如何处理高并发的网站？（一）

性能优化总是一个需要时间和经验积累的问题，这里先摘抄下前人的经验，之后再做自己的总结。
一
一般来说,解决WEB高并发的有效手段都是采用可线性扩展的多层分布式架构，
Webserver (Nginx) ：
这一层是可以轻松分布式部署的，结合智能DNS解析可以简易地防止单点故障、实现区域访问加速，结合LVS很容易实现负载均衡。这一层主要是负责处理静态请求和转发PHP请求至第二层的PHP处理节点，至于静态资源地址(http://misc.xxxx.com)可以单独拿出来部署，或者直接使用商用的云存储服务（国内七牛不错，国外有Amazon S3）
PHP处理节点：
一个节点其实就是一个监听特定端口的系统进程，webserver的请求通过负载均衡器（我用的AWS的loadbalancer)进行分发，很好实现分布式和负载均衡。我现在用的还是php自带的php-fpm,其实facebook出的hhvm性能非常强悍，但是还不能100%通过我项目的单元测试，等hhvm成熟过后可以平滑替换
高速缓存：
用的memcached，这一层的作用主要是减轻数据库IO和加快热数据访问，缓存策略与程序耦合度较高，不赘述，但简单地说有两种方式，一种是在程序的全局层面加一个缓存处理，这种方法代码耦合度低，但是有效命中率不高，有些项目不一定适应，另一种是在具体的数据存取处加缓存处理，这种办法程序耦合度较高，但是缓存命中率非常高，几乎没有无效缓存存在，我用的是这种。
数据库 ：
我现在的项目数据规模不大，暂时只用了单台数据库，但是程序逻辑上已做好了数据库线性扩展的准备。其实数据库层的扩展是老生常谈了，常用手段是分库分表，这一块需要在前期的代码就打下基础，另外更平滑地手段是使用中间件，比如360的Atlas，阿里巴巴的cobar，淘宝的TDDL，中间件可以在不大范围变更代码的情况下扩展，但是具体的使用场景还是有限的，具体项目还需单独考察。
其他：
根据不同的项目，架构还可以选择性地使用队列，我现在用的beantalkd，Redis也是一个很好的选择。队列常用的使用环境是邮件发送和站内消息推送上面，但是在某些场景下也可以作为核心数据库的缓冲，对应对大并发或者突发性流量也是不错的选择
二
以下的架构都是在假设已经优化过linux内核的情况下进行

初级篇：（单机模式）

假设配置：（Dual core 2.0GHz,4GB ram,SSD）

基础框架：apache(PHP) + Mysql / IIS + MSSQL
（最基础框架，处理一般访问请求）

进阶1：替换Apache为Nginx，并在数据库前加上cache层【数据库的速度是最大的瓶颈】
Nginx(PHP) + Memcache + Mysql
（此时已经具备处理小型访问量的能力）

进阶2：随着访问量的上涨，最先面临的问题就来了：CGI无法匹配上Nginx的高IO性能，这时候可以通过写扩展来替代脚本程序来提升性能，C扩展是个好办法，但是大家更喜欢用简单的脚本语言完成任务，Taobao团队开源了一个Nginx_lua模块，可以用lua写Nginx扩展，这时候可处理的并发已经超越进阶1 一个档次了。
Nginx(nginx_lua or C) + Memcache + Mysql
（此时处理个同时在线三四千人没有问题了）

进阶3：随着用户的增多，Mysql的写入速度成了又一大瓶颈，读取有memcache做缓存，但写入是直接面对Mysql，性能受到了很大阻碍，这时候，要在Nginx和Mysql中间加入一层写缓存，队列系统就出场了,就以RabbitMQ为例，所有写入操作全部丢到这只兔子的胃里面，然后屁股后面写个接应程序，一条条的拉出来再写入mysql。而RabbitMQ的写入效率是Mysql的N倍，此时架构的处理能力又上一阶层。
|—-write——>RabbitMQ——–
Nginx（lua or c）—– |———>Mysql
|—-read——>Memcache——–

(此时的并发吞吐能力已经可以处理万人左右在线)

中级篇：（分而治之）

此时我们在单机优化上已经算是达到极限，接下来就要集群来显示作用了。

数据库篇：数据库总是在整个环节中是吞吐能力最弱的，最常见的方法就是sharding。
sharding可以按多种方法来分，没有定式，看情况。可以按用户ID区段分，按读写分等等，可用参考软件：mysql proxy（工作原理类似lvs）

缓存篇：memcache一般采用的是构建memcache pool，将缓存分散到多台memcache节点上，如何将缓存数据均匀分散在各节点，一般采用将各节点顺序编号，然后hash取余对应到各个节点上去。这样可以做到比较均匀的分散，但是有一个致命点就是，如果节点数增加或减少，将会带来几乎80%的数据迁移，解决方案我们在高级篇再提。

WEB服务器篇： web服务器集群的建设，最常见的就是lvs方式(memcache pool同样可以如此组建)，lvs的核心就是调度节点，调度节点负责将流量通过算法分散到各个节点上，因调度所耗资源很少，所以可以产生很高的吞吐率，后台节点数量可以任意增删，但此法弊病就是如果调度节点挂了，则整个集群都挂了，解决方案我们在高级篇提。

高级篇：（高可用性+高可扩展性的集群）

单点调度故障解决：
集群的好处显而易见，但是有一个弊端就是单节点进行调度，如果节点出现故障，则整个集群全部都无法服务，对此的解决方案，我们使用keepalived来解决。Keepalived for Linux
keepalived是基于VRRP协议（VRRP协议介绍）的，请一定先了解VRRP协议后再进行配置。
keepalived可以把多台设备虚拟出一个IP，并自动在故障节点与备用节点之间实现failover切换。这样我们配置两台货多台lvs调度节点，然后配置好keepalived就可以做到lvs调度节点出现故障后，自动切换到备用调度节点。（同样适用于mysql）

memcache集群扩展解决：
memcache因为我们一般采用的都是hash后除以节点数取余，然后分配到对应节点上，如果节点数出现变化，以前的缓存数据将基本都不能命中。

发表评论 取消回复

发表评论取消回复