网站加速之网络加速

背景 如上图,互联网企业的国内业务肯定部署在国内,出海业务则一般部署在海外;具体部署区域,则一般根据用户所在区域,选择就近的区域。 源站部署到不同区域,选择不同的机房,对于各地用户来说,会带来网络距离及网络线路质量的差异,从而对用户的访问响应时间也会产生一定差异。 网 »

故障管理三部曲

背景 在任何一个生产产品的行业,不管是互联网行业,还是建筑行业,或者是医疗行业,都得面对一个事物,那就是故障; 故障处理的好,那只是一个故障;故障处理的不好,就有可能升级成不同级别的事故; 出现事故,这是任何人都不想看见的; 如何避免事故,是安全生产的头等大事; 在这里,我会介绍 »

k8s故障排查之主机资源不足-磁盘篇

前言 前面有讲过因为主机内存资源不足导致主机及pod均NotReady的状态,今天分享一个因为主机磁盘资源不足导致pod Evicted的故障。 故障现象 收到告警,有大量pod处于Evicted状态。 故障排查 查看告警后发现有问题的pod,均是调度到了同一台主机后出现的Evi »

K8S故障排查之主机NotReady

故障现象 收到告警,有主机处于NotReady状态,并且该主机的cpu使用率,内存使用率,负载都很高。 故障排查 登陆容器,查看node状态,发现主机处于NotReady状态。 查看主机内的容器状态,发现部分pod处于“删除中”状态,部分pod处于“重启”状态。 登陆华为云,查看 »

分布式事务SEATA的介绍与实践

事务ACID原则 原子性:事务中的所有操作,要么全部成功,要么全部失败 一致性:要保证数据库内部完整性约束、声明性约束 隔离性:对同一资源操作的事务不能同时发生 持久性:对数据库做的一切修改将永久保存,不管是否出现故障 一、理论基础 1)CAP理论 1998年,加州大学的计算机科 »

记线上Dubbo调用异常排查处理

一、简单介绍 suishen-esb中,提供了Dubbo对Hystrix的集成; Hystrix内部使用了线程池完成具体的任务执行; 每一个远程service使用独立的线程池; 内部封装中,线程池的核心线程数和最大线程数默认为30,等待队列使用SynchronousQueue(不 »

tcpkill介绍,一个主动清理tcp连接的工具

背景 我们常用的redis、mysql、mongodb等服务,因为client程序使用异常,如果连接数监控没做好且没及时处理的情况下,server连接数就容易被打满; server连接数被打满的情况下,client就不能新建连接; 对于短连接client,会影响新建连接,业务 »

记线上MONGO慢查询问题排查处理

一、简单介绍 mongo语句查询条件中出现null或空串,可能会导致索引失效,查询优化器无法选择正确的查询计划,出现慢查询引起服务异常 mongo查询的执行计划使用了LRU缓存,在很多种情况下会失效,导致重新选择执行计划并缓存,供后续同类查询直接使用; 服务开始时一直运行正常,当 »