Chinaunix首页 | 论坛 | 博客
  • 博客访问: 136562
  • 博文数量: 31
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 318
  • 用 户 组: 普通用户
  • 注册时间: 2011-03-24 22:10
个人简介

2011.4 ~ 2015.7 就职于百度运维部,负责百度推广后台系统运维; 2015.7至今,就职于北京屏芯科技(互联网+餐饮),负责稳定性、安全、敏捷、速度等工作。

文章分类

全部博文(31)

文章存档

2016年(4)

2015年(27)

我的朋友

分类: 系统运维

2016-01-23 22:04:17

---
layout: default
title: 服务稳定性提升工作
date: 2016-01-23
categories: 高可用架构
tags: [HA, stability]
---
# 服务稳定性提升工作

**最重要的不是发现,而是执行!**

## 现有问题的解决
1. 清理脏数据
1. 重构uploadOrderinfo接口异步化
1. 解决现有exception日志
1. 解决数据库从库IOPS报警问题
1. 解决常态下的账单重复问题
1. 优化慢SQL

## 防患于未然
1. 数据库层面优化
   - 索引合理性review
   - 监控巡查,IOPS, 连接数
   - 慢SQL优化落地
   - 拆表
1. 服务层面优化
   - 监控
      - 补充各模块exception监控
      - 补全nginx监控
      - 补全redis监控
   - 部署
      - 拆分deploy.yml
      - 部署模式优化(小流量->全流量)
   - 日志规范(接口、返回码、耗时)
   - 关联模块
      - redis迁移至阿里云集群
      - activemq集群化

## 容量提升
1. 压测
阅读(982) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~