Chinaunix首页 | 论坛 | 博客
  • 博客访问: 6275723
  • 博文数量: 2759
  • 博客积分: 1021
  • 博客等级: 中士
  • 技术积分: 4091
  • 用 户 组: 普通用户
  • 注册时间: 2012-03-11 14:14
文章分类

全部博文(2759)

文章存档

2019年(1)

2017年(84)

2016年(196)

2015年(204)

2014年(636)

2013年(1176)

2012年(463)

分类: 系统运维

2016-08-20 05:23:02

原文地址:2016年网站运维总结 作者:dahailinux

                       互联网运维阶段性总结
1. 一个网站运维最重要的是域名,不能被劫持,密码一定要保存好。不然就被人把你的网站黑掉了。另外要注册多个域名,一旦一个
域名不能用了,就尽快换另一个域名。域名也要买防DDos攻击,也要买cdn(用来做缓存和代理)。dns服务商要买一些服务,比如把真正的IP地址隐藏起来。把域名解析工作放到中国的域名服务器,比如在godaddy上买域名,然后把ns记录指向中国的dnspod,因为域名在中国过解析会快,而且不经过和谐防火墙,避免被和谐。
主域名不要让用户直接访问,让用户访问别的域名,只要把域名跳转到主域名就行了,现在每个域名服务器上有这个功能,因为主域名上会配置很多服务,会花很多钱在上面,一旦被和谐了,那就亏大了,别的域名可以随时注册,随时修改的,一个公司域名都会近千个。
2. 一定要用代理服务器,这样可以把真正的服务器隐藏起来,核心数据库服务器一定要做主从复制,每天dump备份,还有远程灾备,
要不然用到的时候哭都来不及。数据库必备知识要会bin-log还原,也要会根据dump备份还原某一个表。
3. 根据服务器性能,看看是否需要做web服务器的负载均衡,最好用nginx服务器。apache服务器在这里提一句,模块很多,功能很多


,也比较稳定,但是性能方面真的是nginx是轻量级的,nginx还是更快一些。
4. 网站安全这块,一定要注意购买机房的高防,带宽一定要大,代理服务器和核心服务器之间,往连通性很重要,要经常查看他俩之


间的网络连通性,看看是服务器性能配置低,还是网络带宽不够用,还是网通电信原因导致通信慢。要有一台服务器实时监控他俩之


间的网络连通性,直接就访问一个index.html页面就可以监控了。只要不丢包就没问题。如果是网通电信的问题,那么要核心服务器


要有多个IP地址,有的IP地址是网通的,有的IP地址是电信的,有的是移动的。所以肉盾机遍布全国各地,肉盾机连接核心服务器的


哪个IP地址更快就连接哪个地址就可以了。
5. 密码这里要每3个月就修改一次密码,全部修改。包括邮箱的密码,因为邮箱注册的域名,还有邮箱会注册dns管理账号。所以密码


管理一定要重视,可以使用keepass来做密码管理。
6. 局域网的管理一定要以稳定为主,网路一定要稳定,别让问题出在局域网这里,那就太不值得了。网络设备都用比较贵的比较稳定


的设备。服务器一定要有raid配置,cpu一定要够大,内存也要多条,大内存,这样工作起来才会提高效率。电源这块一定要保证稳定


,不行就使用ups设备,一个人一个ups也可以考虑。不然断电情况下数据丢了,那可就太影响工作效率了。
7. 运维要懂数据库,还有开发也要懂,硬件也要懂,网络也要懂,反正得非常全面,要不然做不好运维的。
8. 可以找一台硬件高配服务器,要品牌机,要有raid配置。然后做一个虚拟机,这样可以把不是很重要的服务器放在这台虚拟机上,


这样就可以节省资源。
9. 运维一定要会写shell脚本,这样很多重复工作都不用做了,省时。还有加班的一些重复工作也不用做了,配合程序上传文件什么


的,都可以让程序自己完成上传文件的工作了。
10. 所有的工作一定要做笔记,一定要做笔记,还要有每天的工作日志,最好使用one note,不然要查某一天的事情,用脑袋真是记


不住啊。
11. 定期做备份的恢复测试,看看你的备份是否好用。
12. 监控:一定要有监控服务器,还要有报警,只有监控服务器才能看出你的服务器是否被攻击,有报警才能及时的联系到你。如果


人手充足情况下,要有人24小时监控服务器。磁盘容量监控,磁盘IO监控,cpu监控,多少用户登录服务器监控,服务器某些文件否是


有改动的监控,数据库的监控。等等,建议使用zabbix监控系统。最重要的是网络的监控,还有服务器存活状态的监控,还有服务是


否死掉的监控。
13. 所有生产服务器的配置,都要基于测试环境充分测试成功的基础上,不然千万别动生产环境。生产服务器一定要有优化配置,内


核的优化,操作系统的优化,服务的优化。
14. 访问用户量超过2000人的时候,那就是比较大的用户量,相关的配置将会不一样,但最好的优化还是硬件的优化,硬件强大了优


化就好做了。我现在还没有做过在线人数超过2000的环境,需要学习。
15. 再就是作为运维人员平时的工作习惯了。首先是一定要保持清醒头脑,然后是最工作一定要仔细认真,这个工作不需要太快,除


非故障排错的时候。但是一定要仔细,不能出错。我工作9年了,我深深总结了这一点。平时多学习,用到的时候别人会感觉你很专业


,其实都是平时的积累。


    一时之间就只能总结出这些内容,以上是一些阶段性的总结,这段时间服务器总是被攻击,可能是我们离职的员工干的。所以总


结了以上内容。
阅读(790) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~