Chinaunix首页 | 论坛 | 博客
  • 博客访问: 278320
  • 博文数量: 121
  • 博客积分: 3050
  • 博客等级: 中校
  • 技术积分: 1262
  • 用 户 组: 普通用户
  • 注册时间: 2006-04-25 12:18
文章分类

全部博文(121)

文章存档

2016年(3)

2011年(17)

2010年(34)

2009年(16)

2008年(40)

2007年(2)

2006年(9)

我的朋友

分类: 系统运维

2011-05-13 21:43:13

做一片运维操作云:

看到到处都是云的介绍,前天对自己的网管系统升级时,突然想到做一片网管云的想法,后来又接着一想,干嘛不加入操作模块,组成一片真正的运维云呢?当时不由的觉得思想开扩了,发现这几年来产品带来的问题好像都一下子找到出口了,现在理一下当时灵光闪现的概念吧!(当时暗想,谁要叫我做咨询设计,完成这个产品,我全力加班,不收一文,一定完成此梦呀::为国产网管企业流下一滴泪)

1,实现灵活的平台扩展,觉得可以考虑搞一些PC SERVER或刀片,放于一个私有内网中,然后,通过一些NAT技术从出口做以下限制:所有内网出去的地址通过NAT换成某一个地址,以便于各业务侧好做ACL控制的;所有业务侧主动的访问,通过出口做LVS,这样可以保证内网中节点增加时对业务侧透明,而且内网中节点发生故障切换,下线,维修等都与业务侧无关。
 根据多年经验,要开通网络会有很多人以安全等各种理由进行推脱,但他也不想想,如果通过分布式部署,让别人放个黑匣子一样的节点到自己内部业务区多恐怖呀,虽然你能看着它,能随时干掉它,但也许你还没干掉它时,它先干掉了你,呵呵!
2,软件功能模块:
  a,自动发现模块,通过类似DNA分级zone形式,对各个区域进行独立发现,通过snmp,ssh,telnet,rmi 等相应手段形成各区域咨产,通过系统自身字典表形成各区可以实现的功能。

b,事件采集,这块儿建议两种方法,通过主动轮询或被动接收来实现,可以在所有节点上部暑一些采集与接入模块,通过相应最小化任务直接执行,这些小任务以轻量级过程实现,使其在任一节点上执行无区别。


c,性能部分,这块儿个人非常不推荐使用代理方式,纵观多个项目,最后发现无论谁家,hp,ibm,asg,bmc,ca,veritas,*******最终发现得到的性能太少太少,远不到PDF或realse 中提到的动则成百上千的KPI,呵呵,建议自己动手,可以参照一下sitescope的方法,还是不错的。

3,用户操作上的功能需求:
权限控制,这是我对当前以接触产品最为不欣赏之处,建议通过多维度权限管理:
 首先,通过管理员将所有zone分好,可以按地域或应用域划分,然后再建立联系人,通过前面的方法将批量资产授权给相应的人,当然,在区哉中可以建立二级ADMIN,然后由其进行分支权限控制;

通过功能模块与类型也可以完成相应权限控制。


事件展现,由于前面已经授权,建议通过队列方式将消息推向所有节点,这样可以使得用户从任意地点接受。


4,产品维护,通过单点部署,单点测试后,可以逐步推广,毕竟云中有不少节点,建议通过节点状态控制节点的可用性,如测试态状表示可能在升级,生产中表示一切正常。
以加入一SSH登陆功能为例,可以通过完成SSH模能包,并将其放到某节点上测试,一旦成功,则可以通过节点内部升级手段将其升级至全云或部分指定节点中,等升级完成后,再进行全网升级测试,呵呵!

其它的先到这儿吧,感觉主从分布式在项目上的确很有些力不从心了,如果每个节点都像一支蚂蚁一样紧叮着自己简单的事儿就好啦,而各个节点功能都一样时,通过数据存贮同步手段则可以保证相应高可用且维护简便罢了吧



阅读(584) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~