2005/10/03
今天是加班的第3天,基本上没有什么事情。登上了网站看了看,还好,一切正常。
早上时高级工程师赶了过来,听他说好像是数据备份出了什么问题,具体我也不太懂,就是看到veritas backup里有个备份的任务进程是active,status为1,然后他登进数据库做了一个操作:
$ su – oracle
$ rman
RMAN> connect target /
RMAN> change archivelog all validate;
RMAN> exit
后来就搞定了。我只知道书上写的进行此操作的原因是:
Archivelog备份返回值为1,而且后续的备份均返回1。
通常情况,需要进行Oracle 数据库的Archivelog同步。
Oracle数据库Archivelog同步的方法为:
以Oracle数据库用户登录到Oracle数据库服务上,通过RMAN来运行上面的命令
具体的原理有谁熟悉的给我解释一下好吗?
今天上午整理了互联星空应急预案,就是将系统维护手册拿过来稍微一修改,在加上一些应急措施,就搞定了。有个问题不太懂:在linux系统下如何看哪个端口是否已开放?
还有,如果发现如下状态
tcp 0 0 123.123.123.123:80 123.123 175.49:56076 SYN_RECV
tcp 0 0 123.123.123.123:80 218.58.210.6:1332 SYN_RECV
tcp 0 0 123.123.123.123:80 222.174.69.180:3979 SYN_RECV
tcp 0 0 123.123.123.123:80 222.173.241.250:33022 SYN_RECV
tcp 0 0 123.123.123.123:80 222.174.103.42:64207 SYN_RECV
tcp 0 0 123.123.123.123:80 222.173.241.250:33014 SYN_RECV
tcp 0 0 123.123.123.123:80 222.173.235.82:55810 SYN_RECV
tcp 0 0 123.123.123.123:80 218.58.210.6:1314 SYN_RECV
tcp 0 0 123.123.123.123:80 222.174.236.128:3076 SYN_RECV
tcp 0 0 123.123.123.123:80 222.175.8.8:4215 SYN_RECV
tcp 0 0 123.123.123.123:80 222.174.7.142:3045 SYN_RECV
tcp 0 0 123.123.123.123:80 218.58.210.6:1318 SYN_RECV
tcp 0 0 123.123.123.123:80 222.173.240.218:1607 SYN_RECV
tcp 0 0 123.123.123.123:80 218.58.210.6:1320 SYN_RECV
tcp 0 0 123.123.123.123:80 218.58.195.54:1039 SYN_RECV
tcp 0 0 123.123.123.123:80 222.173.235.82:55822 SYN_RECV
tcp 0 0 123.123.123.123:80 222.174.38.154:3554 SYN_RECV
tcp 0 0 123.123.123.123:80 10.155.120.56:2815 SYN_RECV
可一定能断定服务器123.123 11.139 遭受了大量的合法及非法地址的SYN FLOOD攻击吗?
linux下的这些安全加固措施切实可行吗?
我们所建议采取的安全加固措施
1)限制NFS访问权限
确保/etc/exports具有最严格的访问权限设置,不要使用任何通配符、不允许root写权限并且只能安装为只读文件系统。编辑文件/etc/exports并加入如下两行。
/dir/to/export host1.mydomain.com(ro,root_squash)
/dir/to/export host2.mydomain.com(ro,root_squash)
为了使改动生效,使用一下命令:
# /usr/sbin/exportfs –a
可是为什么我的nautilus打不开exports文件呢?
报的错是:nautilus has no installed viewer capable of displaying "etc/exports".
2) 修改inetd
首先要确认/etc/inetd.conf的所有者是root,且文件权限设置为600。设置完成后,可以使用“stat”命令进行检查。
# chmod 600 /etc/inetd.conf
然后,编辑/etc/inetd.conf禁止以下服务:
ftp telnet shell login exec talk ntalk imap pop-2 pop-3 finger auth
3) 阻止ping
如果没人能ping通系统,安全性自然增加了。为此,可以在/etc/rc.d/rc.local文件中增加如下一行:
echo 1 >/proc/sys/net/ipv4/icmp_echo_ignore_all
已试过,可行
4)防止IP欺骗
编辑host.conf文件并增加如下几行来防止IP欺骗攻击。
order bind,hosts
multi off
nospoof on
5) 防止DOS攻击
对系统所有的用户设置资源限制可以防止DoS类型攻击。如最大进程数和内
存使用数量等。可以在/etc/security/limits.conf中添加如下几行:
* hard core 0
* hard rss 5000
* hard nproc 100
然后编辑/etc/pam.d/login文件检查下面一行是否存在。
session required /lib/security/pam_limits.so
上面的命令禁止调试文件,限制进程数为100并且限制内存使用为5MB。
谁能告诉我以上哪些措施是切实可行的啊?
我们的流媒体服务器采用的是浪潮nf260,cpu为3G,内存为2G,网速为1Gbps
采用的是windows media service
现在设的允许连接的最大限制为450个,然后如果达到限制服务就会死掉,然后重启服务。
我想问一下:
这个配置的服务器最多可同时连接多少个用户点播?
可以通过提高允许同时连接的客户数来达到扩容的目的吗?
如果单纯通过提高连接数,是否会影响用户点播电影的质量?
总结:一个运营级网站的基本架构
今天,我想对我维护的这个系统做一个简单的总结描述。可能有些方面描述的不够合理、科学,请大家见谅。
1 两台netscreen防火墙
两台防火墙之间可以实现真正的冗余备份。当出现情况 ,Standby Netscreen都能够实现在短暂的丢包后恢复正常。
2 两台四层交换机实现PORTAL端的硬件负载均衡:创建了farm,一旦交换机检测到所管理的每台服务器承载的负荷量,它会按照一定的算法来分配通信,我觉得这一点挺不错的。
两台四层交换机之间通过VRRP协议,做到设备冗余
我看了看配置步骤,重要的就是创建farm和做vrrp,很简单。
3 两台portal服务器
到现在我还没搞懂portal是啥意思,反正又叫作门户服务器,为apache+weblogic架构
有个问题没搞懂:在网站可正常访问的时候,有时在浏览器里直接输两台portal的ip,直接就可访问到主页;可有时一个可以一个不行;有时又都不行。真搞不懂。
4 数据库服务器
数据库服务器选择SUN SERVER + DISK ARRAY + ORACLE + VERITAS HA方式,提供高可用性(HA)系统。SUN 选择F280R,盘阵为SUN T3,HA软件采用VERITAS VCS
(未完待续)
2005/10/14 故障处理总结
今天,系统备份时出故障了,我有幸跟随工程师一同进行了处理,我整理的磁带备份故障处理过程
1 发现报错
此次遇到的故障status编号为84(media write error),可能的故障原因是
磁带发生故障导致无法正常存储,也有可能是误报
2 故障定位
我们先手工备份了一下,其确认是否真的是磁带有问题,步骤为:
点击policy,在出现问题的policy下右击选择manual backup
结果过了一段时间后,我们在media list中发现系统自动将出现问题的media 设为frozen
即磁带故障,系统自动将该磁带冻结,数据备份自动选择别的空闲的磁带
如果仍然为active,但是依然报错,需手工冻结
bpmedia -freeze -m 磁带编号
3 故障排除
冻结后的的介质不能做将来的备份,即使所有的备份都过期之后,也不能被重复使用,但仍可恢复原来的备份。
一般要等到这个存储策略的存储周期结束后,更换故障磁带
附:
参考命令:
##删除磁带(消除ASIGNED TIME)
bpexpdate –d 0 –m media_id
##冻结磁带
bpmedia -freeze -m media_id
##查看所有磁带状态
available_media
##查看存储单元的状态
vmdareq
##启动存储单元
vmoprcmd -h ****-up 0
vmoprcmd -h **** 1
由于对存储了解极少,可能部分地方描述有误,请多见谅!
要转正了,写总结
终于要转正拉,老板让写份工作总结。我记得从小到大检讨倒写过不少,正式的总结真还没记得写过,不过我不打算到网上随便盗一篇完事,其实工作这四个月来我还是有不少心得体会的,hoho。
首先使我对网络系统整体理解的加深。工作之前我只是培训过思科的一些知识,对网络的认识只限在交换层面;对主机,数据库,存储可谓了解甚少,约等于0.1,通过这几个月的工作,我开始掌握了一些基本的东西.
有许多东西都是互通的,比如双机热备的原理:交换机上,配置了hsrp或vrrp就可以达到目的;主机上的配置比较复杂,但原理很简单,通过cluster即可实现。其实只要我们有了双机这个想法,技术上实现起来是并不复杂的。但是如果能够想到双机,这就是一种创新,我想这就是为什么从事规划设计的人员拿高薪,而我们这些维护实施者只能勉强过日子的原因。
其实维护工作并非没有创新性可言,只要去思考,是完全可以挖掘出一些比较创新的idea的。比如我们这边有台设备只是根据数据库中统计的服务器的性能来执行相应的流量分发,但是比较关键,如果down机会影响所有用户正常的点播,但是当初设计的时候不知道处于什么样的考虑,只做了一个单机,有时候我们要关机进bios去清除cmos log;而系统另外一台比较不重要的主机也是单机,而且两台机器配置型号都相同。我就在想因为也没有大量的数据,如果不想增加投资做硬件双机,能否有种软件可以不必使用磁盘阵列就可以实现双机?或者实现手工的切换也可以?hoho,可能我的想法比较幼稚,但是我真是这么想的
猜猜我的内存及占用率
谢谢鼓励,我又回来了
前些日子,家里有点急事请了几天假。所以……
今天看了些关于查看solaris系统内存配置的文章,它给了好多命令,我逐一试了一下
1、 modinfo
DB1-ROOT#modinfo
Id Loadaddr Size Info Rev Module Name
6 1015a000 4543 1 1 specfs (filesystem for specfs)
……
2 、sar -k 1
12:32:23 sml_mem alloc fail lg_mem alloc fail ovsz_alloc fail
12:32:24 23470528 19499572 0 586948608 555319168 0 36536320 0
这里sml_mem是什么意思?lg_mem我猜是logical memory
3 、/usr/ucb/ps -aux | head
USER PID %CPU %MEM SZ RSS TT S START TIME COMMAND
a 22088 10.8 11.1934624890712 ? O 12:33:13 0:05 b(LOCAL=
a 22086 6.1 11.1934400892928 ? S 12:33:13 0:05 b (LOCAL=
a 22115 5.5 11.1934640890728 ? R 12:33:24 0:02 b (LOCAL=
安全考虑,将user与command做了替换
4、prtconf | grep 'memory'
memory (driver not attached)
virtual-memory (driver not attached)
memory-controller, instance #0
memory-controller, instance #1
5、/usr/platform/sun4u/sbin/prtdiag
System Configuration: Sun Microsystems sun4u Sun Fire 280R (2 X UltraSPARC-III+)
System clock frequency: 150 MHz
Memory size: 8192 Megabytes
6、swap -s
total: 1138144k bytes allocated + 101136k reserved = 1239280k used, 15700632k available
7、vmstat
procs memory page disk faults cpu
r b w swap free re mf pi po fr de sr m1 m1 m1 m2 in sy cs us sy id
4 0 0 15754600 5761480 0 0 0 0 0 0 0 0 0 0 0 4294967196 0 0 -89 -12 -56
8、prstat -a
……
Total: 114 processes, 720 lwps, load averages: 3.20, 3.43, 3.48
那位大侠帮忙看一看,怎样判断我的物理内存,虚拟内存,内存占用率各为多少?
工作总结
经过不断的思索、思索,工作总结终于搞定!hoho
工作总结
参加工作已经快满半年了,在领导和同事们的帮助下,我觉得学到了很多。回顾这半年,感觉既忙碌,又充实。
我有幸有一个起点很高的舞台,工作过程中涉猎到的知识面非常广。我自认为凭着这我对工作的兴趣和热情,较好的完成了任务。工作中确实需要很多大学里和培训时没有涉及到的知识,比如网络操作的应用,比如数据库的维护,再比如存储方面的原理,而这部分知识是我工作应用的基础。不过在领导的帮助之下,通过不断的学习、总结,我认为能够胜任工作的要求。
通过这半年的工作、学习,我认为分析问题的能力有所提升,在兴趣的指引下,通过请教、讨论与沟通,能够针对工作中遇到的每一个问题做出比较系统有效的分析,对所出现的问题做出及时准确的判断与定位,进而采取合理的措施,尽可能地减少障碍带来的损失,尽到一个维护人员应有的职责。还有通过不断的实践,积累了一些经验,这笔财富对干好工作会有很大的帮助:有些问题第一次处理的时候可能需要四十分钟,但是第二次发生的时候或许只需要四分钟就可以搞定,等到第三次的出现或许只需要几秒钟,这就是经验的价值,而实际操作的经验是读N多年书也获取不到的。通过与厂家的工程师的不断接触、交流;或者从故障处理的实践过程之中,我逐渐地积累了一些经验,进而提高维护的服务质量。
另外,协调利用资源的能力有所提高。某些工作可能有许多从没有经历过的困难,但是完全可以充分利用现有的各种资源,在有限的时间内完成并做好。在这边有着丰富的知识库资源可以利用,有经验丰富的各产品厂家的工程师可以交流、咨询,也有网上经验性的信息用以参考。如果能够充分利用,在利用的过程中总结为自己的东西,在有效率的完成工作的同时,对个人的成长也是有很大帮助的。我觉得这方面我做到了,也学到了很多。
最后,我的情绪管理的能力有所提高。不管事情进展得多么不顺利,我都会先找自身的原因,寻找自己存在的不足之处。然后总结自己,争取不在同样的地方跌倒第二次。当遇到困难、不顺利或被为难的时候,我也能够以心平气和的态度去对待。
但是在工作中,也发现了一些问题和自身存在的一些不足:
所掌握的知识比较单一、狭窄,对系统方面的知识比较欠缺,与工作需要还有一定的差距。####的主机系统有redhat linux,有sun的solaris,有microsoft的server 2003,也有oracle数据库。随着业务的迅速的发展,系统对维护的要求必将会越来越高,对维护人员的素质也会提出更高的要求;同时我也希望能够给孙工做一个合格的替补,在他有事不在或忙的时候若有需要自己可以顶上。但是我还没有进行过系统的学习、培训,知识的掌握比较薄弱,有的时候工作起来还是比较吃力,不能顺畅的进行沟通、交流,不能熟练地进行操作;因此,如果有机会的话,我希望参加一些linux系统和数据库方面的培训,这对今后做好维护是十分有必要的。
待提升的还有自己的沟通能力,不管是口头的还是书面的交流,怎样能够有效地将自己所想准确无误地表达出来,我觉得这方面的能力有待加强。我个人是个比较不愿意主动交流的人,所以当初选择专业的时候选择了信息管理这个主要同电脑打交道的专业。可是单纯地去逃避是不可能从根本上解决问题的,有效的沟通作用就像润滑油一样在出现摩擦的地方变得更加协调、使系统更为和谐。人的性格是可以随着环境的改变而改变的,所以对我来说,这将不会是一件十分困难的事情。
个人认为只要自己努力争取,到处充满了机会,比如这次的工作总结就是沟通交流工作的好机会,我也将我的一些真实的想法通过这个报告反映了出来。做一个受人尊敬的、合格的工程师是我的职业梦想,我知道达到这个目标还有很长的路要我去走,尤其我本人又是个很不自信的人,还要面对如此多的高手;可是,我会努力去减少这种差距,我不会让我在这里工作的这些日子白白地流失,我渴望去做得更好,并会将这种渴望付诸到日常的工作中来。
我的辞职信
我辞职了,这是我的辞职信。
尊敬的经理:
您好!
首先感谢您能在百忙之中查看我的这封信。
在电信这边的这几个月中,我觉得我学到了很多东西。我也很有幸和有丰富经验的工程师共事,他们教会了我很多。
不过这段日子也暴露出来了我自身的一些问题,为此我也承受了一些压力。我认为自身能力有限,这样下去会耽误公司的发展。我也反省了自己究竟该怎么走!合同我希望留给更适合这份工作的人。
很遗憾放弃了这样一个机会,我希望我的选择最终是正确的,同时也希望公司的事业蒸蒸日上!
慘,怎麼我都不會呀................................哎,自己要怎麼走呢?
阅读(1430) | 评论(0) | 转发(0) |