Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4841737
  • 博文数量: 930
  • 博客积分: 12070
  • 博客等级: 上将
  • 技术积分: 11448
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-15 16:57
文章分类

全部博文(930)

文章存档

2011年(60)

2010年(220)

2009年(371)

2008年(279)

分类: LINUX

2008-10-24 19:27:54

匹配html的嵌入代码

CODE:
<[^>]*>

匹配[....]的嵌入码

CODE:
\[[^]]\{1,\}\]

删除仅由空字符组成的行

CODE:
sed '/^[[:space:]]*$/d' filename

匹配html标签

CODE:
/\(<[^>]*>\)/

例如:从html文件中剔除html标签

CODE:
sed 's/\(<[^>]*>\)//g;/^[[:space:]]*$/d'  file.html

例如:要从下列代码中去除"[]"及其中包括的代码

CODE:
[b:4c6c2a6554][color=red:4c6c2a6554]一. 替换[/color:4c6c2a6554][/b:4c6c2a6554]
sed 's/\[[^]]\{1,\}\]//g' filename

匹配日期:

CODE:
Month, Day, Year [A-Z][a-z]\{3,9\}, [0-9]\{1,2\}, [0-9]\{4\}
2003-01-28 或 2003.10.18 或 2003/10/10 或 2003 10 10
\([0-9]\{4\}[ /-.][0-2][0-9][ /-.][0-3][0-9]\)

匹配IP地址

CODE:
\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\)
\(\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1,3\}\)

匹配数字串

CODE:
[-+]*[0-9]\{1,\} 整数
[-+]*[0-9]\{1,\}\.[0-9]\{1,\}  浮点数

从字串中解析出两个子串(前2各字符和后9个字符)

CODE:
echo "WeLoveChinaUnix"|sed -e 'H;s/\(..\).*/\1/;x;s/.*\(.\{9\}\)$/\1/;x;G;s/\n/ /'
We ChinaUnix

分解日期串

CODE:
echo 20030922|sed 's/\(....\)\(..\)\(..\)/\1 \2 \3/'|read year month day
echo $year $month $day

文件内容倒序输出

CODE:
sed '1!G;h;$!d'  oldfile >newfile
当然也可以直接使用tac命令实现倒序输出.

阅读(4225) | 评论(0) | 转发(0) |
0

上一篇:linux下内存释放问题

下一篇:shell实例学习

给主人留下些什么吧!~~