全部博文(252)
分类: C/C++
2012-05-08 09:27:31
第一部分 scanf()函数的正则表达式 —— 阅读理解程序,运行并观察分析结果
正则表达式是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。
在最简单的情况下,一个正则表达式看上去就是一个普通的查找串。例如,正则表达式"testing"中没有包含任何元字符,它可以匹配"testing"和"123testing"等字符串,但是不能匹配"Testing"。
加入一些元字符,例如‘*’,正则表达式就可以有更加灵活的匹配方式,例如表达式 “goo*gle”,能匹配字符串 gogle 和 goooooogle
函数scanf与sscanf中正则表达式的用法
scanf函数原型:
int scanf( const char *format [,argument]... );
其中的format可以是一个或多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' |
'\n' | 非%符号},
注:{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
下面依次解释各个参数:
1. width
宽度,一般可以忽略,用法如:
#include
int main()
{
char buf[10] = {0};
scanf("%5s", buf); //%5s,只取个字符
printf("%s\n", buf);
return 0;
}
输入: hello, world!
输出: ?
2. 正则表达式
%*[width] [{h | l | I64 | L}]type
前面带“*”号表示不保存变量。跳过符合条件的字符串
#include
int main()
{
char szTmp[10] = {0};
scanf("%*s%s", szTmp); //%*s表示第一个匹配到的%s被过滤掉
printf("%s\n", szTmp);
return 0;
}
输入:hello, world!
输出:?
%[ ]表示要读入一个字符集合,
如果“[”后面第一个字符是“^”,则表示取反的意思,即求“[]”内字符集的补集。“[]”内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可导致不可预知的结果。%[^]
也是违反规定的。% [a-z] 读取在a-z之间的字符串
#include
int main()
{
char szTmp[10] = {0};
scanf("%[^ ]", szTmp); //%[^ ]表示取遇到空格为止的字符串
printf("%s\n", szTmp);
return 0;
}
输入:hello, world!
输出:?
#include
int main()
{
char szTmp[10] = {0};
scanf("%*[^@]@%[^\.]", szTmp); //匹配从"@"到"."之间的字符
printf("%s\n", szTmp);
return 0;
}
输入: teacherhu@gmail.com
输出:?
解释:“%*[^@]”表示滤掉“@”前的字符串,接下来的一个“@”表示耗掉一个“@”但不保存到变量中,大家可以将第二个“@”去掉试一试,输出结果
为“@gmail”,后面的%[^\.]匹配到“.”之前的字符,由于“.”是正则表达式的元字符,因此加了“\”来转义。