Chinaunix首页 | 论坛 | 博客
  • 博客访问: 191903
  • 博文数量: 45
  • 博客积分: 1456
  • 博客等级: 上尉
  • 技术积分: 535
  • 用 户 组: 普通用户
  • 注册时间: 2008-03-21 17:47
文章分类
文章存档

2012年(1)

2009年(43)

2008年(1)

我的朋友

分类: C/C++

2008-10-13 11:37:28

今天在看《UNIX系统编程》,看到防止缓冲区溢出的编程中,课本(P9,英文版P14)中提到这个语句:

scanf("%79s",buf);

实在是寒,用c时间也不少了,这样的用法我还是第一次。于是google了一下,想彻底了解一下格式化输入和输出。顺便整理一下。

以下为转载内容:
载自:hi baidu

scanf格式控制的完整格式:


  %     *     m     l或h     格式字符
  ①格式字符与printf函数中的使用方式相同,以%d、%o、%x、%c、%s、%f、%e,无%u格式、%g格式。

  ②可以指定输入数据所占列宽,系统自动按它截取所需数据。如:
  scanf( "%3d%3d", &a, &b);
  输入:123456
  系统自动将123赋给a,456赋给b。
  ③%后的“*” 附加说明符,用来表示跳过它相应的数据。例如:
  scanf( "%2d%*3d%2d", &a, &b);
  如果输入如下信息:1234567。将“12 ”赋给a,“67 ”赋给b。第二个数据“345”被跳过不赋给任何变量。
  ④输入数据时不能规定精度,例如:
  scanf( "%7.2f", &a);
  是不合法的,不能企图输入:12345.67而使a的值为12345.67。

附加格式说明字符:
  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
         字符                                   说明
  ——————————————————————————————————————
            l           用于输入长整型数据(可用%ld,%lo,%lx)以及double型数据(用%lf或%le)
  ——————————————————————————————————————
            h           用于输入短整型数据(可用%hd, %ho, %hx)
  ——————————————————————————————————————
        域宽         指定输入数据所占宽度(列数),域宽应为正整数
  ——————————————————————————————————————
          *           表示本输入项在读入后不赋绐相应的变量
  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

------------------相关-------------------
输入数据流分隔
  ①根据格式字符的含义从输入流中取得数据,当输入流中数据类型与格式字符要求不符时,就认为这一项结束。例如:
  scanf( "%d%c%f", &a, &b, &c);
  如果输入如下信息:
  1234r1234.567
  则scanf函数在接收数据时发现“r”类型不匹配,于是把“1234”转换成整型赋值给a,把“r”赋给变量b,最后把“1234.567”转换成实型数据赋给c。
  ②根据格式项中指定的域宽分隔出数据项。如语句:
  scanf( "%2d%3f%4f", &a, &b, &c);
  如果输入如下信息:
  123456789012345
  则scanf函数在接收数据时根据域宽把12赋值给a,345赋值给b,6789赋值给c。
  ③隐示分隔符。空格、跳格符('\t')、换行符('\n')都是C语言认定的数据分隔符。
  ④显示分隔符。在scanf函数的两个格式说明项间有一个或多个普通字符,那么在输入数据时,在两个数据之间也必须以这一个或多个字符分隔。如语句:
  scanf( "a=%d,b=%f,c=%f", &a, &b, &c);
  则输入数据应该为:
  a=1234,b=67.8,c=98.123

---------------------------------------
关于scanf函数的进一步说明:
  ①scanf函数中的“格式控制”后面应当是变量地址,而不应是变量名。例如,如果a、b为整型变量,则
  scanf( "%d,%d", a, b);
  是不对的,应将“a, b”改为 “&a, &b”。
  ②如果在“格式控制”字符串中除了格式说明以外还有其它字符,则在输入数据时应输入与这些字符相同的字符。例如:
  scanf( "%d,%d", &a, &b);
  输入时应输入:3,4。3与4之间的逗号应与scanf函数中的“格式控制”中的逗号相对应,输入其它符号是不对的。
  ③在用“%c”格式输入字符时,空格字符和转义字符都作为有效字符输入。
  scanf( "%c%c%c", &c1, &c2, &c3);
  如输入:a b c 。字符 'a' 赋给c1,字符(空格)'     ' 赋给c2,字符 'b'     赋给c3。
  ④ scanf        中不使用U说明符.对unsigned型数据用d、o、x说明符输入.

补充:

对于 const char* p = "12232114687ABC12356";
  scanf( "%[123]", buf); // 就把是'1'或'2'或'3'的字读读到buf中,直到遇到一个不是'1'且不是'2'且不是'3'的字符,于是执行后buf应该是"1223211";
  %[123]等同于%[231],等同于%[321]……,列表中的顺序是无所谓的;
  %[123]也等同于%[1-3]或%[3-1],也就是“1至3”,对于连续的字符列表这样写就很简单,比如%[a-z]等同%[abc…省略…z];
  想想看,%[3-14]应该等同于什么?是“3至14”吗?当然不是,因为[]中的是字符,而不是数字,所以%[3-14]应该等同于%[3214],等同于%[1234];
  同理,想只取字母,那就可以写成%[A-Za-z];
  如果列表的第一个字母是^,那么正好相反,比如%[^A-Za-z]的意思就是取字母之外的所有字符。
  对于字符串"abDEc123"如果想按照字母和数字读到两个字符串中就应该是 "%[a-zA-Z]%[0-9]",buf1,buf2 ;
  假如我想取一行字符,该怎么办?"%s"是不行的,因为%s遇到空白字符(空格、制表符、\r、\n)就结束了,所以可以写成 "%[^\n]%*c",%[^\n]的作用刚才讲过了,就是读\n之外的所有字符,也就是说读到\n为止,%*c的作用就是把\n去掉,否则再次读的时候一直遇到的都是\n;
  所有对%s起作用的控制,都可以用于%[],比如"%*[^\n]%*c"就表示跳过一行,"%-20[^\n]"就表示读取\n前20个字符。


参考:

[Reading Undelimited strings]
*To read strings not delimited by whitespace characters, a set of characters in brackets ([ ]) can be substituted for the s (string) type character. The set of characters in brackets is referred to as a control string. The corresponding input field is read up to the first character that does not appear in the control string. If the first character in the set is a caret (^), the effect is reversed: The input field is read up to the first character that does appear in the rest of the character set.
*Note that %[a-z] and %[z-a] are interpreted as equivalent to %[abcde...z]. This is a common scanf function extension, but note that the ANSI standard does not require it.


载自:

printf格式控制符的完整格式

printf的格式控制的完整格式:
%  -  0  m.n  l或h  格式字符
下面对组成格式说明的各项加以说明:
①%:表示格式说明的起始符号,不可缺少。
②-:有-表示左对齐输出,如省略表示右对齐输出。
③0:有0表示指定空位填0,如省略表示指定空位不填。
④m.n:m指域宽,即对应的输出项在输出设备上所占的字符数。N指精度。用于说明输出的实型数的小数位数。为指定n时,隐含的精度为n=6位。
⑤l或h:l对整型指long型,对实型指double型。h用于将整型的格式字符修正为short型。

---------------------------------------
格式字符
格式字符用以指定输出项的数据类型和输出格式。
①d格式:用来输出十进制整数。有以下几种用法:
%d:按整型数据的实际长度输出。
%md:m为指定的输出字段的宽度。如果数据的位数小于m,则左端补以空格,若大于m,则按实际位数输出。
%ld:输出长整型数据。
②o格式:以无符号八进制形式输出整数。对长整型可以用"%lo"格式输出。同样也可以指定字段宽度用“%mo”格式输出。
例:
   main()
   { int a = -1;
     printf("%d, %o", a, a);
   }
  运行结果:-1,177777
  程序解析:-1在内存单元中(以补码形式存放)为(1111111111111111)2,转换为八进制数为(177777)8。
③x格式:以无符号十六进制形式输出整数。对长整型可以用"%lx"格式输出。同样也可以指定字段宽度用"%mx"格式输出。
④u格式:以无符号十进制形式输出整数。对长整型可以用"%lu"格式输出。同样也可以指定字段宽度用“%mu”格式输出。
⑤c格式:输出一个字符。
⑥s格式:用来输出一个串。有几中用法
%s:例如:printf("%s", "CHINA")输出"CHINA"字符串(不包括双引号)。
%ms:输出的字符串占m列,如字符串本身长度大于m,则突破获m的限制,将字符串全部输出。若串长小于m,则左补空格。
%-ms:如果串长小于m,则在m列范围内,字符串向左靠,右补空格。
%m.ns:输出占m列,但只取字符串中左端n个字符。这n个字符输出在m列的右侧,左补空格。
%-m.ns:其中m、n含义同上,n个字符输出在m列范围的左侧,右补空格。如果n>m,则自动取n值,即保证n个字符正常输出。
⑦f格式:用来输出实数(包括单、双精度),以小数形式输出。有以下几种用法:
%f:不指定宽度,整数部分全部输出并输出6位小数。
%m.nf:输出共占m列,其中有n位小数,如数值宽度小于m左端补空格。
%-m.nf:输出共占n列,其中有n位小数,如数值宽度小于m右端补空格。
⑧e格式:以指数形式输出实数。可用以下形式:
%e:数字部分(又称尾数)输出6位小数,指数部分占5位或4位。
%m.ne和%-m.ne:m、n和”-”字符含义与前相同。此处n指数据的数字部分的小数位数,m表示整个输出数据所占的宽度。
⑨g格式:自动选f格式或e格式中较短的一种输出,且不输出无意义的零。

---------------------------------------
关于printf函数的进一步说明:
如果想输出字符"%",则应该在“格式控制”字符串中用连续两个%表示,如:
printf("%f%%", 1.0/3);
输出0.333333%。

---------------------------------------
对于单精度数,使用%f格式符输出时,仅前7位是有效数字,小数6位.
对于双精度数,使用%lf格式符输出时,前16位是有效数字,小数6位.

######################################拾遗########################################
由高手指点
对于m.n的格式还可以用如下方法表示(例)
char ch[20];
printf("%*.*s\n",m,n,ch);
前边的*定义的是总的宽度,后边的定义的是输出的个数。分别对应外面的参数m和n 。我想这种方法的好处是可以在语句之外对参数m和n赋值,从而控制输出格式。


--------------------------------------------------------------------------------
今天又看到一种输出格式 %n 可以将所输出字符串的长度值赋绐一个变量, 见下例:

int slen;

printf("hello world%n", &slen);

执行后变量被赋值为11。


不记得的时候,看看还是很有帮助的,特别是scanf的格式化输入,让我大汗,以前对其理解太少了。原来正则也可以在里面使用。

自己在阅读源码的时候,也发现了一些上面所谓提及的。慢慢积累下来,供自己和再看的读者享用。

《UNIX系统编程》P9页(英文版P15):

fprintf(stderr, "a at %p and\nx at %p\n", (void *)a, (viod *)&x);

其中提及了%p,自己理解为打印指针地址的格式。

阅读(2184) | 评论(2) | 转发(0) |
0

上一篇:没有了

下一篇:cli和sti分析

给主人留下些什么吧!~~

chinaunix网友2010-01-24 18:53:34

总结得相当完善!收藏先。

chinaunix网友2010-01-24 18:53:03

靠!太谢谢!