Chinaunix首页 | 论坛 | 博客
  • 博客访问: 665713
  • 博文数量: 78
  • 博客积分: 4990
  • 博客等级: 上校
  • 技术积分: 1386
  • 用 户 组: 普通用户
  • 注册时间: 2007-07-13 19:25
文章分类

全部博文(78)

文章存档

2010年(6)

2009年(25)

2008年(47)

我的朋友

分类: C/C++

2009-01-08 14:10:30

#include
 
#define VALIDATE_IS_STRING(f) do{ \
 while ((c = getc(f)) != EOF) {    \
  if (validate_character_is_space(c)) { \
            if (word) {   \
                wcount++; \
            } \
            word = 0; \
        } else if((c >= 65 && c <= 90) || (c >= 97 && c <= 122)) { \
            word = 1; \
        } \
    } \
}while(0)
 
#define PRINTI(x)   printf("The words number  is: %d\n", x)
 
static FILE * open_file_by_filename(char *filename) {
 FILE *fp= NULL;
 if ((fp = fopen(filename, "r")) == NULL) {
  printf("Can not open file, please check your filename!\n");
  return (NULL);
 }
 return (fp);
}
 
static unsigned int validate_character_is_space(int ch) {
 return (unsigned int)(ch - 9) < 5u || ch == ' ';
}
 
static int get_string_number_in_file(FILE *filename) {
 int i = 0, iterate = 1;
 register int c;
 register int word = 0;
 long int wcount = 0;
 VALIDATE_IS_STRING(filename);
 return (wcount);
}
 
int main(int argc, char **argv) {
 FILE *fd;
 int count;
 if (argc < 2|| argc >=3) {
  printf("Invalid argument,please set right argument !\n");
  return (-1);
 }
 if ((fd = open_file_by_filename(argv[1])) == NULL)
  return (-1);
 count = get_string_number_in_file(fd);
 PRINTI(count);
 fclose(fd);
 return (0);
}
 
做过一个简单的测试,在对10M大小的文本进行单词数统计时,用时不到0.1秒。。。
阅读(744) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~