hash应用之字符串替换-ubuntuer-ChinaUnix博客

人生如逆旅，我亦是行人！江湖人称wsjjeremy.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

ubuntuer

博客访问： 4900409
博文数量： 930
博客积分： 12070
博客等级：上将
技术积分： 11448
用户组：普通用户
注册时间： 2008-08-15 16:57

文章分类

全部博文（930）

html5（0）
python（1）
google_gnu fans（8）
高品位（2）
perl（4）
mobile_dev（2）
openssl（1）
libcurl（2）
windows内核安全（5）
自己的C_LIB（5）
高性能MySQL学习（94）
多线程（4）
ldd学习笔记（3）
netfilter（3）
笔试题（5）
师徒之言传身教（1）
转载（15）
work（146）
introduction to （9）
debug（3）

intern（3）
mobile ip（0）
毕业设计（2）
linux防火墙（10）
c++（16）
database（13）
CentOS（11）
data structure（5）
kernel（50）
DIY（4）
酷软（19）
iptables（9）
linux c（105）

string（19）
APUE学习笔记（7）
facetea（13）
shell（68）
tcp_ip（23）
apache（3）
linux（258）

正则表达式（5）
未分配的博文（1）

文章存档

2011年（60）

2010年（220）

2009年（371）

2008年（279）

我的朋友

相关博文

hash应用之字符串替换

分类： LINUX

2009-08-13 18:37:31

1. 考虑一个字符串替换的过程，在一个文本文件中含有一些文本内容和一些需要替换的变量，变量的格式为“$Var$”，原来的“$”使用“$$”进行转义，原来的“$$”表示为“$$$”。我们将含有变量的文件称为模板(文件名为t)，文本文件的平均长度为100K。另外，还有一系列的变量文件，里面为变量名和变量值的对应关系(文件名为1.v , 2.v… n.v)，每个变量文件包含的变量数在百万数量级，且变量排列次序不定。现要求将，模板里的变量分别用变量文件里的变量替换，并将生成的文件写成 (1.r, 2.r… n.r)。
要求：从算法和实现上和实现技术上的细节对程序进行优化，尽量使程序高效。程序运行环境为2G内存，4CPU。阐明主要思路，给出伪码和说明，可以着重指出你使用的优化技术。
例子：模板文件为
This is an $FF$ $$. I like $FF$ and $FA$。
变量文件为
1.v
FF : banana
FA : apple
2.v
FA: 苹果
FF : 香蕉
则生成文件为
1.r
This is an banana $$. I like banana and apple。
2.r
This is an香蕉 $$. I like 香蕉and苹果。

我这里程序没有生成1.r, 2.r而是直接输出的

基本思路是先对变量文件做hash,然后遍历模板文件,遇到变量就替换...思路很简单,这种题就是写代码烦...

#include <stdio.h> #include <stdlib.h> #define HASH_SIZE 13 #define MAX_KEY 10 #define MAX_LINE 100 typedef struct hash { char str[MAX_KEY]; char value[MAX_KEY]; struct hash* next; }HASH; HASH* H[HASH_SIZE]; void init_hash() { int i; for(i=0;i<HASH_SIZE;i++) { H[i] = (HASH*)malloc(sizeof(HASH)); H[i]->next = NULL; } } void free_hash_node() { int i; HASH* p; HASH* q; for(i=0;i<HASH_SIZE;i++) { p = H[i]->next; while(p!=NULL) { q = p; p = p->next; free(q); } H[i]->next = NULL; } } void free_hash() { int i; HASH* p; HASH* q; for(i=0;i<HASH_SIZE;i++) { p = H[i]->next; while(p!=NULL) { q = p; p = p->next; free(q); } free(H[i]); } } unsigned int get_hash(char* str) { unsigned int seed = 131; unsigned int hash = 0; while(*str) hash = hash * seed + *str++; return (hash&0x7FFFFFFF); } void add_hash(char* key,char* value) { unsigned int hash_num = get_hash(key); hash_num %= HASH_SIZE; HASH* p = (HASH*)malloc(sizeof(HASH)); sprintf(p->str,"%s",key); sprintf(p->value,"%s",value); p->next = H[hash_num]->next; H[hash_num]->next = p; } int process_v_file(FILE* fp) { char key[MAX_KEY]; char value[MAX_KEY]; while(fscanf(fp, "%s : %s\n", key, value)!=EOF) { printf("key is %s, value is %s\n", key, value); add_hash(key,value); } } char* key_2_value(char* key) { unsigned int hash_num = get_hash(key); hash_num %= HASH_SIZE; HASH* p = H[hash_num]->next; while(p!=NULL) { if(strcmp(p->str, key) == 0 ) break; p = p->next; } if(p!=NULL) return p->value; return NULL; } int process_template() { char line[MAX_LINE]; char line_after[MAX_LINE]; char* value; int i = 0; int j = 0; int k = 0; FILE* fp = fopen("template.txt","r"); while(fgets(line, MAX_LINE, fp)!=NULL) { while(line[i]!='\0') { printf("!!!! %c\n", line[i]); if(line[i] == '$') { if(line[i+1] == '$') { line_after[j++] = line[i++]; line_after[j++] = line[i++]; } else { i++; k = i; while(line[i]!='$') i++; line[i] = '\0'; printf("key is %s\n", line+k); value = key_2_value(line+k); printf("value is: %s\n", value); i++; while((line_after[j++] = *value++)!='\0') ; j--; } } else { line_after[j++] = line[i++]; } } line_after[j] = '\0'; printf("after the line is:\n%s", line_after); } } void print_hash() { int i; HASH* p = NULL; for(i=0;i<HASH_SIZE;i++) { p = H[i]->next; while(p!=NULL) { printf("%d key is %s, value is %s\n", i, p->str, p->value); p = p->next; } } } int main(int argc, char *argv[]) { init_hash(); FILE* fp = fopen("1.v.txt","r"); process_v_file(fp); fclose(fp); printf("in hash\n"); print_hash(); process_template(); free_hash_node(); fp = fopen("2.v.txt","r"); process_v_file(fp); fclose(fp); process_template(); free_hash(); system("PAUSE"); return 0; }

调试信息没有delete，现在都是dev-c++写代码,都是printf debug的,gdb都忘的差不多了,惭愧惭愧

阅读(1256) | 评论(2) | 转发(0) |

上一篇：两个有序数组问题

下一篇：300万输入信息中最热门的前十条问题

给主人留下些什么吧！~~

ubuntuer2009-08-18 14:24:15

没有可比性的东西^_^，我也不会郁闷. 我也是飘逸的shell写手

回复 | 举报

chinaunix网友2009-08-18 12:18:36

俺写段 Perl 代码郁闷死你 :)

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6