输入是一个TERM数组，输出其中任意一个集合ID-ubuntuer-ChinaUnix博客

人生如逆旅，我亦是行人！江湖人称wsjjeremy.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

ubuntuer

博客访问： 4878678
博文数量： 930
博客积分： 12070
博客等级：上将
技术积分： 11448
用户组：普通用户
注册时间： 2008-08-15 16:57

文章分类

全部博文（930）

html5（0）
python（1）
google_gnu fans（8）
高品位（2）
perl（4）
mobile_dev（2）
openssl（1）
libcurl（2）
windows内核安全（5）
自己的C_LIB（5）
高性能MySQL学习（94）
多线程（4）
ldd学习笔记（3）
netfilter（3）
笔试题（5）
师徒之言传身教（1）
转载（15）
work（146）
introduction to （9）
debug（3）

intern（3）
mobile ip（0）
毕业设计（2）
linux防火墙（10）
c++（16）
database（13）
CentOS（11）
data structure（5）
kernel（50）
DIY（4）
酷软（19）
iptables（9）
linux c（105）

string（19）
APUE学习笔记（7）
facetea（13）
shell（68）
tcp_ip（23）
apache（3）
linux（258）

正则表达式（5）
未分配的博文（1）

文章存档

2011年（60）

2010年（220）

2009年（371）

2008年（279）

我的朋友

相关博文

输入是一个TERM数组，输出其中任意一个集合ID

分类： LINUX

2009-08-09 10:39:47

现有一组共计N个固定的集合（N为万量级），每个集合有个从0开始递增的集合ID，每个集合包含1~M个TERM（M为0~100的量级），希望设计一个程序能够持续对外服务，输入是一个TERM数组，输出其中任意一个集合ID（如果该TERM数组包含该集合的所有TERM），如果找不到输出-1。要求：

1，时间复杂度最优，能够在短时间内对大量输入逐个输出

2，实现具体的代码（可以是伪代码），其中常用的数据结构可以采用标准库。

3，给出时间复杂度和空间复杂度。

TERM组合集合的文件格式举例：

TERM_1 空格 TERM_2

TERM_1 空格 TERM_3

TERM_1 空格 TERM_3 TERM_4

输入的为TERM数组（说明：TERM为一个词，可能是中文，固定字符串表示）

eg:

a_1 aa_2
b_11 bb_22
c_111 cc_222 ccc_444

input：

c cc ccc

ouput:

111

input：

aa cc ccc

ouput:

-1

大致思路我这里把输入的数组做hash,以方便O(1)查找。

集合可以理解为二维链表

set是集合链表, term是集合内的term链表

也不知道自己这么理解对不对,一家之言!大家有什么好思路不妨共享

#include <stdio.h> #include <stdlib.h> #define MAX_TERM 10 #define MAX_LEN 100 #define HASH_N 13 typedef struct term { char str[MAX_TERM]; int id; struct term* next; }TERM; typedef struct set { TERM* term; struct set* next; }SET; typedef struct hash { char* key; struct hash* next; }HASH; HASH* H[HASH_N]; void init_term(TERM** T) { *T = (TERM*)malloc(sizeof(TERM)); memset((*T)->str, 0, MAX_TERM); (*T)->id = 0; (*T)->next = NULL; } void init_set(SET** S) { *S = (SET*)malloc(sizeof(SET)); (*S)->term = NULL; (*S)->next = NULL; } void init_hash() { int i; for(i=0;i<HASH_N;i++) { H[i] = (HASH*)malloc(sizeof(HASH)); H[i]->key = NULL; H[i]->next = NULL; } } int get_term_id(char* term_id, TERM* T) { char* tmp = term_id; TERM* p = (TERM*)malloc(sizeof(TERM)); int i = 0; while(tmp[i]!='\0') { i++; if(tmp[i] == '_') { tmp[i] = '\0'; sprintf(p->str, "%s", tmp); p->id = atoi(tmp+i+1); } } p->next = T->next; T->next = p; return 0; } int process_line(char* line,SET* S) { int i = 0; char* line_tmp = line; TERM* T = NULL; SET* p = (SET*)malloc(sizeof(SET)); init_term(&T); char term[MAX_TERM]; while(line_tmp[i] != '\0') { i++; if(line_tmp[i] == ' ') { snprintf(term, i, "%s", line_tmp); term[i] = '\0'; get_term_id(line_tmp,T); i++; line_tmp += i; i = 0; } if(line_tmp[i] == '\0') { //line_tmp[i-1]='\0'; get_term_id(line_tmp,T); break; } } p->term = T; p->next = S->next; S->next = p; return 0; } void print_set(SET* S) { SET* p = S->next; while(p!=NULL) { TERM* q = p->term->next; while(q!=NULL) { printf("term:%s\tid:%d\n", q->str, q->id); q = q->next; } p = p->next; } } void print_hash() { int i; for(i=0;i<HASH_N;i++) { HASH* p = H[i]->next; while(p!=NULL) { printf("hash str is %s\n",p->key); p = p->next; } } } unsigned int BKDRHash(char* str) { unsigned int seed = 131; unsigned int hash = 0; while(*str) { hash = hash*seed + *str++; } return hash&0x7FFFFFFF; } void add_hash(char* term) { //printf("term is %s\n", term); unsigned int hash_num = BKDRHash(term); HASH* p = (HASH*)malloc(sizeof(HASH)); p->key = term; hash_num %= HASH_N; p->next = H[hash_num]->next; H[hash_num]->next = p; } void process_input(char* line) { char* tmp_line = line; int i = 0; while(tmp_line[i]!='\0') { i++; if(tmp_line[i]==' ') { char* term = (char*)malloc(MAX_TERM); snprintf(term, i, "%s", tmp_line); term[i] = '\0'; add_hash(term); i++; tmp_line += i; i = 0; } if(tmp_line[i]=='\0') { tmp_line[i-1]='\0'; add_hash(tmp_line); break; } } } int exist(char* str) { unsigned int hash_num = BKDRHash(str); hash_num %= HASH_N; HASH* p = H[hash_num]->next; while(p!=NULL) { if(strcmp(str,p->key) == 0) return 1; } return 0; } int judge_terms(SET* S) { SET* p = S->next; while(p!=NULL) { TERM* q = p->term->next; while(q!=NULL) { if(exist(q->str)) { if(q->next == NULL) return q->id; q = q->next; } else break; } p = p->next; } return -1; } int main(int argc, char *argv[]) { int ret = 0; SET* S = NULL; init_set(&S); char line[MAX_LEN]; init_hash(); FILE* fp = fopen("term.txt","r"); while(fgets(line, MAX_LEN, fp)) { process_line( line, S); } print_set(S); printf("Please input the terms you want:\n"); fgets(line, MAX_LEN, stdin); printf("you input is %s\n",line); process_input(line); print_hash(); ret = judge_terms(S); printf("ret is %d\n",ret); fclose(fp); system("PAUSE"); return 0; }

阅读(1461) | 评论(0) | 转发(0) |

上一篇：gcc使用简介

下一篇：文件记录排序

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6