Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2468790
  • 博文数量: 392
  • 博客积分: 7040
  • 博客等级: 少将
  • 技术积分: 4138
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-17 13:03
个人简介

范德萨发而为

文章分类

全部博文(392)

文章存档

2017年(5)

2016年(19)

2015年(34)

2014年(14)

2013年(47)

2012年(40)

2011年(51)

2010年(137)

2009年(45)

分类:

2010-06-05 21:42:50

设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:

(1)删除一个字符;
(2)插入一个字符;
(3)将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的2个字符串A和B,计算出它们的编辑距离d(A,B)。
要求:
输入:第1行是字符串A,第2行是字符串B。
输出:字符串A和B的编辑距离d(A,B)

思路:

开一个二维数组d[i][j]来记录a0-ai与b0-bj之间的编辑距离,要递推时,需要考虑对其中一个字符串的删除操作、插入操作和替换操作分别花费的开销,从中找出一个最小的开销即为所求

具体算法:

首先给定第一行和第一列,然后,每个值d[i,j]这样计算:d[i][j]   =   min(d[i-1][j]+1,d[i][j-1]+1,d[i-1][j-1]+(s1[i]  ==  s2[j]?0:1));  
 最后一行,最后一列的那个值就是最小编辑距离 

C++代码
  1. #include    
  2. #include    
  3. char s1[1000],s2[1000];   
  4. int min(int a,int b,int c) {   
  5.     int t = a < b ? a : b;   
  6.     return t < c ? t : c;   
  7. }   
  8. void editDistance(int len1,int len2) {   
  9.     int d[len1+1][len2+1];   
  10.     int i,j;   
  11.     for(i = 0;i <= len1;i++)   
  12.         d[i][0] = i;   
  13.     for(j = 0;j <= len2;j++)   
  14.         d[0][j] = j;   
  15.     for(i = 1;i <= len1;i++)   
  16.         for(j = 1;j <= len2;j++) {   
  17.             int cost = s1[i] == s2[j] ? 0 : 1;   
  18.             int deletion = d[i-1][j] + 1;   
  19.             int insertion = d[i][j-1] + 1;   
  20.             int substitution = d[i-1][j-1] + cost;   
  21.             d[i][j] = min(deletion,insertion,substitution);   
  22.         }   
  23.     printf("%d\n",d[len1][len2]);   
  24. }
阅读(7159) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~