计算字符串的距离

计算字符串的距离

http://www.nowcoder.com/questionTerminal/3959837097c7413a961a135d7104c314

这题考的是levenshtein距离的计算,需要运用动态规划去解决该类问题。

传递公式

  1. lev[i][j]用来表示字符串a的[1...i]和字符串b[1...j]的levenshtein距离;
  2. 插入和删除操作互为逆过程:a删除指定字符变b等同于b插入指定字符变a;
  3. 如果a[i] == b[j],则说明a[i]和b[j]分别加入a,b之后不会影响levenshtein距离,lev[i][j] = lev[i-1][j-1] + 0;
  4. 如果a[i] != b[j],则需要考虑3种情况的可能:
    1. a中插入字符,即lev[i][j] = lev[i-1][j] + 1;
    2. b中插入字符,即lev[i][j] = lev[i][j-1] + 1;
    3. a[i]替换成b[j],lev[i][j] = lev[i-1][j-1] + 1;
  5. 取这4种情况的最小值。

题解

#include <iostream>
#include <cmath>
using namespace std;

int findMin(int a, int b, int c)
{
    a = min(a, b);
    b = min(b, c);
    return min(a, b);
}

int levenshtein(string a, string b)
{
    a.insert(0, 1,' ');
    b.insert(0, 1, ' ');
    int n = a.size(), m = b.size();
    int cost, lev[n][m];
    for(int i = 0; i < n; i++) lev[i][0] = i;
    for(int j = 0; j < m; j++) lev[0][j] = j;
    for(int i = 1; i < n; i++)
    {
        for(int j = 1; j < m; j++)
        {
            if(a[i] == b[j]) cost = 0;
            else cost = 1;
            lev[i][j] = findMin(lev[i][j-1]+1, 
                lev[i-1][j]+1, lev[i-1][j-1]+cost);
        }
    }
    return lev[n-1][m-1];
}

int main()
{
    string a, b;
    while(cin >> a >> b)
    {
        cout << levenshtein(a, b) << endl;
    }
    return 0;
}

https://github.com/ultraji/nowcoder

全部评论
您好,我想请问下如果我不对2个字符串在起始位置补充相同的字符,而是直接构造动态规划矩阵,然后lev[0][0]的取值视s1[0]和s2[0]是否相同确定,如果相同则为0,不同为1.这样做为什么最后会有一些实例无法通过呢?它也不是遇到起始位置不同就一定会错。而是下面这个实例: cgyzjibvgrijkrmlujhhvrghqdsjauicqppwoswhizjceblbotawujnsxzffsdxfowpgdsjnxxfjlvwzewavcqpxaloujcamfpbsnunwbiurvtwxaksxuexxxoecmsmmqlvvifhebsogzjplvrsvwbeaiydsvmrskhhxfxkakenifebcfnccfsogihnqfrlxfnfosteyolxsxbhvekslkwxxggelpyvbnewmmtyzvvguxpkys gqhfskisthpxdstnvjuzlsszpefkifvagyetkfbnrpkdgvnwwiwwwwvtxfuacdtwhweavljuyopxaopxenwxrltmydkrbusqdebjnpjiwaehygwoxlfiwrupkaoevhuducxdcdmqxumkpjtsowxkhycgcbg 总是比正确值195多1.
2 回复 分享
发布于 2020-03-23 19:47
有字符串a=xxxx和字符串b=yyyy,a的第一个字符x和b的第一个字符y比较来确定dp[0][0]的值,因为x和y不确定所以不能确定dp[0][0]等于多少,所以a和b前面需要一个确定的字符来帮助初始化第一行和第一列,作者使用的是空字符,也可以是其他字符,比如1 [ 1 a b c d e] [1 0 1 2 3 4 5] [a 1 0 1 2 3 4] [b 2 1 0 1 2 3] [c 3 2 1 0 1 2] [d 4 3 2 1 0 1] [f 5 4 3 2 1 1] 应该是这样吧
1 回复 分享
发布于 2021-07-22 16:36
楼上,注意看楼主的代码 有个在每个输入的字符串前加个空格的操作 我也不知道为什么要这样,我加入之后就通过了。。。
2 回复 分享
发布于 2021-06-03 19:49
想不通
点赞 回复 分享
发布于 2021-08-16 16:13
楼主加空字符串不是必须的,主要是为了让lev的长宽多一位。lev[i][0]表示让a[1,...i]与空字符串做比较,lev[0][j]是让b与空字符串做比较,这样得到结果作为基线条件来更新后面的lev。
点赞 回复 分享
发布于 2021-09-01 18:36
leetcode 72,你这个分析好像是错的。。。
点赞 回复 分享
发布于 2022-01-01 17:01
我按照这个思路通过了。大佬666
点赞 回复 分享
发布于 2023-04-08 13:13 广东
第4点的a,b插入的两种情况的状态转移貌似搞错了
点赞 回复 分享
发布于 2023-10-06 23:08 湖南

相关推荐

牛客263158796号:我领羊一面后十天不挂也不推进 今天问hr说等前序的第一批意向发完看情况再看是否推进
点赞 评论 收藏
分享
66 8 评论
分享
牛客网
牛客企业服务