计算字符串的距离

计算字符串的距离

http://www.nowcoder.com/questionTerminal/3959837097c7413a961a135d7104c314

这题考的是levenshtein距离的计算,需要运用动态规划去解决该类问题。

传递公式

  1. lev[i][j]用来表示字符串a的[1...i]和字符串b[1...j]的levenshtein距离;
  2. 插入和删除操作互为逆过程:a删除指定字符变b等同于b插入指定字符变a;
  3. 如果a[i] == b[j],则说明a[i]和b[j]分别加入a,b之后不会影响levenshtein距离,lev[i][j] = lev[i-1][j-1] + 0;
  4. 如果a[i] != b[j],则需要考虑3种情况的可能:
    1. a中插入字符,即lev[i][j] = lev[i-1][j] + 1;
    2. b中插入字符,即lev[i][j] = lev[i][j-1] + 1;
    3. a[i]替换成b[j],lev[i][j] = lev[i-1][j-1] + 1;
  5. 取这4种情况的最小值。

题解

#include <iostream>
#include <cmath>
using namespace std;

int findMin(int a, int b, int c)
{
    a = min(a, b);
    b = min(b, c);
    return min(a, b);
}

int levenshtein(string a, string b)
{
    a.insert(0, 1,' ');
    b.insert(0, 1, ' ');
    int n = a.size(), m = b.size();
    int cost, lev[n][m];
    for(int i = 0; i < n; i++) lev[i][0] = i;
    for(int j = 0; j < m; j++) lev[0][j] = j;
    for(int i = 1; i < n; i++)
    {
        for(int j = 1; j < m; j++)
        {
            if(a[i] == b[j]) cost = 0;
            else cost = 1;
            lev[i][j] = findMin(lev[i][j-1]+1, 
                lev[i-1][j]+1, lev[i-1][j-1]+cost);
        }
    }
    return lev[n-1][m-1];
}

int main()
{
    string a, b;
    while(cin >> a >> b)
    {
        cout << levenshtein(a, b) << endl;
    }
    return 0;
}

https://github.com/ultraji/nowcoder

全部评论
您好,我想请问下如果我不对2个字符串在起始位置补充相同的字符,而是直接构造动态规划矩阵,然后lev[0][0]的取值视s1[0]和s2[0]是否相同确定,如果相同则为0,不同为1.这样做为什么最后会有一些实例无法通过呢?它也不是遇到起始位置不同就一定会错。而是下面这个实例: cgyzjibvgrijkrmlujhhvrghqdsjauicqppwoswhizjceblbotawujnsxzffsdxfowpgdsjnxxfjlvwzewavcqpxaloujcamfpbsnunwbiurvtwxaksxuexxxoecmsmmqlvvifhebsogzjplvrsvwbeaiydsvmrskhhxfxkakenifebcfnccfsogihnqfrlxfnfosteyolxsxbhvekslkwxxggelpyvbnewmmtyzvvguxpkys gqhfskisthpxdstnvjuzlsszpefkifvagyetkfbnrpkdgvnwwiwwwwvtxfuacdtwhweavljuyopxaopxenwxrltmydkrbusqdebjnpjiwaehygwoxlfiwrupkaoevhuducxdcdmqxumkpjtsowxkhycgcbg 总是比正确值195多1.
2 回复 分享
发布于 2020-03-23 19:47
有字符串a=xxxx和字符串b=yyyy,a的第一个字符x和b的第一个字符y比较来确定dp[0][0]的值,因为x和y不确定所以不能确定dp[0][0]等于多少,所以a和b前面需要一个确定的字符来帮助初始化第一行和第一列,作者使用的是空字符,也可以是其他字符,比如1 [ 1 a b c d e] [1 0 1 2 3 4 5] [a 1 0 1 2 3 4] [b 2 1 0 1 2 3] [c 3 2 1 0 1 2] [d 4 3 2 1 0 1] [f 5 4 3 2 1 1] 应该是这样吧
1 回复 分享
发布于 2021-07-22 16:36
楼上,注意看楼主的代码 有个在每个输入的字符串前加个空格的操作 我也不知道为什么要这样,我加入之后就通过了。。。
2 回复 分享
发布于 2021-06-03 19:49
第4点的a,b插入的两种情况的状态转移貌似搞错了
点赞 回复 分享
发布于 2023-10-06 23:08 湖南
我按照这个思路通过了。大佬666
点赞 回复 分享
发布于 2023-04-08 13:13 广东
leetcode 72,你这个分析好像是错的。。。
点赞 回复 分享
发布于 2022-01-01 17:01
楼主加空字符串不是必须的,主要是为了让lev的长宽多一位。lev[i][0]表示让a[1,...i]与空字符串做比较,lev[0][j]是让b与空字符串做比较,这样得到结果作为基线条件来更新后面的lev。
点赞 回复 分享
发布于 2021-09-01 18:36
想不通
点赞 回复 分享
发布于 2021-08-16 16:13

相关推荐

不愿透露姓名的神秘牛友
07-04 14:35
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
昨天 13:05
点赞 评论 收藏
分享
05-11 11:48
河南大学 Java
程序员牛肉:我是26届的双非。目前有两段实习经历,大三上去的美团,现在来字节了,做的是国际电商的营销业务。希望我的经历对你有用。 1.好好做你的CSDN,最好是直接转微信公众号。因为这本质上是一个很好的展示自己技术热情的证据。我当时也是烂大街项目(网盘+鱼皮的一个项目)+零实习去面试美团,但是当时我的CSDN阅读量超百万,微信公众号阅读量40万。面试的时候面试官就告诉我说觉得我对技术挺有激情的。可以看看我主页的美团面试面经。 因此花点时间好好做这个知识分享,最好是单拉出来搞一个板块。各大公司都极其看中知识落地的能力。 可以看看我的简历对于博客的描述。这个帖子里面有:https://www.nowcoder.com/discuss/745348200596324352?sourceSSR=users 2.实习经历有一些东西删除了,目前看来你的产出其实很少。有些内容其实很扯淡,最好不要保留。有一些点你可能觉得很牛逼,但是面试官眼里是减分的。 你还能负责数据库表的设计?这个公司得垃圾成啥样子,才能让一个实习生介入数据库表的设计,不要写这种东西。 一个公司的财务审批系统应该是很稳定的吧?为什么你去了才有RBAC权限设计?那这个公司之前是怎么处理权限分离的?这些东西看着都有点扯淡了。 还有就是使用Redis实现轻量级的消息队列?那为什么这一块不使用专业的MQ呢?为什么要使用redis,这些一定要清楚, 就目前看来,其实你的这个实习技术还不错。不要太焦虑。就是有一些内容有点虚了。可以考虑从PR中再投一点产出
投递美团等公司8个岗位
点赞 评论 收藏
分享
评论
67
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务