2021-07-22 13:56 北京林业大学 Java

关注

题解 | #字符串出现次数的TopK问题#

字符串出现次数的TopK问题

http://www.nowcoder.com/practice/fd711bdfa0e840b381d7e1b82183b3ee

字符串出现次数的TopK问题

题目：给定一个字符串数组，再给定整数k，请返回出现次数前k名的字符串和对应的次数。返回的答案应该按字符串出现频率由高到低排序。如果不同的字符串有相同出现频率，按字典序排序。字符仅包含数字和字母

对于两个字符串，大小关系取决于两个字符串从左到右第一个不同字符的 ASCII 值的大小关系。比如"ah1x"小于"ahb"，"231"<”32“

例子：

输入：
["123","123","231","32"],2
复制
返回值：
[["123","2"],["231","1"]]
复制
说明：
 "123"出现了2次，记["123","2"]，"231"与"32"各出现1次，但是"231"字典序在"32"前面，记["231","1"]，最后返回[["123","2"],["231","1"]]

分析：

难点是词频相同时，词频高的排前面；词频不同时，字符字典序低的排前面

用哈希表记录字符，其出现的次数；定义一个Node接受字符str和它对应的词频

Node implements Comparable<Node>重写compareTo

// 排序逻辑:排序在前面的，返回负数，排序在后面的，返回正数
// 1.词频相同，词频高的在前，返回负数
// 2.词频不相同，字典序低的在前，返回负数
@Override
public int compareTo(Node node) {
    if (this.times == node.times) {// 词频一样，比较字符串
        return this.str.compareTo(node.str);
    } else {// 词频不一样，就比较词频
        return node.times - this.times;
    }
}

生成k个长度的小根堆（排前面的CompareTo返回正数，排后面的CompareTo返回负数），来接受遍历到的strs中的字符串
- 堆未满，就一直加入
- 堆满了，堆满了，如果小根堆顶应该排在待插入元素的后面（>0）,就更新堆顶
- heapify和heapInsert自行看代码
重新调整小根堆，使排序在前的放在堆顶
结果集接受堆中数据，返回结果集

public class Solution {

    public static class Node implements Comparable<Node> {
        public String str;
        public int times;

        public Node(String str, int times) {
            this.str = str;
            this.times = times;
        }

        // 排序逻辑:排序在前面的，返回负数，排序在后面的，返回正数
        // 1.词频相同，词频高的在前，返回负数
        // 2.词频不相同，字典序低的在前，返回负数
        @Override
        public int compareTo(Node node) {
            if (this.times == node.times) {// 词频一样，比较字符串
                return this.str.compareTo(node.str);
            } else {// 词频不一样，就比较词频
                return node.times - this.times;
            }
        }
    }

    public String[][] topKstrings(String[] strings, int k) {
        if (strings == null || k < 1) {
            return new String[][]{};
        }
        // map统计每个字符，出现的词频
        HashMap<String, Integer> map = new HashMap<>();
        for (String s : strings) {
            if (!map.containsKey(s)) {
                map.put(s, 1);
            } else if (map.containsKey(s)) {
                map.put(s, map.get(s) + 1);
            }
        }
        // 遍历哈希表，每个node放入小根堆中
        // minHeap中的"小"指的是：排序放在后面的放在堆顶（compareTo返回正数）
        Node[] minHeap = new Node[k];
        int index = 0;
        for (Map.Entry<String, Integer> entry : map.entrySet()) {
            String str = entry.getKey();
            Integer times = entry.getValue();
            Node node = new Node(str, times);
            if (index < k) {// 堆未满，就加入
                minHeap[index] = node;
                heapInsert(minHeap, index++);
            } else {
                if (minHeap[0].compareTo(node) > 0) {// 堆满了，如果小根堆顶应该排在待插入元素的后面（>0）,就更新堆顶
                    minHeap[0] = node;
                    heapify(minHeap, 0, k);
                }
            }
        }
        // 重新调整小根堆，使排序在前的放在堆顶
        for (int i = index - 1; i >= 0; i--) {
            swap(minHeap, 0, i);
            heapify(minHeap, 0, i);
        }
        // 结果集接受堆中数据，返回结果集
        String[][] res = new String[k][2];
        for (int i = 0; i < k; i++) {
            // 小根堆，就倒序放入res中
            res[i][0] = minHeap[i].str;
            res[i][1] = String.valueOf(minHeap[i].times);
        }
        return res;
    }

    private void heapify(Node[] minHeap, int index, int size) {
        while (2 * index + 1 < size) {
            int left = 2 * index + 1;
            // 越排在后面的，compareTo返回的越大，找出左右孩子节点中的排序后在更后面的
            if (left + 1 < size && minHeap[left].compareTo(minHeap[left + 1]) < 0) {
                left++;
            }
            // 如果父亲已经比孩子中最靠后的还要排序在后面，就停止本轮循环
            if (minHeap[index].compareTo(minHeap[left]) > 0) {
                break;
            }
            swap(minHeap, index, left);
            index = left;
        }
    }

    // 小根堆未满，加入堆时，排序小的往上放
    private void heapInsert(Node[] heap, int index) {
        while (index != 0) {
            int parent = (index - 1) / 2;
            // 返回正数，应该放后面，所以交换
            if (heap[index].compareTo(heap[parent]) > 0) {
                swap(heap, parent, index);
                index = parent;
            } else {
                break;
            }
        }
    }

    private void swap(Node[] minHeap, int i, int j) {
        Node temp = minHeap[i];
        minHeap[i] = minHeap[j];
        minHeap[j] = temp;
    }


    public static void main(String[] args) {
        Solution solution = new Solution();
        String[] strs = {"abcd", "abcd", "abcd", "pwb2", "abcd", "pwb2", "p12"};
        int k = 3;
        String[][] res = solution.topKstrings(strs, k);
        // 正确：[["abcd","4"],["pwb2","2"],["p12","1"]]
        System.out.println(Arrays.deepToString(res));
        System.out.println("---------");
        String s1 = "231";
        String s2 = "32";
        Node n1 = new Node(s1, 1);// 词频相同，231字典序<32，返回负数
        Node n2 = new Node(s2, 1);

        Node n3 = new Node(s1, 1);// 词频不相同，231词频<32词频，返回正数
        Node n4 = new Node(s2, 2);

        System.out.println(n1.compareTo(n2));// -1
        System.out.println(n3.compareTo(n4));// 1

    }
}

全部评论

推荐最新楼层

昨天 11:36

已编辑

门头沟学院广告设计

没投过这100家公司就不要说找不到工作

经常有人说，设计岗找不到工作，只能去外包怎么办？我不想去外包，也就不会投外包，如果算上外包至少300家起步，外包公司真的巨多。如果有分辨不出是外包公司的可以发评论里求助。按照城市划分，主要以游戏美术为主，少量互联网掉落。按照首字母排序，主要以有校招的公司为主。1、北京【搜狐畅游】知名wlb，现在没什么新爆款，游戏比较老，地皮值钱，流程会很慢，曾过了一个月才约面，但口碑不错【点点互动】买量大厂，能进的推荐去，广告很有创意【完美世界】hc少，比较老牌，正统，Red色，要求高。新作异环不如预期，但幻塔工作室在苏州，苏州篇会单独讲【字节跳动】把沐瞳卖了后游戏美术很少了，互联网方面的设计还在招，面过抖音...

我的求职总结

点赞评论收藏

分享

05-10 17:32

西安电子科技大学 Java

字节-后端开发-一面-2026.5.7

自我介绍项目1. 介绍下 Agent 项目中和亮点2. 项目的主要难点是什么3. 举一个项目中的例子4. ES 在项目中的功能5. 检索结果如何进行融合6. 具体是怎么生成向量的，维度是多少7. 怎么让模型知道有哪些工具，以及模型是如何调用工具的8. SSE 协议返回信息的格式是什么样的9. 记忆模块怎么设计的10. 短期记忆放在哪11. 结构化信息有哪些12. 什么时候开始长期记忆抽取13. 使用 Redis 存储短期记忆产生的大 Key 问题怎么解决14. 如何设计一个上下文卸载功能？15. Agen 执行时间长，在服务重启/崩溃后，如何保证可以接着执行任务，保证任务可以完成MySQL 1...

查看28道真题和解析

点赞评论收藏

分享

04-24 15:10

河海大学 Java

28届想找日常实习什么时刻最好啊，4月份boss上打了几百个招呼也没捞到面试，几乎都是不回简历本来是点评，最近给换了，求点评，不玻璃心

你已经投递多少份简历了

点赞评论收藏

分享

04-14 08:52

河南科技大学 Java

要了简历逗逗我吗，😭，是不是简历是一坨，请教一下佬，不玻璃心

燚燊焱炎火：让你学长永泽one教你进腾讯

点赞评论收藏

分享

05-12 20:49

商丘工学院网络工程师

大二结束想运维实习请问有什么要修改的，大家有什么建议我虚心接受不玻璃心，谢谢大家，或者有什么企业可以介绍

我的求职进度条

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

17380次浏览 124人参与

# 拼多多工作体验 #

62950次浏览 439人参与

# 我的求职总结 #

487724次浏览 6877人参与

# 宁德时代求职进展汇总 #

188392次浏览 710人参与

# 27届实习投递记录 #

86185次浏览 912人参与

# 我是XXX，请攻击我最薄弱的地方 #

96625次浏览 642人参与

# 职场吐槽大会 #

361624次浏览 2308人参与

# 牛油的搬砖plog #

207835次浏览 1337人参与

# HR最不可信的一句话是__ #

36999次浏览 186人参与

# 美团秋招笔试 #

219030次浏览 1197人参与

# 什么专业适合考公 #

73613次浏览 477人参与

# AI让海力士市值突破9000亿美元 #

10296次浏览 126人参与

# 小厂实习有必要去吗 #

95300次浏览 454人参与

# 毕业后不工作的日子里我在做什么 #

274390次浏览 1743人参与

# 面试常问题系列 #

311241次浏览 4803人参与

# AI Coding实战技巧 #

32159次浏览 400人参与

# 这些公司卡简历很严格 #

108117次浏览 497人参与

# 找工作中的意难平 #

1100354次浏览 6526人参与

# Vibe Coding 会干掉初级岗位吗？ #

51960次浏览 331人参与

# 实习在多还是在精 #

93551次浏览 536人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务