正在钓鱼的渔夫

2021-04-04 18:06 郑州轻工业大学 Java

关注

POJ1521---Entropy

POJ—Entropy

题目描述英文

熵编码器是一种数据编码方法，其通过对去除了“浪费”或“额外”信息的消息进行编码来实现无损数据压缩。
考虑文本“AAAAABCD”。使用ASCII，编码需要64位。由于字形“A”以更高的频率出现，可以通过用更少的位编码来做得更好吗？最佳编码是将“A”编码为“0”，将“B”编码为“10”，将“C”编码为“110”，和“D”与“111”。（这显然不是唯一的最佳编码，因为很明显，对于任何给定的编码，B，C和D的编码可以自由地互换，而不会增加最终编码消息的大小。）使用此编码，消息编码为只有13位到“0000010110111”，压缩比为4.9:1（也就是说，最终编码消息中的每个位表示与原始编码中4.9位一样多的信息）。

输入

输入文件将包含一个文本字符串列表，每行一个。文本字符串将仅包含大写字母数字字符和下划线（用于代替空格）。输入的结尾将由仅包含单词“END”作为文本字符串的行发出信号。

输出

对于输入中的每个文本字符串，输出8位ASCII编码的位长度，最佳无前缀可变长度编码的位长度，以及精确到一个小数点的压缩率。

样例输入

AAAAABCD

THE_CAT_IN_THE_HAT

END

样例输出

64 13 4.9

144 51 2.8

解题思路

本题考察的主要内容为哈夫曼树
案例第一个输出表示字符串用ASCII存储所使用的位数,即长度 * 8即可.第二个输出为使用二进制编码来存储字符,但要求位数最少,这时我们得使用哈夫曼编码了.我们在处理时只需要统计不同字符出现的个数,然后当做权值,从而根据新生成节点的频率之和便为最佳编码长度求得. 最后一个输出是前两个输出相除得到的.

代码

#include<iostream>
#include<queue>
#include<string>
using namespace std;
int arr[40];
string s;
int main()
{
   
	while (cin >> s && s != "END")
	{
   
		priority_queue<int, vector<int>, greater<int> > Q;
		int len = s.size();
		for (int i = 0; i < len; i++)
		{
   
			arr[s[i] - 'A']++;
		}
		cout << len * 8 << " ";
		for (int i = 0; i < 40; i++)
		{
   
			if (arr[i])
			{
   
				Q.push(arr[i]);
			}
		}
		/* * 方法一 */
		//int total = 0;
		//if (Q.size() == 1) {
   
		// total = len;
		//}
		//while (Q.size() > 1)
		//{
   
		// int sum = 0;
		// sum += Q.top();
		// Q.pop();
		// sum += Q.top();
		// Q.pop();
		// Q.push(sum);
		// //cout << sum << endl;
		// total += sum;
		//}
		//方法二
		int total = len;
		while (Q.size() > 2)
		{
   
			int sum = 0;
			sum += Q.top();
			Q.pop(); 
			sum += Q.top();
			Q.pop();
			Q.push(sum);
			//cout << sum << endl;
			total += sum;
		}
		cout << total << " ";
		printf("%.1lf\n", (double)len * 8 / total);
		memset(arr, 0, sizeof(arr));
	}
	return 0;
}

代码解析

这个题有两种思考方式.其中关键就在于全为一种字符的情况比如AAAAAAAAAAAAA,那么对于方法一,如果没有了对Q.size ==1 的这种判断是不行的,此时total是0明显不符合题意,所以得额外判断处理.如果多个字符组合则按照常规处理即可.
方法二则是直接给total一个初值–即字符串总长度,也就是构建哈夫曼树最后一步的操作. 总权值之和= = 字符个数 = = 哈夫曼树最后一次合并的结果. 这样就不要考虑为当全为一种字符时的情况了.
不过个人还是推荐第一种的,更便于理解,但得细心点.

心得收获

当遇到字符时我们将其映射为数字的处理方式: 如A==> arr[0]=arr[ str[i] – ‘A’ ] (当str[i]
== A), B==> arr[1]=arr[ str[i] – ‘B’ ] (当str[i] == B).
在竞赛时对于输入输出最好用C语言的,效率更高.
优先队列的使用.
特殊情况的处理,如方法一需要考虑字符种类个数是否大于1,方法二则可不用考虑.

全部评论

推荐最新楼层

11-19 17:10

University of Toronto 算法工程师

职场尴尬事件

突然一个微信群里说要开会，就发了一句通知开会的伙伴赶紧入会的意思，我在群里，我看了邮件也没通知我开会，群里就发了要开会，我在群里还回复了在哪里开会啊，没人理我，我就私聊了一个人问的，然后去了会议室发现根本不用我去开，其实我不知道在哪里开，就是没通知我开会我跑去开会就很尴尬，我坐下了又不好意思走，我就尴尬的听完了他们的会，我又怕该开会我又不去，怕工作做不好，哎太难了，特别尴尬

职场中你干过哪些“蠢”事

点赞评论收藏

分享

昨天 10:49

门头沟学院电子工程师

收到offer了！！！！

终于轮到我了，一共收到了4个offer，覆盖了我刚开始秋招最想去的几家，以此贴记录一下我的秋招之旅。1、先说背景和offer（先报喜）我的bg：985硕，电子信息专业，1段oppo实习，意向岗位是电子硬件岗我的offer：oppo，base东莞，硬件部门的软件测试小米，base北京，底软中兴，base深圳，硬件工程师联影，base上海，电子硬件岗2、回顾秋招坎坷之路投递：因为之前实习接触的比较多，所以我会更早的去准备和投递，我的秋招也就比别人都早，大概7月初就开始了，因为有的提前批可能能提前拿到offer或者薪资更高。但是现在看其实都是扯淡，并不是说这个不对，而是这个只属于极少数人，尤其在今年...

俊朗的长颈鹿正在卷：老哥说的好，符合自己期望就行，别人的话都是参考文献！

点赞评论收藏

分享

11-01 11:02

门头沟学院后端

终于到我捡漏啦！哈哈哈！11月要开始准备收割啦！

康8：是我疯了，还是大伙疯了

点赞评论收藏

分享

11-20 08:31

广西大学自然语言处理

拼多多开奖，年包216w

算是普通人靠薪资拿到的天花板了吧？

杨柳哥：这不是普通人，那这个钱的是天才

点赞评论收藏

分享

今天 11:19

已编辑

门头沟学院前端工程师

简历这样写真的很难挂

没有标题党哈，从我实习到现在，虽然简历也有挂过，但基本都是中小厂（很怪）。最近有好多牛u私信我说很多公司简历关过不去，私信询问简历应该怎么写怎么改，正好现在好多26届甚至27届的学弟学妹们都在准备日常实习，明年3月份开始也要准备暑期实习，简历这块感觉我也许有一些建议是大家都可以用到的。下面的话我会从整体到每个内容，再到一些细节点去给大家一些建议。每个模块都很细致！快快收藏起来！！！1.整体结构大部分的牛u应该都是比较正常的履历，可能没有竞赛，有些项目。所以这块应该是大家都适用的。对于没有实习经历的牛u，从上到下依次是：【个人信息】-【教育经历】-【项目经历】-【专业技能】-【社团和荣誉证书等其...

投递完美世界等公司10个岗位 > 我的上岸简历长这样你的简历改到第几版了

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 晒一晒我的offer #

9718231次浏览 104895人参与

# 学历or实习经历，哪个更重要 #

39617次浏览 288人参与

# 北方华创开奖 #

21749次浏览 249人参与

# 地方国企笔面经互助 #

2278次浏览 6人参与

# 应届生被毁约被毁意向了怎么办 #

25203次浏览 233人参与

# 你最想要的公司福利是？ #

37268次浏览 68人参与

# 查收我的offer竞争力报告 #

14714次浏览 205人参与

# 机械应届生薪资要多少才合适？ #

12088次浏览 59人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2483次浏览 32人参与

# 没有实习经历，还有机会进大厂吗 #

803613次浏览 13778人参与

# 我的工作日记 #

20709次浏览 269人参与

# 你觉得第一学历对求职有影响吗？ #

14678次浏览 121人参与

# 寒假躺平还是提前实习 #

57497次浏览 420人参与

# 总结:哪家公司面试体验感最差 #

24191次浏览 118人参与

# 公司情报交流地 #

31316次浏览 222人参与

# 选完offer后，你后悔学本专业吗 #

7706次浏览 47人参与

# 不给转正的实习，你还去吗 #

1513975次浏览 16947人参与

# 实习，投递多份简历没人回复怎么办 #

2385258次浏览 34225人参与

# 00后45度躺现状 #

37008次浏览 305人参与

# 机械人，签完三方你在忙什么？ #

23441次浏览 121人参与

# 秋招OC许愿 #

225005次浏览 1857人参与

牛客网
牛客企业服务