5.3 时间效率与空间效率的平衡

硬件的发展一直遵循摩尔定律,内存的容量基本上每隔18个月就会翻一番。由于内存的容量增加迅速,在软件开发的过程中我们允许以牺牲一定的空间为代价来优化时间性能,以尽可能地缩短软件的响应时间。这就是我们通常所说的“以空间换时间”。

在面试的时候,如果我们分配少量的辅助空间来保存计算的中间结果以提高时间效率,则通常是可以被接受的。本书中收集的面试题中有不少这种类型的题目,比如在面试题49“丑数”中用一个数组按照从小到大的顺序保存已经求出的丑数;在面试题60“n个骰子的点数”中交替使用两个数组求骰子每个点数出现的次数。

值得注意的是,“以空间换时间”的策略并不一定都是可行的,在面试的时候要具体问题具体分析。我们都知道在n个无序的元素里执行查找操作,需要O(n)的时间。但如果我们把这些元素放进一个哈希表,那么在哈希表内就能实现时间复杂度为O(1)的查找。但同时实现一个哈希表是有空间消耗的,是不是值得以多消耗空间为前提来换取时间性能的提升,我们需要根据实际情况仔细权衡。在面试题50“第一个只出现一次的字符”中,我们用数组实现了一个简易哈希表,有了这个哈希表就能实现在O(1)时间内查找任意字符。对于ASCII码的字符而言,总共只有256个字符,因此只需要1KB的辅助内存。这点内存消耗对于绝大多数硬件来说是完全可以接受的。但如果是16位的Unicode的字符,创建这样一个长度为216的整型数组需要4216也就是256KB的内存。这对于个人计算机来说也是可以接受的,但对于一些嵌入式的开发就要慎重了。

很多时候时间效率和空间效率存在类似于鱼与熊掌的关系,我们需要在它们之间有所取舍。在面试的时候究竟是“以时间换空间”还是“以空间换时间”,我们可以和面试官进行探讨。多和面试官进行这方面的讨论是很有必要的,这既能显示我们的沟通能力,又能展示我们对软件性能全方位的把握能力。

面试题49:丑数

题目:我们把只包含因子2、3和5的数称作丑数(Ugly Number)。求按从小到大的顺序的第1500个丑数。例如,6、8都是丑数,但14不是,因为它包含因子7。习惯上我们把1当作第一个丑数。

逐个判断每个整数是不是丑数的解法,直观但不够高效

所谓一个数m是另一个数n的因子,是指n能被m整除,也就是n % m == 0。根据丑数的定义,丑数只能被2、3和5整除。也就是说,如果一个数能被2整除,就连续除以2;如果能被3整除,就连续除以3;如果能被5整除,就除以连续5。如果最后得到的是1,那么这个数就是丑数;否则不是。

因此,我们可以写出下面的函数来判断一个数是不是丑数:

bool IsUgly(int number)

{

while(number % 2 == 0)

number /= 2;

while(number % 3 == 0)

number /= 3;

while(number % 5 == 0)

number /= 5;

return (number == 1) ? true : false;

}

接下来,我们只需要按照顺序判断每个整数是不是丑数,即:

int GetUglyNumber(int index)

{

if(index <= 0)

return 0;

int number = 0;

int uglyFound = 0;

while(uglyFound < index)

{

++number;

if(IsUgly(number))

{

++uglyFound;

}

}

return number;

}

我们只需要在函数GetUglyNumber中传入参数1500,就能得到第1500个丑数。该算法非常直观,代码也非常简洁,但最大的问题是每个整数都需要计算。即使一个数字不是丑数,我们还是需要对它执行求余数和除法操作。因此该算法的时间效率不是很高,面试官也不会就此满足,他会提示我们还有更高效的算法。

创建数组保存已经找到的丑数,用空间换时间的解法

前面的算法之所以效率低,很大程度上是因为不管一个数是不是丑数,我们都要对它进行计算。接下来我们试着找到一种只计算丑数的方法,而不在非丑数的整数上花费时间。根据丑数的定义,丑数应该是另一个丑数乘以2、3或者5的结果(1除外)。因此,我们可以创建一个数组,里面的数字是排好序的丑数,每个丑数都是前面的丑数乘以2、3或者5得到的。

这种思路的关键在于怎样确保数组里面的丑数是排好序的。假设数组中已经有若干个排好序的丑数,并且把已有最大的丑数记作M,接下来分析如何生成下一个丑数。该丑数肯定是前面某一个丑数乘以2、3或者5的结果,所以我们首先考虑把已有的每个丑数乘以2。在乘以2的时候,能得到若干个小于或等于M的结果。由于是按照顺序生成的,小于或者等于M肯定已经在数组中了,我们不需再次考虑;还会得到若干个大于M的结果,但我们只需要第一个大于M的结果,因为我们希望丑数是按从小到大的顺序生成的,其他更大的结果以后再说。我们把得到的第一个乘以2后大于M的结果记为M2。同样,我们把已有的每个丑数乘以3和5,能得到第一个大于M的结果M3和M5。那么下一个丑数应该是M2、M3和M5这3个数的最小者。

在前面分析的时候提到把已有的每个丑数分别乘以2、3和5。事实上这不是必需的,因为已有的丑数是按顺序存放在数组中的。对于乘以2而言,肯定存在某一个丑数T2,排在它之前的每个丑数乘以2得到的结果都会小于已有最大的丑数,在它之后的每个丑数乘以2得到的结果都会太大。我们只需记下这个丑数的位置,同时每次生成新的丑数的时候去更新这个T2即可。对于乘以3和5而言,也存在同样的T3和T5。

有了这些分析,我们就可以写出如下代码:

int GetUglyNumber_Solution2(int index)

{

if(index <= 0)

return 0;

int *pUglyNumbers = new int[index];

pUglyNumbers[0] = 1;

int nextUglyIndex = 1;

int *pMultiply2 = pUglyNumbers;

int *pMultiply3 = pUglyNumbers;

int *pMultiply5 = pUglyNumbers;

while(nextUglyIndex < index)

{

int min = Min(*pMultiply2 * 2, *pMultiply3 * 3, *pMultiply5 * 5);

pUglyNumbers[nextUglyIndex] = min;

while(*pMultiply2 * 2 <= pUglyNumbers[nextUglyIndex])

++pMultiply2;

while(*pMultiply3 * 3 <= pUglyNumbers[nextUglyIndex])

++pMultiply3;

while(*pMultiply5 * 5 <= pUglyNumbers[nextUglyIndex])

++pMultiply5;

++nextUglyIndex;

}

int ugly = pUglyNumbers[nextUglyIndex - 1];

delete[] pUglyNumbers;

return ugly;

}

int Min(int number1, int number2, int number3)

{

int min = (number1 < number2) ? number1 : number2;

min = (min < number3) ? min : number3;

return min;

}

和第一种思路相比,第二种思路不需要在非丑数的整数上进行任何计算,因此时间效率有明显提升。但也需要指出,第二种算法由于需要保存已经生成的丑数,则因此需要一个数组,从而增加了空间消耗。如果是求第1500个丑数,则将创建一个能容纳1500个丑数的数组,这个数组占据6KB的内容空间。而第一种思路没有这样的内存开销。总的来说,第二种思路相当于用较小的空间消耗换取了时间效率的提升。

源代码:

本题完整的源代码:

https://github.com/zhedahht/CodingInterviewChinese2/tree/master/49_ UglyNumber

测试用例:

功能测试(输入2、3、4、5、6等)。

特殊输入测试(边界值1;无效输入0)。

性能测试(输入较大的数字,如1500)。

本题考点:

考查应聘者对时间复杂度的理解。绝大部分应聘者都能想出第一种思路。在面试官提示还有更快的解法之后,应聘者能否分析出时间效率的瓶颈,并找出解决方案,是能否通过这轮面试的关键。

考查应聘者的学习能力和沟通能力。丑数对很多人而言是一个新概念。有些面试官喜欢在面试的时候定义一个新概念,然后针对这个新概念出面试题。这就要求应聘者听到不熟悉的概念之后,要有主动积极的态度,大胆向面试官提问,经过几次思考、提问、再思考的循环,在短时间内理解这个新概念。这个过程就体现了应聘者的学习能力和沟通能力。

面试题50:第一个只出现一次的字符

题目一:字符串中第一个只出现一次的字符。

在字符串中找出第一个只出现一次的字符。如输入"abaccdeff",则输出'b'。

看到这道题时,我们最直观的想法是从头开始扫描这个字符串中的每个字符。当访问到某字符时,拿这个字符和后面的每个字符相比较,如果在后面没有发现重复的字符,则该字符就是只出现一次的字符。如果字符串有n个字符,则每个字符可能与后面的O(n)个字符相比较,因此这种思路的时间复杂度是O(n2)。面试官不会满意这种思路,他会提示我们还有更快的方法。

由于题目与字符出现的次数相关,那么我们是不是可以统计每个字符在该字符串中出现的次数?要达到这个目的,我们需要一个数据容器来存放每个字符的出现次数。在这个数据容器中,可以根据字符来查找它出现的次数,也就是说这个容器的作用是把一个字符映射成一个数字。在常用的数据容器中,哈希表正是这个用途。

为了解决这个问题,我们可以定义哈希表的键值(Key)是字符,而值(Value)是该字符出现的次数。同时我们还需要从头开始扫描字符串两次。第一次扫描字符串时,每扫描到一个字符,就在哈希表的对应项中把次数加1。接下来第二次扫描时,每扫描到一个字符,就能从哈希表中得到该字符出现的次数。这样,第一个只出现一次的字符就是符合要求的输出。

哈希表是一种比较复杂的数据结构,C++标准模板库中的map和unordered_map实现了哈希表的功能,我们可以直接拿过来用。由于本题的特殊性,我们其实只需要一个非常简单的哈希表就能满足要求,因此我们可以考虑实现一个简单的哈希表。字符(char)是一个长度为8的数据类型,因此总共有256 种可能。于是我们创建一个长度为256的数组,每个字母根据其ASCII码值作为数组的下标对应数组的一个数字,而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256、以字符ASCII码为键值的哈希表。

第一次扫描时,在哈希表中更新一个字符出现的次数的时间是O(1)。如果字符串长度为n,那么第一次扫描的时间复杂度是O(n)。第二次扫描时,同样在O(1)时间内能读出一个字符出现的次数,所以时间复杂度仍然是O(n)。这样算起来,总的时间复杂度是O(n)。同时,我们需要一个包含256个字符的辅助数组,它的大小是1KB。由于这个数组的大小是一个常数,因此可以认为这种算法的空间复杂度是O(1)。

当我们向面试官讲述清楚这种思路并得到面试官的首肯之后,就可以动手写代码了。下面是一段参考代码:

char FirstNotRepeatingChar(char* pString)

{

if(pString == nullptr)

return '\0';

const int tableSize = 256;

unsigned int hashTable[tableSize];

for(unsigned int i = 0; i<tableSize; ++ i)

hashTable[i] = 0;

char* pHashKey = pString;

while(*(pHashKey) != '\0')

hashTable[*(pHashKey++)] ++;

pHashKey = pString;

while(*pHashKey != '\0')

{

if(hashTable[*pHashKey] == 1)

return *pHashKey;

pHashKey++;

}

return '\0';

}

源代码:

本题完整的源代码:

https://github.com/zhedahht/CodingInterviewChinese2/tree/master/50_01_FirstNotRepeatingChar

测试用例:

功能测试(字符串中存在只出现一次的字符;字符串中不存在只出现一次的字符;字符串中所有字符都只出现一次)。

特殊输入测试(字符串为nullptr指针)。

本题考点:

考查应聘者对数组和字符串的编程能力。

考查应聘者对哈希表的理解及运用。

考查应聘者对时间效率及空间效率的分析能力。当面试官提示最直观的算法不是最优解的时候,应聘者需要立即分析出这种算法的时间效率。在想出基于哈希表的算法之后,应聘者也应该分析出该方法的时间效率和空间效率分别是O(n)和O(1)。

本题扩展:

在前面的例子中,我们之所以可以把哈希表的大小设为256,是因为字符(char)是8bit的类型,总共只有256个字符。但实际上字符不只是256个,比如中文就有几千个汉字。如果题目要求考虑汉字,那么前面的算法是不是有问题?如果有,则可以怎么解决?

相关题目:

定义一

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

剑指Offer 文章被收录于专栏

《剑指Offer:名企面试官精讲典型编程题》剖析了50个典型的程序员面试题,从基础知识、代码质量、解题思路、优化效率和综合能力五个方面系统整理了影响面试的5个要点。全书分为7章,主要包括面试的流程,讨论面试流程中每一环节需要注意的问题;面试需要的基础知识,从编程语言、数据结构及算法三方面总结了程序员面试的知识点;高质量的代码、解决面试题的思路、优化时间和空间效率。

全部评论

相关推荐

过往烟沉:我说什么来着,java就业面就是广!
点赞 评论 收藏
分享
点赞 1 评论
分享
牛客网
牛客企业服务