腾讯和阿里的笔试刚过去了,里面有很多题都很值得玩味的。之前Blog积累的很多东西,还要平时看的书,都有很大的帮助。这个深有体会啊!
例如,腾讯有一道算法题是吃香蕉(好邪恶的赶脚..),一次吃一根或者两根,50根香蕉可以有多少种吃法?当时我一看尼玛,不就是我之前总结过的:递归算法,JavaScript实现。里面的走楼梯的问题,我到现在还是记得的。(但是为了抗议我对卷纸的不专业性,我用CoffeeScript实现了算法…感觉可能会因此跪下。)然后就是有一道选择题,考的是Javascript的闭包陷阱,我一看尼玛,不是我之前总结过的:循环闭包的影响以及其解决方案。我也是一模一样用setTimeout去模拟的。简直不能再爽。当然,也不得不说,腾讯到最后也只有这两题和前端有一点联系。
相比之下,阿里就好很多了。虽然时间很紧,题目很多,但起码不会一抬眼全是熟悉的陌生人。印象比较深的是《Javascript设计模式》里的观察者模式,还有《Javascript高级程序设计》里的有关CookieUtil的。。但是,我有一题,完全不记得如何做了。那就是今天的主角,KMP算法!
上面扯淡完毕了。个人博客嘛,随心所欲啦。先给参考资料的地址:字符串匹配的KMP算法。这个是阮一峰老师的博文,算是写的很不错的了。想看生动形象的博文的同学可以直接移步过去。
那这个用于字符串匹配的KMP算法到底怎么用的呢。我们先看看需求:字符串A=”BBCABCDABABCDABCDABDE”里如何快速匹配到a=“ABCDABD”。用伪代码来写这些步骤应该是这样的:
- 字符串的首位与子字符串的首位进行匹配,匹配失败,则字符串后移继续匹配。匹配成功,则字符串与子字符串一起后移,继续匹配。
- 继续匹配的过程中,最理想的状态便是从头到尾成功,然后匹配过程也就结束了。倘若中途有不匹配的,子字符串就要回滚。
问题来了:子字符串回滚到哪儿?若是回滚到匹配开始的下一位,那当然是可以的,只不过是做了很多的无用功。所以KMP算法就是为了这个时候诞生的,可以有效的提高效率。
这里我用阮老师的一张图更好的解释一下。
我们可以看到,最佳的回滚位置应该是让子字符串的“C”对应空格。这样我们才可以最优化的处理重复的“AB”这个东西。
直接看一个公式:回滚位数 = 已匹配的字符数 - 对应的部分匹配值
。我们可以看到已经匹配的字符数是6,然后最佳的回滚位数是4,那么对应的部分匹配值应该是2,那这个2是怎么来的?
这就是KMP算法的精华。对于一个字符串:“ABCDABD”
- 前缀有:A,AB,ABC,ABCD,ABCDA,ABCDAB
- 后缀有:BCDABD,CDABD,DABD,ABD,BD,D
1 | * "A"的前缀和后缀都为空集,共有元素的长度为0; |
所以我们最终只要观察到共有元素的最大长度,即可使用公式。那我们要实现这个算法,就要取得部分匹配表的算法和回滚算法。那我们看一下该如何实现。
1 | var kmpGetPartMatchLen = function(str){ |
上面这个是取出部分匹配表的算法的实现,然后接下来就是回滚算法的实现。
1 | var kmp = function(sourceStr, subStr){ |
那回到我们的笔试题,要实现手机号后四位在π中匹配的位置,那现在就是一句话的事情啦!
1 | var π = "3.1415926.........." |