首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python 2.7.x 和 3.x 版

python现在很火,最近花了些时间去了解了一下,最初了解的是2.7.x版本,感觉,从书写上是很不习惯,少了一双大概号,取而代之的是缩进;然后跟kotlin和swift一样省去了每行的分号,象我们这种分号强迫症的人真心的不习惯;还有!True的条件改成not True、while后面可以跟else等等这些,真心不习惯啊!用2.7.x做了几天的测试,基本慢慢算有个了解了,也试着爬了些行业网的数据,感觉这个比PHP写爬虫方便很多。然后昨晚就在家里装了个3.X的版本,很悲催的发现,原来写的有很多的错误,万般无奈的检查之下,发现语句上是没什么问题,只是3.X版本不兼容部分的语句,例如最常用的print,raw_input都不一样了,今天花了些时间查一查,并总结了一下它们的区别。

03

结合连通块平均分割以及投影矫正的验证码分割算法

在上一节 中记录了基于投影的验证码矫正算法的实现。通过矫正,我们可以比较好的将倾斜的字符归一成较为规整的字符,接下来我们需要对矫正后的字符进行分割。简单的方法大概是投影法了,但是很明显,这样做的可靠性并不够。我们也可以找到整张图的最左端和最右端然后平均分割,但是在字符大小不一样的情况下效果也太好。还有个朴素的方法就是找连通块,但是由于存在字符粘连问题,连通块也不能完全区分字符。那么我这里就结合后两种方法,先进行连通块分割,对于能分割的字符直接进行后续处理,对于不能分割的字符再用平均分割的方法分割处理。实践表明这种方法对于那些干扰线不明显的验证码(比如新浪微博的验证码)的分割效果还是不错的。

01
领券