12306验证码破解思路分享
2015-04-21来源:

一个12306验证码破解思路,

图片采集 + 概率

//分析:

1. 单次验证码里面有8个图片,类型最多8种,最少不太确定

2. 8个图是规则排列,可以很容易分隔

3. 图片库应该是有限的,可以采集,计算hash入库,这里需要关联相同类型图片

(比如 “杯子”,“刷子”等)

备注:这里的图片hash并不是md5,有很多算法,自行搜索吧。

//下面,我假设图片已经采集好了,分类也完成了,开始进行识别:

1. 选一张验证码,分隔成8个图片,分别计算hash,然后查询 这些hash对应的

类型(比如 “杯子”,“刷子”等),这里 假设图片识别正确率 100%

2. 随机选择一个上一步中查询到的类型,点击相应位置。 这里不需要识别上面的

汉字,按概率来说,极端情况,8个图片都不同,随机选择正确率 12.5%。于是,

理论上尝试8次以内,就能成功登录。

//难点:

1. 麻烦的可能是要分类,需要将相同类型的图片关联起来

//一些增加识别难度的建议

1. 图片中加入线形干扰,或者是 扭曲图片

2. 不规则排列8个图片,使之难以分割

// 仅仅凭借以往经验的一些思路,尚未实践。欢迎吐槽...

更多信息请查看IT技术专栏

推荐信息
Baidu
map