Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考...

2023-05-16

在自动化测试或者安全渗透测试中，Captcha验证码的问题经常困扰我们，还好现在OCR和AI逐渐发展起来，在这块解决上越来越支撑到位。

我推荐的几种方式，一种是对于简单的验证码，用开源的一些OCR图片处理包即可，对于复杂的识别率要求非常高的，可以考虑百度等公司的OCR有偿服务（当然注册后好像每天可以免费试用上百次，普通测试够用了）。

本人环境： win10,python3.x, pip( python3安装版会自带), pycharm, tesseract-ocr-setup-3.02.02.exe，

pytesser3 ，pytesseract ,selenium(chrome浏览器以及匹配版本的浏览器驱动geckodriver.exe),pillow 5.3,pillow-PIL 0.1

注意事项：

A.务必单独下载安装tesseract-ocr-setup-3.02.02.exe（会自动配置好PATH环境变量），安装好后可以运行DOS命令执行

tesseract G:\temp\captcha\image_code.png g:\temp\abc_123 digits_numbers

tesseract 要识别的图片识别出来后字符的保存文件，默认为.txt ， tesseract安装后Tesseract-OCR\tessdata\configs\路径有个digits文件，可以定义识别白名单，比如只识别数字等，使用后可以提高识别率，可以在原来文件直接改，我这里是复制后修改并且重新命名为digits_numbers，如果不使用白名单命令行可以不加digits_numbers

B.在pytesser3目录下的__init__.py文件里，要修改好以下这行，主要是配置好tesseract.exe的安装路径，注意.exe不需要写

#请务必修改下面的tesseract的name 换成你安装的ocr路径，谢谢！
tesseract_exe_name = 'D:\\programs\\Tesseract-OCR\\tesseract' # Name of
#tesseract_exe_name = 'c:\\Program Files (x86)\\Tesseract-OCR\\tesseract'

以下是pycharm下的工程包和OCR核心源码，至于后续识别后如何登陆就是普通的接口测试或者selenium等UI自动化范畴了，此处省略一万字。如果连UI自动化都不精，不建议直接做这个，赶快回家看书去。


from selenium import webdriver
import pytesser3
import os
import sys, time
from PIL import Image, ImageEnhance

url = "http://登陆的URL"

driver = webdriver.Chrome()

time.sleep(2)

driver.get(url)

time.sleep(5)

try:
    account = driver.find_element_by_id('_account')
    password = driver.find_element_by_id('_password')
    region = driver.find_element_by_id('_regionId')
    captcha = driver.find_element_by_id('_captcha')
except:
    print("查找元素出现异常")

#  网页截图 + 验证码截图
try:
    driver.get_screenshot_as_file('G:\\temp\\page\\loginPage1.png')  # 比较好理解
    im = Image.open('G:\\temp\\page\\loginPage1.png')
    box = (884, 684, 1024, 734)  # 设置要裁剪的区域，这个坐标是验证码图片这个长方形的左上角坐标和右下角坐标，不懂可以问UI美工，用图形编辑工具很容易获得
    region = im.crop(box)  # 此时，region是一个新的图像对象。
    region.save("G:\\temp\\captcha\\image_code.png")
except:
    print("网页截图 + 验证码截图出现异常")

driver.close()
# --------------------图片增强+自动识别简单验证码-----------------------------
# 防止图片还没保存好，就开始识别
time.sleep(3)
im = Image.open("G:\\temp\\captcha\\image_code.png")
imgry = im.convert('L')  # 图像加强，二值化
sharpness = ImageEnhance.Contrast(imgry)  # 对比度增强
sharp_img = sharpness.enhance(2.0)
sharp_img.save("G:\\temp\\captcha\\image_code.png")


time.sleep(2)

def image_file_to_string(file):
    cwd = os.getcwd()
    try:
        os.chdir("D:\\programs\\Tesseract-OCR")
        return pytesser3.image_file_to_string(file)
    finally:
        os.chdir(cwd)


# code即为识别出的图片数字str类型


code = image_file_to_string("G:\\temp\\captcha\\image_code.png")


time.sleep(1)
print(code)

后续省略一万字，自己用次code去完成接下来的自动化登陆即可.... 
有些复杂点的图片验证码识别率不高，是的，一开始我就说了，

改进参考：

1. 真正应用的时候可以考虑把打开浏览器，截图等事情换个实现方式，使用内核浏览器操作，而非真正打开可见的浏览器，这样更快。

2. OCR识别部分还需要用你要实现产品的验证码样本进行tesseract的进一步学习训练，或者换用商用OCR工具，识别率更高

转载于:https://www.cnblogs.com/sea520/p/10030317.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考... 的相关文章

如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

如何给自己的Python项目制作安装包

Packaging Python Projects 本教程将指导您如何打包一个简单的Python项目它将向您展示如何添加必要的文件和结构来创建包 xff0c 如何构建包以及如何将其上载到Python包索引 A simple project
linux安装解压工具gzip,笔记6 压缩工具（gzip，bzip2，xz，zip，tar）。

压缩打包常见的压缩文件 windows rar zip 7z Linux zip gz bz2 xz tar gz tar bz2 tar xz gzip压缩工具不能压缩目录 gzip压缩后边直接跟文件名就可以 xff0c gunzip
洛谷 P3367 【模板】并查集

P3367 模板并查集题目描述如题 xff0c 现在有一个并查集 xff0c 你需要完成合并和查询操作输入输出格式输入格式 xff1a 第一行包含两个整数N M xff0c 表示共有N个元素和M个操作接下来M行 xff0c 每行
js计算器（正则）

lt doctype html gt lt html gt lt head gt lt meta charset 61 34 utf 8 34 gt lt title gt 我的计算器 lt title gt lt style gt mar
MySQL 分组后取每组前N条数据

与oracle的 rownumber over partition by xxx order by xxx 语句类似 xff0c 即 xff1a 对表分组后排序创建测试emp表 DROP TABLE IF EXISTS emp CREAT
archlinux 安装搜狗输入法

安装可能需要 archlinuxcn 的源 xff0c 我这里已经配置好了一安装 fcitx fcitx configtool fcitx im pacman S fcitx fcitx configtool fcitx im 二在
MongoDB——JavaAPI详解

环境配置引入MongoDB驱动 xff1a span class token tag span class token tag span class token punctuation lt span dependency span sp
练习题||并发编程

线程进程队列 IO多路模型操作系统工作原理介绍线程进程演化史特点区别互斥锁信号事件 join GIL 进程间通信管道队列生产者消息者模型异步模型 IO多路复用模型 select poll epoll 高性能IO模
luogu P2078 朋友

题目背景小明在A公司工作 xff0c 小红在B公司工作题目描述这两个公司的员工有一个特点 xff1a 一个公司的员工都是同性 A公司有N名员工 xff0c 其中有P对朋友关系 B公司有M名员工 xff0c 其中有Q对朋友关系朋友的朋
Debian 9 Stretch国内常用镜像源

使用说明一般情况下 xff0c 修改 etc apt sources list文件 xff0c 将Debian的默认源地址改成新的地址即可 xff0c 比如将http deb debian org改成https mirrors xxx c
ubuntu下编译ffmpeg并用eclipse调试

一下载ffnpeg源码下载地址 xff1a http ffmpeg org download html 二解决版本问题可能之前你编译过ffmpeg xff0c 或者装过相关的库 xff0c 那都要先卸载掉 xff0c 否则用的时候会
定时器初值计算

1 定时器初值的计算 xff1a xff08 1 xff09 计算出机器周期每次定时计算器加1所用的时间 xff08 2 xff09 根据你要定时的时间去算出初值 xff1a 假设你要定时Xms xff08 X lt 65 535ms x
ceph部署出现错误及解决

ceph deploy new error hostname node1 is not resolvable 解决办法 xff0c 修改 etc hosts 127 0 0 1 localhost 127 0 1 1 ubuntu1 192
WordNet词网研究6——之JWI（Java Wordnet Interface)WordNet Java接口

JWI the MIT Java Wordnet Interface is a Java library for interfacing with Wordnet JWI supports access to Wordnet version
SPI协议及其工作原理详解

一概述 SPI Serial Perripheral Interface 串行外围设备接口是 Motorola 公司推出的一种同步串行接口技术 SPI 总线在物理上是通过接在外围设备微控制器 PICmicro 上面的微处理控制单元 MC
通过修改qt设置，解决LINK : fatal error LNK1104: 无法打开文件“kernel32.lib”

编译为知笔记源码的时候遇到的第一个错误 LINK fatal error LNK1104 无法打开文件 kernel32 lib 经研究发现是qt使用的本地编译连接工具cl exe找不到 windows sdk的lib文件导致找到lib文
CF1042B 【Vitamins】（去重，状压搜索）

由题意我们其实会发现对于每一种果汁 xff0c 其对应的状态只有可能有7种 VA VB VC VA 43 VB VA 43 VC VB 43 VC VA 43 VB 43 VC 这道题就大大简化了
SpringBoot——整合MongoDB详解

引入依赖 span class token tag span class token tag span class token punctuation lt span dependency span span class token pun
洛谷 P1991 无线通讯网/一本通OJ 1487【例 2】北极通讯网络

要求用尽可能小的代价使图联通 xff0c 考虑最小生成树如果不断加边 xff0c 将分散的点连结为 p s 个联通块 xff0c 则 s 个无线电站可以分布在每个联通块中的任意点而此处要求的半径D是对于所有点的覆盖半径 xff0c 相当
Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考...

在自动化测试或者安全渗透测试中 xff0c Captcha验证码的问题经常困扰我们 xff0c 还好现在OCR和AI逐渐发展起来 xff0c 在这块解决上越来越支撑到位我推荐的几种方式 xff0c 一种是对于简单的验证码 xff0c 用开

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考...

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考... 的相关文章

随机推荐

热门标签