图像验证码识别（九）——训练和识别

2023-11-20

前面讲到已经把所有的字符经过去干扰、分割和归一化得到标准大小的单个字符，接下来要做的就是识别验证码了。现在要做的基本上也就和OCR没什么区别了，因为得到的字符已经是尽可能标准的了。下面的识别分为两个步骤，第一步先是特征值的提取，第二步是SVM训练。

一、特征值提取

首先要说的是我当时在做这个的时候，还没有了解“主成分分析”，所以在提取特征值的时候用的是比较简单的方法，就是简单的提取像素值来解决的。具体来说，由于前面归一化的字符每个都是16*16大小的，可以将字符图片等分为16个子区域，每个区域是4*4的，然后统计每个区域内部黑色像素（字符像素）的个数，这样可以得到16个数值，然后按照从左到右，从上到下来的顺序进行排列，可以得到一个16维的数据，这样依赖就将256维的原数据降到了16维。

现在要做的就是如果想验证哪个网站的验证码，就写个爬虫爬该网站的验证码，爬个几百张然后对每一张验证码上的字符进行标记，然后按照前面的步骤一步一步预处理然后提取特征值，将每个字符的特征值和其标记的字符写入到数据文件中，在这里我取了某网站的验证码一共250张，每张有4个字符，字符集只有大写字母26个和0-9十个数字，这样得到了1000条数据，由于字符存在粘连状况，因此在字符分割那一部分并不是100%成功，最后有十几张验证码图片分割失败，所以最终得到的数据集个数只有900多个。部分数据如下：

[cpp] view plain copy

D,0,4,7,12,9,9,4,12,7,8,4,12,0,8,8,2
N,0,1,5,6,9,15,7,2,0,5,14,7,6,9,7,3
Y,3,1,0,0,5,12,9,8,3,12,4,1,5,0,0,0
2,0,0,0,1,7,2,7,12,8,9,8,8,0,3,0,0
Z,0,0,1,8,13,1,10,12,12,11,1,12,5,1,0,2
I,0,0,0,0,0,1,4,6,7,11,7,3,0,0,0,0
Z,0,0,1,6,12,1,11,12,12,12,2,12,6,1,0,0
5,0,0,1,0,6,12,4,9,8,7,9,8,2,0,0,0
G,0,9,8,3,8,7,5,11,12,1,10,11,3,6,9,1
7,0,0,0,0,8,1,6,11,9,10,6,0,2,1,0,0
M,0,4,7,10,8,16,11,9,0,4,12,7,9,14,13,8
D,0,1,4,5,11,10,9,12,12,1,3,10,5,11,11,1
3,0,0,1,1,6,2,2,10,10,9,12,8,0,2,0,0
F,0,0,4,6,7,13,12,4,8,8,8,0,5,3,2,0
N,0,0,5,6,9,15,6,2,0,5,11,7,7,10,5,3
X,1,0,0,7,7,11,12,4,3,13,10,8,9,2,0,1
2,0,0,0,2,8,4,6,13,9,11,9,7,2,3,0,0
P,1,0,4,5,11,12,11,4,12,6,8,0,4,10,1,0
J,0,0,2,2,0,0,3,13,4,10,11,6,3,2,0,0
V,4,4,3,0,2,6,9,16,0,7,12,4,6,6,0,0
7,1,0,0,0,8,5,10,9,12,8,0,0,1,0,0,0
W,9,12,12,9,4,8,11,1,9,10,11,9,4,9,9,2

数据集每行代表一条数据，第一个字母或数字是该字符的标记结果，后面紧跟着16个数字是其特征值。

二、机器学习识别

现在终于到了验证码识别的最后一步了，有了前面的数据集，就可以进行训练了。我在这里使用的分类器是SVM，由于整个项目都是用OpenCV做的，而OpenCV正好提供SVM的库，因此就直接拿来用了。OpenCV的SVM是基于libSVM的，有关SVM（支持向量机）的知识我也了解的不是太多，这里不再赘述，有兴趣的可以去找找资料看看。在OpenCV的源代码工程里，可以找到怎么使用OpenCV SVM的demo，这里就直接拿来用了，代码如下：

[cpp] view plain copy

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像验证码识别（九）——训练和识别的相关文章

“构建”构建我的项目，“构建解决方案”则不构建

我刚刚开始使用VS2010 我有一个较大的解决方案已从 VS2008 成功迁移我已将一个名为 Test 的控制台应用程序项目添加到解决方案中选择构建 gt 构建解决方案不编译新项目选择构建 gt 构建测试确实构建了项目在失败的情况
为什么两个不同的 Base64 字符串的转换会返回相等的字节数组？

我想知道为什么从 base64 字符串转换会为不同的字符串返回相同的字节数组 const string s1 dg const string s2 dq byte a1 Convert FromBase64String s1 byte a2
在结构中使用 typedef 枚举并避免类型混合警告

我正在使用 C99 我的编译器是 IAR Embedded workbench 但我认为这个问题对于其他一些编译器也有效我有一个 typedef 枚举其中包含一些项目并且我向该新类型的结构添加了一个元素 typedef enum fo
不支持将数据直接绑定到存储查询（DbSet、DbQuery、DbSqlQuery）

正在编码视觉工作室2012并使用实体模型作为我的数据层但是当页面尝试加载时上面提到的标题我使用 Linq 语句的下拉控件往往会引发未处理的异常下面是我的代码 using AdventureWorksEntities dw new
ASP.NET MVC：这个业务逻辑应该放在哪里？

我正在开发我的第一个真正的 MVC 应用程序并尝试遵循一般的 OOP 最佳实践我正在将控制器中的一些简单业务逻辑重构到我的域模型中我最近一直在阅读一些内容很明显我应该将逻辑放在域模型实体类中的某个位置以避免出现贫血域模型反模式
为什么当实例化新的游戏对象时，它没有向它们添加标签？ [复制]

这个问题在这里已经有答案了 using System Collections using System Collections Generic using UnityEngine public class Test MonoBehaviou
HTTPWebResponse 响应字符串被截断

应用程序正在与 REST 服务通信 Fiddler 显示作为 Apps 响应传入的完整良好 XML 响应该应用程序位于法属波利尼西亚在新西兰也有一个相同的副本因此主要嫌疑人似乎在编码但我们已经检查过但空手而归查看流读取器的输出字
Clang 3.1 + libc++ 编译错误

我已经构建并安装了在前缀下 alt LLVM Clang trunk 2012 年 4 月 23 日在 Ubuntu 12 04 上成功使用 GCC 4 6 然后使用此 Clang 构建的 libc 当我想使用它时我必须同时提供 lc
不同枚举类型的范围和可转换性

在什么条件下可以从一种枚举类型转换为另一种枚举类型让我们考虑以下代码 include
C++ OpenSSL 导出私钥

到目前为止我成功地使用了 SSL 但遇到了令人困惑的障碍我生成了 RSA 密钥对之前使用 PEM write bio RSAPrivateKey 来导出它们然而手册页声称该格式已经过时实际上它看起来与通常的 PEM 格式不同相
带动态元素的 WPF 启动屏幕。如何？

我是 WPF 新手我需要一些帮助我有一个加载缓慢的 WPF 应用程序因此我显示启动屏幕作为权宜之计但是我希望能够在每次运行时更改屏幕并在文本区域中显示不同的引言这是一个生产力应用程序所以我将使用非愚蠢但激励性的引言当然如
使用 Bearer Token 访问 IdentityServer4 上受保护的 API

我试图寻找此问题的解决方案但尚未找到正确的搜索文本我的问题是如何配置我的 IdentityServer 以便它也可以接受授权带有 BearerTokens 的 Api 请求我已经配置并运行了 IdentityServer4 我还在
控件的命名约定[重复]

这个问题在这里已经有答案了 Microsoft 在其网站上提供了命名指南 here http msdn microsoft com en us library xzf533w0 VS 71 aspx 我还有框架设计指南一书我找不到有关
为什么编译时浮点计算可能不会得到与运行时计算相同的结果？

In the speaker mentioned Compile time floating point calculations might not have the same results as runtime calculation
cmake 将标头包含到每个源文件中

其实我有一个简单的问题但找不到答案也许你可以给我指一个副本所以问题是是否可以告诉 cmake 指示编译器在每个源文件的开头自动包含一些头文件这样就不需要放置 include foo h 了谢谢 CMake 没有针对此特定用例的
如何将带有 IP 地址的连接字符串放入 web.config 文件中？

我们当前在 web config 文件中使用以下连接字符串 add name DBConnectionString connectionString Data Source ourServer Initial Catalog ourDB P
基于 OpenCV 边缘的物体检测 C++

我有一个应用程序我必须检测场景中某些项目的存在这些项目可以旋转并稍微缩放更大或更小我尝试过使用关键点检测器但它们不够快且不够准确因此我决定首先使用 Canny 或更快的边缘检测算法检测模板和搜索区域中的边缘然后匹配边缘以查
C# 模拟VolumeMute按下

我得到以下代码来模拟音量静音按键 DllImport coredll dll SetLastError true static extern void keybd event byte bVk byte bScan int dwFlags
如何在文本框中插入图像

有没有办法在文本框中插入图像我正在开发一个聊天应用程序我想用图标图像更改值等但我找不到如何在文本框中插入图像 Thanks 如果您使用 RichTextBox 进行聊天请查看Paste http msdn microsoft co
对来自流读取器的过滤数据执行小计

编辑问题未得到解答我有一个基于 1 个标准的过滤输出前 3 个数字是 110 210 或 310 给出 3 个不同的组从流阅读器控制台问题已编辑因为第一个答案是我给出的具体示例的字面解决方案我使用的实际字符串长度为 450 个

随机推荐

手动搭建torch2.0环境

一下载相关whl 1 从Previous PyTorch Versions PyTorch检查相互版本是否兼容否则会出现无法使用cuda的问题 2 从https download pytorch org whl torch stable
阶乘质因子分解（唯一分解定理）

阶乘质因子分解题目描述对N 进行质因子分解输入输出格式输入格式输入数据仅有一行包含一个正整数N N lt 10000 输出格式输出数据包含若干行每行两个正整数p a 中间用一个空格隔开表示N 包含a个质因子p 要求按p的值从
Python JS逆向篇（一）

Python JS逆向篇一效果实现思路最后一步逆向 p a HmacSHA256 t s a state commonStore cupid sign key JS实现 py实现先苦后甜逆向主题 51job请求头headers
【NodeJS】Express框架快速入门

简介作为前端开发 Nodejs已经成了很多公司对我们这一岗位的硬性要求而 Express 框架则是其中知名度最高也是最受欢迎的Nodejs开发框架它帮助我们封装了Nodejs底层的API 屏蔽了大量的繁琐的细节让我们只需要关注业务
Mybatis框架解析

一 Mybatis框架简介 MyBatis框架是一个开源的数据持久层框架它的内部封装了通过JDBC访问数据库的操作支持普通的SQL查询存储过程和高级映射几乎消除了所有的JDBC代码和参数的手工设置以及结果集的检索 MyBatis作为
PAM机制

一 PAM简介 Linux PAM linux可插入认证模块是一套共享库使本地系统管理员可以随意选择程序的认证方式换句话说不用重新编写和重新编译一个包含PAM功能的应用程序就可以改变它使用的认证机制这种方式下就算升级本地认
无监督低照度图像增强网络ZeroDCE和SCI介绍

目录简介 Zero DCE 算法介绍模型代码无监督loss介绍小结 Self Calibrated Illumination SCI 模型介绍无监督loss介绍小结总结简介当前有较多深度学习的方法来做图像效果增强但多数都
量化投资学习-31：如何评判专家的战法是否真的有效还是瞎蒙？

每逢牛市都会冒出各种股神各种专家在牛市大趋势的东风下各种专家鱼龙混杂如何如何评判专家的战法是否真的有效还是瞎蒙所谓牛市就是高点越来越高即使在任何一个时间点买入短暂的亏损后股价也再创新高一样能赚钱因此在牛市的大势下
三个闭环负反馈PID调节系统：电流环、速度环和位置环的关系

三个闭环负反馈PID调节系统电流环速度环和位置环的关系伺服电机为了达到生产的精准控制电机一般采用三环控制这主要是为了使伺服电机系统形成闭环控制所谓三环就是3个闭环负反馈PID调节系统电压映射电流变化电流映射转矩大小转矩大小
Sql语句中的DML语句

一什么是DML语句 DML语句就是数据库操作语句二 DML语句的分类 Insert 插入 Update 修改更新 Delete 删除 Select 选择三 insert语句 Delete from 表名名称 where 条件 DELE
windows下配置Mysql-5.7.9服务

第一步从官方网站下载 mysql 5 7 9 winx64 zip 第二步解压缩在根目录下复制my default ini 改名为my ini 第三步初始化mysql目录 bin mysqld initialize user mys
在渗透测试中，扫描器原理是什么

在渗透测试中扫描器原理是什么渗透测试中的扫描器是一种自动化工具用于识别目标系统中的漏洞弱点或配置错误扫描器通过发送特定的网络请求或使用其他技术手段来检查目标系统的安全性并生成报告以供分析和修复以下是扫描器的一般原理 1 信息收
一眼看懂promise与async await的区别

promise方法 let p1 new Promise resolve reject gt setTimeout gt resolve 我是p1 4000 let p2 new Promise resolve reject gt setT
12.HTML5下一代的HTML标准介绍与初识尝试

关注回复学习交流群加入安全开发运维答疑交流群请朋友们多多点击文中的广告支持作者更新更多文章目录本文为作者原创文章为尊重作者劳动成果禁止非授权转载若需转载请在全栈工程师修炼指南公众号留言或者发送邮件到 master
运维之Linux发行版和容器镜像网站及开源软件收集

关注 WeiyiGeek 公众号将我设为特别关注每天带你玩转网络安全运维应用开发物联网IOT学习 0x00 概述 0x01 镜像源网站国内镜像国内高校 0x02 发行版官网 CentOS kail Debian Ubuntu
客户机操作系统已禁用 CPU。请关闭或重置虚拟机。解决方法

今天在用VMware安装CentOS7报了这个错误在网上找半天都没解决最后换一个地址下的镜像就能正常安装了 Index of centos 7 9 2009 isos x86 64
12_Linux ARM架构_安装JDK8-银河麒麟V10（Kylin Linux Advanced Server V10 ）操作系统

12 Linux ARM架构安装JDK8 银河麒麟V10 Kylin Linux Advanced Server V10 操作系统 1 官网下载aarch64架构jdk包 2 linux服务器中创建java文件夹方便后期快速寻找 3 将
DevC++如何改成中文？

DevC 如何改成中文 1 点击Tools工具 2 选择环境选项 3 选择简体中文 4 点击确定
深入理解Google Cast（一）基本概念

什么是google cast google cast允许用户将手机上的内容投影到TV上然后用户可以将手机作为遥控器来控制TV上的媒体播放 Google cast SDK用于扩展你的app 使其支持google cast功能一个Cast
图像验证码识别（九）——训练和识别

前面讲到已经把所有的字符经过去干扰分割和归一化得到标准大小的单个字符接下来要做的就是识别验证码了现在要做的基本上也就和OCR没什么区别了因为得到的字符已经是尽可能标准的了下面的识别分为两个步骤第一步先是特征值的提取第二步是SV

图像验证码识别（九）——训练和识别

图像验证码识别（九）——训练和识别 的相关文章

随机推荐

热门标签

图像验证码识别（九）——训练和识别的相关文章