用于识别 2D 特征的图像处理

2024-01-04

我创建了一个 iPhone 应用程序，它可以扫描一张方格纸的图像，然后告诉我哪些方块已被涂黑，哪些方块是空白的。

我通过从左到右扫描并使用方格纸的线条作为指导来完成此操作。当我遇到方格纸线时，我开始寻找黑色，直到再次碰到方格纸线。然后，我不再沿着扫描线继续扫描，而是继续完全扫描正方形以查找黑色。然后我继续到下一个盒子。在该行的末尾，我在开始新行扫描之前跳过了很多像素（因为我已经算出了每个盒子的高度）。

这种方法可行，但也存在问题。有时我会把图表线误认为是“黑色”。有时，如果图像倾斜，或者页面上没有均匀的照明，那么我就不会得到好的结果。

我想做的是指定一些“对齐”框，然后调整它们的大小并旋转（和倾斜）图片以与这些框对齐。然后，我在想，一旦我将图像对齐，我就会知道所有盒子在哪里，并且不必扫描盒子，只需扫描盒子的位置内部以查看它们是否是黑色的。这应该更快、更可靠。如果我要对来自相机的图像进行操作，我可以更灵活地要求用户对齐图片以匹配对齐标记，而不必自己对齐图像。

鉴于这是我的第一个图像处理项目，我觉得我正在重新发明轮子。我想要有关如何执行此操作以及是否使用 OpenCV 等库的建议。

I am enclosing an image similar to what I would like processed. I am looking for a list of all squares that have a significant amount of black marking, i.e. A8, C4, E7, G4, H1, J9. enter image description here

需要注意的问题：

图像的光覆盖范围可能不理想，但整个图像应该相对一致（即没有阴影）
所有方块可能都是空的或全黑的，算法需要能够确定
图像可能会围绕任何轴倾斜或旋转。绕 z 轴旋转可能很容易修复。可能会围绕 x 或 y 轴旋转，使图像的一侧比另一侧更宽。但是，如果我实时扫描来自相机的图像，我可以要求用户将对齐标记与屏幕上的标记对齐。如何最好地确保一致性以便为用户提供适当的反馈？当相机指向黑色表面时，仅检查以确保 4 个角是黑色的可能会导致误报。
并不是每个方格都会同样或一致地变黑，但我认为会有足够的黑色使其对人眼来说毫无疑问。
蓝色网格可能有用，但在某些情况下，黑色标记可能会与蓝色网格重叠。我认为虚拟网格可能比依赖打印网格更好。我认为使用对齐标记来对齐图像，然后可以布置精确的虚拟网格。然后可以对每个网格框的内容进行采样，看看它是否主要是黑色，而不是从左到右扫描，不是吗？这是另一张网格上有更多标记的图像。在这张图中，除了之前在A8、C4、E7、G4、H1、J9中标记之外，我还标记了E2、G8和G9，以及I4和J4，你可以看到蓝色网格是如何被遮挡的。

这是我这个项目的第一阶段。最终我想扩展这个算法，使其能够处理至少几百个槽和可能不同的颜色。

首先，这个问题让我想起了一些可能对学习有用的演示：

DNA微阵列图像处理 http://www.mathworks.com/matlabcentral/fileexchange/2573-dna-microarray-image-processing-case-study
Matlab 数独求解器 http://www.mathworks.com/videos/matlab/sudoku.html
Iphone 数独解算器 http://sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html博客文章，解释图像处理

就我个人而言，我认为最简单的方法是检测图像中的正方形。

1）去除背景和小瑕疵

f_makebw = @(I) im2bw(I.data, double(median(I.data(:)))/1.3);
bw = ~blockproc(im, [128 128], f_makebw);
bw = bwareaopen(bw, 30);

2）删除除正方形和圆形之外的所有内容。

se = strel('disk', 5);
bw = imerode(bw, se);

% Detect the squares and cricles via morphology
[B, L] = bwboundaries(bw, 'noholes');

3）使用“extend”检测正方形regionprops。 “范围”指标测量边界框被填充的比例。这使其成为区分圆形和正方形的好方法

stats = regionprops(L, 'Extent'); 
extent = [stats.Extent];
idx1 = find(extent > 0.8);
bw = ismember(L, idx1);

4) 这样您就可以使用自己的功能来同步或校正图像。要做到这一点，一种简单而可靠的方法是通过自相关函数。

这给出了很容易检测到的漂亮峰值。这些峰值可以通过匈牙利算法与模板图像中的 ACF 峰值进行匹配。一旦匹配，您就可以纠正旋转和缩放，因为您现在有了一个可以求解的线性系统：

x = Ax'

然后可以使用针对相同预定义模板的普通互相关来校正翻译。

如果一切顺利，您就知道有一个对齐或同步的图像，这将有助于确定点的位置。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

imageprocessing

opencv

用于识别 2D 特征的图像处理的相关文章

Pyinstaller“无法执行脚本 pyi_rth_pkgres”并且缺少软件包

这是我第一次在这里发布问题因为我的大部分问题已经被其他人回答了我正在 python 中开发 GUI 应用程序并尝试使用 pyinstaller 将其打包到单个文件夹和 exe 中以便于移植目前我使用 Windows 10 和 a
OpenCV：使用 StereoCamera 系统对颜色标记进行 3D 姿态估计

我有一个立体摄像系统并使用两者正确校准它 cv calibrateCamera and cv stereoCalibrate My reprojection error似乎没问题凸轮0 0 401427 凸轮1 0 388200 立体声
在 python lib 中导入和裁剪 jpeg 的快速方法

我有一个 python 应用程序可以导入 200k 图像裁剪它们并将裁剪后的图像呈现给 pyzbar 来解释条形码裁剪很有帮助因为图像上有多个条形码并且当给定较小的图像时 pyzbar 可能会更快一些目前我正在使用 Pillo
Opencv - 找不到头文件

我正在尝试使用 opencv 开始开发问题是到目前为止我几乎无法设置 opencv 因为我找不到它的头文件我对此主题进行了一些研究但没有一个真正有帮助下面是一些链接 opencv2 包含文件在哪里 https stackoverf
如何使用Java OpenCV

我正在使用图像处理开始我的最后一年项目并希望完成类似的事情this http www youtube com watch v EPai5f2sWaA 它是人体和物体检测的结合我真的很想用 Java 来做因为我在 C 方面的经验很少 I
OpenCV 完美识别物体

我有一个应用程序我想一次跟踪 2 个在图片中相当小的对象该应用程序应该在 Android 和 iPhone 上运行因此算法应该是高效的对于我的客户来说如果我们提供一些模式以及附加到要跟踪的对象的软件以获得易于识别的目标那就完全
剪切透明零件图像

The updated image 非常感谢你但我想做一些不同的事情将这里的每个矩形剪切为单独的图像让我们首先尝试找到蓝色块边界听起来很难但实际上很简单看看我到目前为止所做的事情 private unsafe Bitmap Co
MATLAB 教程中的 SIFT 实现

我正在寻找 MATLAB 中的一些基本 SIFT 实现我需要从第一原则来写它另外我正在寻找一些可以解释程序中发生的事情的内容 Vedali 的代码和 David Lowe 的代码超出了我的理解范围如果您是 Matlab 用户您一定
使用 OpenCV VideoWriter 将 RTSP 流存储为视频文件

我正在使用 OpenCV 开发一个 Python 模块该模块连接到 RTSP 流以对视频执行一些预处理主要是降低 fps 和分辨率然后将其存储在文件系统中但是即使在尝试了几种编解码器寻找类似的开发之后我总是得到一个空的视频我
警告：发生了非法反射访问操作（java 中的便携式 opencv）

我想做一个便携的opencv将依赖项添加到 maven 文件的应用程序pom xml 简化的代码是 import org opencv core Mat public class Builder public static void mai
OpenCV 旋转图像而不裁剪澄清

我想扩展这个主题参考用户 Lars Schillingmann 给出的这个 SO 问题和接受的答案在 C 中的 OpenCV 中旋转图像而不裁剪 https stackoverflow com questions 22041699 ro
opencv如何使用鼠标事件不规则地选择图像区域？ c/c++ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案最近在学习opencv 有没有办法使用鼠标事件选择图像区域我已经尝试过三角形的了如果我想选择特定区域而不是三角形怎么办谢谢你我对此进
如何将k4a_image_t转换为opencv矩阵？（Azure Kinect 传感器 SDK）

我开始尝试使用 Azure Kinect Sensor SDK 我经历了官方操作指南 https learn microsoft com en us azure Kinect dk about sensor sdk sensor sdk 我
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
Opencv 运动检测与跟踪

我需要在网络摄像头的视频帧中进行强大的运动检测和跟踪背景总是一样的目的是识别物体的位置如果可能的话没有阴影但并不急于去除阴影我已经尝试过用于背景减法和阈值化的opencv算法但这仅取决于一个图像作为背景如果背景的亮度或相机自
在 Python 中使用音频流 RTMP 通过管道和 OpenCV 到 FFmpeg

我正在尝试使用音频流式传输 FFmpeg 我将在下面展示我的代码导入模块 import subprocess as sp 创建变量 rtmpUrl rtmp a rtmp youtube com live2 key camera path
python openCV 中的人口普查变换

我开始在一个与立体视觉相关的项目中使用 openCV 和 python 我找到了关于使用 openCV 在 C 中进行人口普查转换的文档页面 link http docs opencv org 3 1 0 d2 d7f namespacec
为什么我们应该使用灰度进行图像处理

我认为这可能是一个愚蠢的问题但在阅读了大量内容并搜索了很多有关图像处理的内容之后我看到的有关图像处理的每个示例都使用灰度来工作我知道灰度图像只使用一个颜色通道通常只需要 8 位来表示等等但是当我们有彩色图像时为什么要使用灰度呢
如何平滑循环列向量

这是一个 OpenCV2 问题我有一个矩阵代表closed空间曲线 cv Mat
如何使用Android opencv使图像的白色部分透明

我无法链接超过 2 个网址因此我将我的照片发布到此博客请在这里查看我的问题 http blog naver com mail1001 220650041897 http blog naver com mail1001 220650041

随机推荐

Swift NSUserDefaults NSArray 使用 objectForKey

我对 Swift 还很陌生而且我已经陷入了困境我正在尝试从中检索数据NSUserDefaults并将其存储在数组中 tasks lazy var tasks NSArray let def NSUserDefaults standard
使用可读性 API 从页面中抓取最相关的图像

我正在使用可读性 API 来执行此操作在他们的例子中他们展示了lead img url但我拿不到它参考 https www readability com developers api parser https www readabi
在图表上设置标签的 Vba 代码

我在使用以下代码时遇到问题 Sub newC Dim ch As Chart Dim s As Series Dim objLabels As DataLabels Dim objLabel As DataLabel Range B65 I
如何在选择项目时保持组合框打开

我有一个 Windows 窗体自定义组合框托管在 dataGridView 中我不知道如何在用户选择项目时保持下拉列表打开没有结束事件可以结束有谁知道这是如何实现的我将不胜感激任何建议提前致谢 DA 您可以使用GetComboB
ElectronJS 生产应用程序中的安全数据库连接？

我最近开始使用 NodeJS 和 ElectronJS 进行开发以创建一些非常漂亮的跨平台软件我想更进一步并集成一些数据库功能虽然我知道有 mysql 软件包可供安装但我对任何人都可以解压我的 asar app 文件并查看所有连接详
python 上的 keras 和张量流 - ValueError: ('NumpyArrayIterator` 中的输入数据应具有等级 4。您传递了一个具有形状的数组', (36848,))

我也找过各种类似的问题但没有找到正确的答案寻找可以快速告诉我们答案的人请这是我的完整代码我想用韩语创建像 Mnist 这样的机器学习模型 ValueError 输入数据NumpyArrayIterator应该有等级 4 您传递了一
在不影响目标c质量的情况下缩小图像

如何以编程方式缩小图像而不影响质量捕获图像后我想减小该图像的大小而不改变 Objective c 中的质量这是我用来压缩图像的代码 Code UIImage compressImage UIImage image NSData img
压缩包含许多重复文件的文件夹[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个相当大的文件夹 10GB 其中在整个目录树中包含许多重复的文件其中许多文件重复了 10 次重复的文件不是并排存在而是位于不同
如何通过 IntelliJ 运行/调试配置运行 wdio？

我可以使用命令行运行测试 gt node modules bin wdio wdio conf js 但是如果我尝试从 IntelliJ 的运行调试配置运行它我会收到各种不同的错误功能文件或目录 path to my feature
WebView setDefaultZoom 已弃用

这是设置webview默认缩放的代码 mWebView getSettings setDefaultZoom WebSettings ZoomDensity FAR 工作但老了这setDefaultZoomvalue 已弃用有人知道新代
从另一个活动更改一个活动的背景

示例我有 3 个活动活动 1 活动 2 和活动 3 Activity1 包含一个按钮单击该按钮可以更改 Activity2 和 Activity3 的背景这可能吗如果是的话怎么办我对使用该方法有一个想法 example for
如果 rxjs 仍在加载数据，如何返回数据或等待

我有一个服务它使用 Observable 在其构造函数中加载一些数据然后在稍后的某个时间可以使用 getter 检索数据如果数据存在它应该立即返回数据或者等待加载完成如果仍在进行中我想出了以下示例代码在 Typescript
R Shiny 应用程序中的“下一步”按钮

我正在尝试使用 Shiny 构建一个逐步的应用程序我的目标是创建一个由数据库中编写的一堆问题组成的考试我需要的是一个下一步按钮当您单击另一个问题时会显示该按钮我一直在尝试使用操作按钮但它只是第一次起作用也就是说第一次单击
从 C++11 中的 std::exception 派生时的异常规范

我有一个异常类如下 include
Gridster 的替代品？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我已经用过Gridster http gridster net 使用拖放多列网格的项目的库遗憾的是
Angular HttpPromise：“success”/“error”方法和“then”参数之间的区别

根据AngularJS 文档 http docs angularjs org api ng 24http 调用 http返回以下内容返回一个promise符合标准的对象then方法和两个http具体方法 success and error
如何自定义条形注释以不显示所选值

我有以下数据集 data 6 92 1 78 0 0 0 0 3 5 8 82 3 06 0 0 0 0 5 54 10 8 6 03 0 0 0 0 6 8 13 69 8 61 9 98 0 0 9 42 4 91 3 54 2 62
Rails 生成迁移未将 :null => false 设置为created_at 和updated_at

我创建了一个全新的 Rails 应用程序生成一些脚手架和一些模型经过几次测试后我意识到 t timestamps 生成的列不包含传统 null gt false 选项我需要这种行为我看不出这是做什么的我重新创建了一个新应用程序
自定义列的 ExecuteStoreQuery

我正在尝试运行自定义查询并且正在使用实体框架我尝试了这个 string query SELECT dm DistrictName sm SchoolName u UserId u FirstName u LastName sa Stude
用于识别 2D 特征的图像处理

我创建了一个 iPhone 应用程序它可以扫描一张方格纸的图像然后告诉我哪些方块已被涂黑哪些方块是空白的我通过从左到右扫描并使用方格纸的线条作为指导来完成此操作当我遇到方格纸线时我开始寻找黑色直到再次碰到方格纸线然后我不再

用于识别 2D 特征的图像处理

用于识别 2D 特征的图像处理 的相关文章

随机推荐

热门标签

用于识别 2D 特征的图像处理的相关文章