如何检测桌子的水平线和垂直线并消除噪音？

2023-12-21

I am trying to get the horizontal and vertical lines of the table in an image in order to extract the texts in cells. Here's a picture I use:

我使用下面的代码来提取垂直线和水平线：

img = cv2.imread(img_for_box_extraction_path, 0)  # Read the image
(thresh, img_bin) = cv2.threshold(img, 200, 255,
                                  cv2.THRESH_BINARY | cv2.THRESH_OTSU)  # Thresholding the image
img_bin = 255-img_bin  # Invert the image
cv2.imwrite("Image_bin_2.jpg",img_bin)

# Defining a kernel length
kernel_length = np.array(img).shape[1]//140

# A verticle kernel of (1 X kernel_length), which will detect all the verticle lines from the image.
verticle_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1, kernel_length))

# A horizontal kernel of (kernel_length X 1), which will help to detect all the horizontal line from the image.
hori_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (kernel_length, 1))

# A kernel of (3 X 3) ones.
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

# Morphological operation to detect verticle lines from an image
img_temp1 = cv2.erode(img_bin, verticle_kernel, iterations=3)
verticle_lines_img = cv2.dilate(img_temp1, verticle_kernel, iterations=3)
cv2.imwrite("verticle_lines_2.jpg",verticle_lines_img)

# Morphological operation to detect horizontal lines from an image
img_temp2 = cv2.erode(img_bin, hori_kernel, iterations=3)
horizontal_lines_img = cv2.dilate(img_temp2, hori_kernel, iterations=3)
cv2.imwrite("horizontal_lines_2.jpg",horizontal_lines_img)

The pictures below are the horizontal lines and vertical lines:

我使用下面的代码将两个图像添加在一起

# Weighting parameters, this will decide the quantity of an image to be added to make a new image.
alpha = 0.5
beta = 1.0 - alpha

# This function helps to add two image with specific weight parameter to get a third image as summation of two image.
img_final_bin = cv2.addWeighted(verticle_lines_img, alpha, horizontal_lines_img, beta, 0.0)
img_final_bin = cv2.erode(~img_final_bin, kernel, iterations=2)
(thresh, img_final_bin) = cv2.threshold(img_final_bin, 128, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)

# For Debugging
# Enable this line to see verticle and horizontal lines in the image which is used to find boxes
cv2.imwrite("img_final_bin_2.jpg",img_final_bin)

However, I get a picture like this: How do I remove the noise and get a better result? Thanks in advance.

这是一个简单的方法：

二值图像

检测到水平

检测到垂直

组合面罩

需要删除的绿色线

Result

import cv2
import numpy as np

# Load image, grayscale, Gaussian blur, Otsu's threshold
image = cv2.imread('1.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (3,3), 0)
thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Detect horizontal lines
horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (50,1))
horizontal_mask = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=1)

# Detect vertical lines
vertical_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (1,50))
vertical_mask = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, vertical_kernel, iterations=1)

# Combine masks and remove lines
table_mask = cv2.bitwise_or(horizontal_mask, vertical_mask)
image[np.where(table_mask==255)] = [255,255,255]

cv2.imshow('thresh', thresh)
cv2.imshow('horizontal_mask', horizontal_mask)
cv2.imshow('vertical_mask', vertical_mask)
cv2.imshow('table_mask', table_mask)
cv2.imshow('image', image)
cv2.waitKey()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

image

opencv

imageprocessing

ComputerVision

如何检测桌子的水平线和垂直线并消除噪音？的相关文章

光学标记阅读器的开源库[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想要一个用于光学标记读取 OMR 的开源库有这样的库吗我想在我的 java 应用程序中使用这个库 zxing 可能对你有用 http
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
我可以将 OpenCV 的发布配置与我的应用程序的调试配置一起使用吗？

我正在编写一个通用 Windows 应用程序它使用 OpenCV 进行相机校准和标签检测等我希望能够在我自己的 DLL 处于调试模式时使用发布模式完全优化的 OpenCV DLL 这可能吗如果是这样我如何配置 CMake 来实现它
为 Networkx 图添加标题？

我希望我的代码创建一个带有标题的图使用下面的代码可以创建绘图但没有标题有人可以告诉我我做错了什么吗 import pandas as pd import networkx as nx from networkx algorithms
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
如何对这个 Flask 应用程序进行单元测试？

我有一个 Flask 应用程序它使用 Flask Restless 来提供 API 我刚刚写了一些身份验证来检查如果消费者主机被识别该请求包含一个哈希值通过加密 POST 的请求内容和 GET 的 URL 以及秘密 API 密钥来计
Django - 电子邮件发送两次

每当我使用如下所示的电子邮件设置从views py调用下面的方法时电子邮件的两份副本都会发送给收件人并且我收到如下所示的错误 def sendEmailBasic request msg EmailMessage Request Cal
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
Matplotlib 图例不工作

自从升级 matplotlib 以来每当尝试创建图例时我都会收到以下错误 usr lib pymodules python2 7 matplotlib legend py 610 UserWarning Legend does not
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
如何向 SCons 构建添加预处理和后处理操作？

我正在尝试在使用 SCons 构建项目时添加预处理和后处理操作 SConstruct 和 SConscript 文件位于项目的顶部预处理动作生成代码通过调用不同的工具 gt 不知道在此预处理之后将生成的确切文件可以创建用于决定生成哪
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
如何使用Featuretools按列值从单个数据框中的多个列创建特征？

我正在尝试根据之前的结果来预测足球比赛的结果我在 Windows 上运行 Python 3 6 并使用 Featuretools 0 4 1 假设我有以下代表结果历史记录的数据框原始数据框 https i stack imgur com
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

随机推荐

IIS7 & Castle.MicroKernel.Lifestyle.PerWebRequestLifestyleModule 注册问题

UPDATE 在 Windsor 2 5 中程序集名称为Castle Windsor not Castle MicroKernel 我正在尝试将 ASP NET MVC 应用程序部署到 IIS7 但收到此错误看来您忘记注册 http 模
摩根大通不工作

我刚刚尝试过使用JPM https developer mozilla org en US Add ons SDK Tools jpm第一次我什么也做不了我的 index js 文件如下所示 const actionButton req
谷歌地图使用多边形突出显示有边界的国家

我正在使用谷歌地图想要使用其国家边界线 lat lng 信息突出显示多个国家我正在绘制多边形但我想要每个国家地区边界的信息从哪里可以获得这些信息以使用多边形突出显示国家地区或者还有其他突出国家的好方法吗下面的链接显示了我想要
Heroku Django Gunicorn“工头启动”错误

我正在努力通过Heroku 的 Django 教程 https devcenter heroku com articles django我一路走到了使用不同的 WSIG 服务器 https devcenter heroku com art
选中复选框时禁用某些 ASP.Net 验证控件

我正在使用老式的 ASP NET 验证呃进行结帐过程我有一个复选框我将用我的信用卡详细信息致电如果选中我需要在客户端和回发上禁用信用卡号所需的字段验证器和抄送验证器它是如何做到的呢您可以禁用验证器客户端在 JavaScri
Java 数组声明括号放置

我正在尝试从 Java 程序打印 Hello World 但我对 main 方法有点困惑 public static void main String args and public static void main String args
BigQuery：JOIN ON 与标准 SQL 中的重复/数组 STRUCT 字段？

我基本上有两张桌子 Orders and Items 由于这些表是从 Google Cloud Datastore 备份文件导入的因此引用不是通过简单的 ID 字段而是通过
获取选中和未选中的复选框值

这是我的脚本 HTML 代码 img src images bagua square gif border 0
如何阻止 Xcode 3.2.6 默认使用 iPad 模拟器？这是新行为吗？

似乎每次我启动 Xcode 项目或清理所有目标时活动可执行文件都会重置为 iPad 模拟器在 Xcode 3 2 6 发布之前 Xcode 默认为 iPhone 模拟器或记住了我以前的活动可执行文件我从未注意到这种行为因为我通常
Android Studio“运行 Git 时出错”，“空 git --version 输出：”

I have looked at the other posts and have made certain that the path is correct to the executable file as shown below I
AngularJs中如何实现数据库变化后视图自动更新？

我使用 AngularJs 和 Grails 框架并使用 Mysql 作为数据库我想实现 Facebook 上的自动视图更新等功能到目前为止我可以将 JSON 数据从 Grails 控制器发送到角度控制器并填充视图但是我如何实现诸如
CSS 背景重复

有没有办法让背景图像拉伸而不是重复不使用任何类型的跨浏览器兼容的CSS 有background size然而财产如果这是针对任何特定浏览器那么这是可能的否则您需要使用 img 并拉伸它以下是在最新浏览器中执行此操作的方法 bod
如何在 R 中将 2D 数据框“展平”或“折叠”为 1D 数据框？

我有一个二维表其中 R 中的 data frame 中的距离从 csv 导入 CP000036 CP001063 CP001368 CP000036 0 a b CP001063 a 0 c CP001368 b c 0 我想把它压平
boost::chrono 纳秒 Windows 7

include
在 C++ 中将整数输入写入向量容器

同样我们在数组中做 for cin gt gt a i 我们如何使用向量来做到这一点我声明了一个整数向量 vector
ExpandableListView 与 ViewPager 组合作为其子项

UPDATE 添加了实验结果是否可以实现 ExpandableListView 来拥有 viewpager 子项我尝试将 viewpager 作为子项放在 ExpandableListView 中但它没有显示我也尝试将其添加到 Sc
如何在 SQL Server Express Edition 中每天运行存储过程？

如何在 SQL Server Express Edition 中每天的特定时间运行存储过程 Notes 这是截断审计表所必需的另一种方法是修改插入查询但这可能效率较低 SQL Server Express Edition 没有 SQL
jQuery 兄弟姐妹不选择 div 内的选项？

input group select change function var value this val alert input group select siblings select children option length th
在 Outlook 2016 的 Office 365 组日历中创建会议时加载项被禁用

我正在关注这个使用 Outlook 2016 在 Windows 10 上在 Office 365 组日历中创建新会议但使用组日历时所有加载项在 Outlook 2016 本机中都被禁用这些插件在 Web Outlook 中的组日历
如何检测桌子的水平线和垂直线并消除噪音？

I am trying to get the horizontal and vertical lines of the table in an image in order to extract the texts in cells Her

如何检测桌子的水平线和垂直线并消除噪音？

如何检测桌子的水平线和垂直线并消除噪音？ 的相关文章

随机推荐

热门标签

如何检测桌子的水平线和垂直线并消除噪音？的相关文章