改进文本区域检测（OpenCV、Python）

2024-01-07

我正在开发一个项目，要求我检测图像中的文本区域。这是我到目前为止使用下面的代码实现的结果。

Original Image

Result

代码如下：

import cv2
import numpy as np

# read and scale down image
img = cv2.pyrDown(cv2.imread('C:\\Users\\Work\\Desktop\\test.png', cv2.IMREAD_UNCHANGED))

# threshold image
ret, threshed_img = cv2.threshold(cv2.cvtColor(img, cv2.COLOR_BGR2GRAY),
                                  127, 255, cv2.THRESH_BINARY)
# find contours and get the external one
image, contours, hier = cv2.findContours(threshed_img, cv2.RETR_TREE,
                                         cv2.CHAIN_APPROX_SIMPLE)

# with each contour, draw boundingRect in green
# a minAreaRect in red and
# a minEnclosingCircle in blue
for c in contours:
    # get the bounding rect
    x, y, w, h = cv2.boundingRect(c)
    # draw a green rectangle to visualize the bounding rect
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), thickness=1, lineType=8, shift=0)

    # get the min area rect
    #rect = cv2.minAreaRect(c)
    #box = cv2.boxPoints(rect)
    # convert all coordinates floating point values to int
    #box = np.int0(box)
    # draw a red 'nghien' rectangle
    #cv2.drawContours(img, [box], 0, (0, 0, 255))

    # finally, get the min enclosing circle
    #(x, y), radius = cv2.minEnclosingCircle(c)
    # convert all values to int
    #center = (int(x), int(y))
    #radius = int(radius)
    # and draw the circle in blue
    #img = cv2.circle(img, center, radius, (255, 0, 0), 2)

print(len(contours))
cv2.drawContours(img, contours, -1, (255, 255, 0), 1)

cv2.namedWindow('contours', 0)
cv2.imshow('contours', img)
while(cv2.waitKey()!=ord('q')):
    continue
cv2.destroyAllWindows()

正如你所看到的，这比我需要的更多。如果您需要更多内容，请查找注释部分。

顺便说一句，我需要的是将每个文本区域绑定在一个矩形中，而不是（靠近）脚本找到的每个字符。过滤单个数字或字母并将所有内容四舍五入到一个框中。

例如，一个框中的第一个序列，另一个框中的第二个序列，依此类推。

我搜索了一下，发现了一些关于“过滤矩形区域”的内容。我不知道这对我的目的是否有用。

还查看了谷歌上的一些第一个结果，但其中大多数效果都不是很好。我想代码需要稍微调整一下，但我是 OpenCV 世界的新手。

使用以下代码解决。

import cv2

# Load the image
img = cv2.imread('image.png')

# convert to grayscale
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# smooth the image to avoid noises
gray = cv2.medianBlur(gray,5)

# Apply adaptive threshold
thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2)
thresh_color = cv2.cvtColor(thresh,cv2.COLOR_GRAY2BGR)

# apply some dilation and erosion to join the gaps - change iteration to detect more or less area's
thresh = cv2.dilate(thresh,None,iterations = 15)
thresh = cv2.erode(thresh,None,iterations = 15)

# Find the contours
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

# For each contour, find the bounding rectangle and draw it
for cnt in contours:
    x,y,w,h = cv2.boundingRect(cnt)
    cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)
    cv2.rectangle(thresh_color,(x,y),(x+w,y+h),(0,255,0),2)

# Finally show the image
cv2.imshow('img',img)
cv2.imshow('res',thresh_color)
cv2.waitKey(0)
cv2.destroyAllWindows()

需要修改得到下面结果的参数是迭代次数erode and dilate功能。较低的值将在（几乎）每个数字/字符周围创建更多的边界矩形。

Result

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

ComputerVision

boundingbox

mser

改进文本区域检测（OpenCV、Python）的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

R 绘图标题大写和斜体

我正在尝试使用斜体和大写文本制作标题现在我有这个代码行 main substitute paste italic S aureus 10 6 growth inhibition 知道如何将 6 变成大写吗我们可以尝试 plot 1 ma
Mysql 事件不工作

我通过 phpmyadmin 在我的 mysql 数据库上添加了以下简单的测试事件 CREATE DEFINER root localhost EVENT my event ON SCHEDULE EVERY 1 MINUTE STARTS
根据 Pig 中的数据将关系拆分为不同的输出文件

目前我的数据如下所示 1 A a 1 A b 2 B b 2 B c 3 A a 3 B b 3 C c 我想根据第一列中的数据将它们存储在不同的文件中所以我希望我的输出与此类似 1 out包含 A a A b 2 out包含 B b
如何像 Hive 表分区一样在 Hbase 表中创建分区

我们计划从 CDH3 迁移到 CDH4 作为迁移的一部分我们还计划将 HBASE 引入我们的系统因为它也会更新数据在 CDH3 中我们使用 Hive 作为仓库这里我们遇到了迁移的主要问题 Hive 支持表分区我们的系统有许多不同模
如何将图像的所有像素值转换为一定范围-python

我有一个包含 12 种不同颜色的 RGB 图像但我事先不知道颜色像素值我想转换 0 到 11 之间的所有像素值每个像素值象征原始 RGB 图像的唯一颜色例如所有 230 100 140 转换为 0 0 0 所有 130 90 10
如何以专业、可靠的方式以编程方式发送短信？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于我正在从事的项目我需要以可靠的方式发送短信因为这是一个生产应用程序我遇到的问题是应用程序在云上运行我无法使用短信网关等额外硬件
设置边框样式模板，但允许灵活使用值

我有这个Border style
如何在 Cmdlet 中隐藏参数

我想对用户隐藏 PowerShell Cmdlet 参数在 C 中有什么办法可以做到这一点吗我想在我的代码中使用此参数来触发具有隐藏参数的相同 cmdlet 我使用 PowerShell 2 0 Thanks 在 PowerShell
自动调整面板上呈现的多个表单的大小

我有这个带有面板的表格该表格具有三个面板一个面板是可折叠的充当侧边栏另一个面板位于顶部用于显示标题最后一个面板是通过单击面板一中提供的项目之一打开的表单的占位符现在我想做的是根据面板一的状态调整增大和缩小占位符面板和在面板
Java 9模块，静态是否意味着浅反射？

为了能够更好地判断移植到Java 9时的反射风险我想知道是否浅反射 http mail openjdk java net pipermail jpms spec experts 2016 October 000431 html只要它引用可访
Python：关于变量范围。为什么我不需要将 x 传递给 Y？

考虑下面的代码为什么我不需要将 x 传递给 Y class X def init self self a 1 self b 2 self c 3 class Y def A self print x a x b x c x X y Y y
关闭第二个modal后在一个modal中使用modal，滚动指的是body

我是一名新的前端开发人员我在执行项目时遇到问题我在模态中使用了模态并且它有效我的第一个模式是一个长模式需要滚动才能看到整个内容 a a
自动续订订阅在测试模式下自动续订时是否会发送 SKPaymentTransactionStatePurchased/Restored 交易？

我正在寻找this https stackoverflow com questions 5396348 do auto renewable subscriptions send an skpaymenttransactionstatepur
C# 用字典替换字符串

我有一根绳子我需要对其进行一些替换我有一个Dictionary
LinearLayout：layout_width 与 minWidth

我试图使用特定宽度的布局layout width属性但是当膨胀时布局的宽度取自子级它小于layout width我说这是一个例子
C++从嵌套类方法访问变量

如何从其嵌套类方法访问类属性 class Class1 public int attribute void Method1 class Class2 public void Method2 here I need to access att
Javascript - 从字符串数组访问对象上的嵌套属性

我有一个这样的对象 metadata correlationId b24e9f21 6977 4553 abc7 416f8ed2da2d createdDateTime 2021 06 15T16 46 24 247Z 我有一系列我想要访
R ggmap 等高线图：将 ..level.. 转换为每平方距离面积的事件

使用中的示例ggmap 使用 ggplot2 进行空间可视化作者 David Kahle 和 Hadley Wickham https journal r project org archive 2013 1 kahle wickham
如何使用“rails s puma”通过配置文件运行 Rails puma 服务器

我可以使用以下任一方法在 Rails 中运行 puma 服务器rails s puma要不就puma 根据这个答案 https stackoverflow com a 21218048 2511083 跑步rails s puma使服务器了
改进文本区域检测（OpenCV、Python）

我正在开发一个项目要求我检测图像中的文本区域这是我到目前为止使用下面的代码实现的结果 Original Image Result 代码如下 import cv2 import numpy as np read and scale dow

改进文本区域检测（OpenCV、Python）

改进文本区域检测（OpenCV、Python） 的相关文章

随机推荐

热门标签

改进文本区域检测（OpenCV、Python）的相关文章