如何使用 Tesseract 提高图像质量以从图像中提取文本

2023-12-15

我试图在下面的代码中使用 Tesseract 来提取图像的两行。我尝试提高图像质量，但没有成功。

谁能帮我？

from PIL import Image, ImageEnhance, ImageFilter
import pytesseract

img = Image.open(r'C:\ocr\test00.jpg')
new_size = tuple(4*x for x in img.size)
img = img.resize(new_size, Image.ANTIALIAS)
img.save(r'C:\\test02.jpg', 'JPEG')


print( pytesseract.image_to_string( img ) )

鉴于@barny 的评论，我不知道这是否有效，但您可以尝试下面的代码。我创建了一个脚本，用于选择显示区域并将其变形为直接图像。接下来是字符的黑白蒙版的阈值，结果会稍微清理一下。

尝试一下是否可以提高识别率。如果确实如此，还要查看中间阶段，以便您了解发生的所有情况。

Update:看起来 Tesseract 更喜欢白底黑字，反转并扩大结果。

Result:

更新结果：

Code:

import numpy as np 
import cv2
# load image
image = cv2.imread('disp.jpg')

# create grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# perform threshold
retr, mask = cv2.threshold(gray_image, 190, 255, cv2.THRESH_BINARY)

# findcontours
ret, contours, hier = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# select the largest contour
largest_area = 0
for cnt in contours:
    if cv2.contourArea(cnt) > largest_area:
        cont = cnt
        largest_area = cv2.contourArea(cnt)

# find the rectangle (and the cornerpoints of that rectangle) that surrounds the contours / photo
rect = cv2.minAreaRect(cont)
box = cv2.boxPoints(rect)
box = np.int0(box)

#### Warp image to square
# assign cornerpoints of the region of interest
pts1 = np.float32([box[2],box[3],box[1],box[0]])
# provide new coordinates of cornerpoints
pts2 = np.float32([[0,0],[500,0],[0,110],[500,110]])

# determine and apply transformationmatrix
M = cv2.getPerspectiveTransform(pts1,pts2)
tmp = cv2.warpPerspective(image,M,(500,110))

 # create grayscale
gray_image2 = cv2.cvtColor(tmp, cv2.COLOR_BGR2GRAY)
# perform threshold
retr, mask2 = cv2.threshold(gray_image2, 160, 255, cv2.THRESH_BINARY_INV)

# remove noise / close gaps
kernel =  np.ones((5,5),np.uint8)
result = cv2.morphologyEx(mask2, cv2.MORPH_CLOSE, kernel)

#draw rectangle on original image
cv2.drawContours(image, [box], 0, (255,0,0), 2)

# dilate result to make characters more solid
kernel2 =  np.ones((3,3),np.uint8)
result = cv2.dilate(result,kernel2,iterations = 1)

#invert to get black text on white background
result = cv2.bitwise_not(result)

#show image
cv2.imshow("Result", result)
cv2.imshow("Image", image)

cv2.waitKey(0)
cv2.destroyAllWindows()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

Text

Tesseract

pythontesseract

如何使用 Tesseract 提高图像质量以从图像中提取文本的相关文章

将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O

随机推荐

为什么我们要在 PyTorch 中“打包”序列？

我试图复制如何对 rnn 的可变长度序列输入使用打包但我想我首先需要理解为什么我们需要打包序列我明白为什么我们填充它们但为什么打包通过pack padded sequence 必要的我也偶然发现了这个问题下面是我的发现
Bert 针对语义相似性进行了微调

我想应用微调 Bert 来计算句子之间的语义相似度我搜索了很多网站但几乎没有找到有关此的下游信息我刚刚发现STS基准测试我想知道是否可以使用STS基准数据集来训练微调bert模型并将其应用到我的任务中合理吗据我所知计算相似度
ffmpeg/PHP - 将任何视频格式转换为 ogg 时出现问题 - 视频断断续续/无音频 - win64

如果这是一个重新发布类似的帖子首先让我道歉因为我尽了最大努力在此处和谷歌上已创建的帖子中搜索我的问题的具体解决方案但无法我在 win64 系统的本地主机上使用 ffmpeg 创建测试视频转换脚本然后将它们上传到服务器我能够成
NoSuchElementException：消息：尝试通过 Selenium 和 Python 单击按钮 VISA 时无法定位元素

我无法点击此按钮在我的机器人上创建结账我想点击图片进入另一页
如何用opencv获得所有不失真的图像

我在用着cv undistort但它会裁剪图像我想要所有未失真的图像以便未失真的尺寸比原始图像更大如下所示我想我需要使用cv getOptimalNewCameraMatrix但我的试验没有运气有什么帮助吗仅供记录你应该使用c
Spark 在标准输出上丢失 println()

我有以下代码 val blueCount sc accumulator Long 0 val output input map data gt for value lt data getValues if record getEnum Da
是否可以使用新的 csproj 项目文件覆盖或清除 dll 构建中的调试路径？

使用时dumpbin查看我的图书馆的详细信息 dumpbin headers Test dll 我看到 FullFolder to Test pdb 是 pdb 的完整文件夹调试目录 Time Type Size RVA Pointer
从 $lookup 以及整个文档中获取数组中过滤后的元素数量

我在 MongoDB 中有这样的查询 db emailGroup aggregate lookup from link localField id foreignField emailGroupId as link unwind link
无法访问远程git仓库

我通过 github 网站的新按钮创建了一个 git 存储库然后我使用 git bash 设置本地存储库并尝试拉取远程存储库它有默认的自述文件但收到访问被拒绝错误与此问题中看到的错误相同无法推送到 git 存储库权限被拒绝
使用 Gson for Java 进行 JSON 解析

我想解析 JSON 类型的数据String 我在用谷歌Gson I have jsonLine data translations translatedText Hello world 我的班级是 public class JsonPars
python 中的计算器

我正在尝试制作可以使用基本 4 个运算符例如 1 2 3 4 5 求解表达式的计算器但是它不起作用我不知道出了什么问题请检查我的代码当我运行它时我在 8 行中收到无限数量的错误return ret parts 0 ret par
MySQL/InnoDB 和长时间运行的查询

当使用 myisam 引擎运行查询时因为它不是事务性的所以长查询据我所知不会影响其他查询的数据在 InnoDB 中它警告的事情之一是避免长查询 InnoDB快照时是不是把所有东西都快照了我问这个问题的原因是无论出于何种原因
为什么我的批处理脚本以管理员身份运行时无法执行？

我正在尝试创建一个 Windows 批处理脚本该脚本将允许我部署 Windows 7 64 位的准备更新但该脚本无法正常启动我将所有文件放在同一个文件夹中我尝试提取文件然后通过 dism 安装它们当我正常启动它时文件提取但
ThreeJS：将边缘几何应用于 ArrowHelper

我正在尝试使用 ThreeJS 中的 ArrowHelper 创建箭头 let arrow new THREE ArrowHelper direction normalize new THREE Vector3 length color h
如何远程访问自托管的 Nancy 服务？

我正在创建一个简单的 Windows 服务该服务托管 Nancy 实例以提供其内部数据的视图在本地计算机上使用浏览器时一切都按预期运行我看到了它所提供的观点但是我找不到它无法从远程浏览器在同一网络上访问的任何原因从远程浏览
向量的下限

我有这个简单的课程 class MyClass public int id string name 我想要一个带有指向此类对象的指针的向量该向量按引用排序MyClass id 我以为使用lower bound很容易我之前用对象向量而不
minikube 和 ingress-nginx 没有打开端口 80

我是 ingress nginx 的新手我使用 minikube 启用了它minikube addons enable ingress 在寻找与 ingress nginx 相关的服务时我跑了kubectl get services n
如何在 WPF 中添加自定义路由命令？

我有一个包含菜单和子菜单的应用程序我已将应用程序命令附加到一些子菜单项例如剪切复制和粘贴我还有一些其他没有应用程序命令的菜单项如何将自定义命令绑定添加到这些子菜单项我已经经历过this文章但无法将事件附加到我的子菜单项我使用放
WebUSB - “无法声明接口”错误

我尝试使用下面的代码通过 WebUSB API 使用 POS 打印机但失败了 claimInterface 错误为DOMException Unable to claim interface 所有测试均在 Linux 上的 Chrome
如何使用 Tesseract 提高图像质量以从图像中提取文本

我试图在下面的代码中使用 Tesseract 来提取图像的两行我尝试提高图像质量但没有成功谁能帮我 from PIL import Image ImageEnhance ImageFilter import pytesseract i

如何使用 Tesseract 提高图像质量以从图像中提取文本

如何使用 Tesseract 提高图像质量以从图像中提取文本 的相关文章

随机推荐

热门标签

如何使用 Tesseract 提高图像质量以从图像中提取文本的相关文章