使用 python 突出显示图像中的特定文本

2024-05-04

我想突出显示网站屏幕截图中的特定单词/句子。

截取屏幕截图后，我使用提取文本pytesseract and cv2。效果很好，我可以获得有关它的文本和数据。

import pytesseract
import cv2


if __name__ == "__main__":
    img = cv2.imread('test.png')
    img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    result = pytesseract.image_to_data(img, lang='eng', nice=0, output_type=pytesseract.Output.DICT)
    print(result)

使用结果对象我可以找到所需的单词和句子。

问题是如何返回图像并突出显示这些单词？

我应该查看其他库还是有办法获取像素值然后突出显示文本？

理想情况下，我想获得每个单词的开始和结束坐标，如何做到这一点？

您可以使用pytesseract.image_to_boxes方法来获取图像中识别的每个字符的边界框位置。如果需要，您还可以使用该方法在某些特定字符周围绘制边界框。下面的代码在我识别的图像周围绘制矩形。

import cv2
import pytesseract
import matplotlib.pyplot as plt

filename = 'sf.png'

# read the image and get the dimensions
img = cv2.imread(filename)
h, w, _ = img.shape # assumes color image

# run tesseract, returning the bounding boxes
boxes = pytesseract.image_to_boxes(img)use
print(pytesseract.image_to_string(img)) #print identified text

# draw the bounding boxes on the image
for b in boxes.splitlines():
    b = b.split()
    cv2.rectangle(img, ((int(b[1]), h - int(b[2]))), ((int(b[3]), h - int(b[4]))), (0, 255, 0), 2)

plt.imshow(img)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

ComputerVision

OCR

pythontesseract

使用 python 突出显示图像中的特定文本的相关文章

重命名使用 Python Requests 下载的文件

我怎样才能替换名字pdf使用 Python Requests 下载的文件我想将其另存为Manual name1 pdf not as Elkinson 20Jeffrey pdf CSV 文件如下所示 Manual name1 https
Django Web 应用程序中的 SMTP 问题

我被要求向使用 Django Python 框架实现的现有程序添加一个功能此功能将允许用户单击一个按钮该按钮将显示一个小对话框表单以输入值我确实编写了一些代码显示电子邮件已发送的消息但实际上它没有发送 My code from
python中将对象数据类型转换为字符串问题

如何将对象数据类型结构转换为字符串数据类型下面的方法不起作用该列仍然存在object转换为字符串后 astype import pandas as pd df pd DataFrame country A B C D E df dtyp
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
python：函数中的变量，点前面是函数名

我需要理解这个概念其中我们可以在函数定义中的变量名中使用点这里没有类定义也没有模块 Python 不应该接受包含点的变量名 def f x f author sunder f language Python print x f aut
Python - 不使用复制模块的深度复制

本质上问题是创建一个函数 deepcopy L 它将返回列表 L 的深层副本但是我们被告知不要使用 copy 模块或其中的任何函数我是入门课程的初学者老实说我在这方面很挣扎我们真正被告知的唯一一件事是我们应该使用递归来解决问题
Python 3 sqlite 参数化 SQL 查询

我一直在尝试使用 Python 3 和 sqlite 模块进行参数化 SQL 查询并且仅使用一个变量就成功了但是当使用两个变量时我得到一个IndexError tuple index out of range错误关于导致此错误的原
使用 Tabula 通过 Python 读取 pdf 时出现 Java 错误

我已经安装了 tabula 库用于使用 python 将 pdf 读取到 pandas 数据框中但是当我运行代码时 import tabula df tabula read pdf sample1 pdf pages 1 我得到了例外
为什么 __instancecheck__ 没有被调用？

我有以下 python3 代码 class BaseTypeClass type def new cls name bases namespace kwd result type new cls name bases namespace p
使用 imblearn 管道进行交叉验证之前或之后是否发生过采样？

在对训练数据进行交叉验证以验证我的超参数之前我已将数据分为训练测试我有一个不平衡的数据集并且想要在每次迭代中执行 SMOTE 过采样因此我使用以下方法建立了一个管道imblearn 我的理解是将数据分成k折后应该进行过采样以防
接收字母并返回字母表中（从 0 开始）数字位置的 Python 函数

我正在尝试创建一个 Python 函数它接收一个字母只有一个字母字符的字符串并返回该字母在字母表中从 0 开始的数字位置它不应该区分大小写而且我不能使用导入所以输入 a 应该返回 0 输入 A 也应该返回 0 输入 O 应该返回
Django 2.0 haystack 更新索引，重建索引抛出错误

我使用 django 2 0 和 haystack whoosh 作为搜索我按照文档中的说明进行配置发生的问题是当我跑步时 manage py rebuild index它显示此错误 Traceback most recent call
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
从包含带边框的表格的图像中提取表格结构

我正在尝试提取下表中的单元格位置应用自适应阈值处理后我能够获得细胞位置周围的轮廓并且 HoughLines 获得垂直和水平结构元素这是我的代码 img cv2 imread os path join img path file im
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
如何使用 matplotlib 在误差条图的尖端显示水平线？

我可以使用下面的代码生成误差条图代码生成的图表显示了代表错误的垂直线y 我希望在这些错误的尖端有水平线误差线但我不知道该怎么做 import numpy as np import matplotlib pyplot as plt x
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
如何从下面的html中提取数据？

我想要从中提取数据的 Html 是 div class infoMessageInner p span class ng binding Fiber r best lld till adressen Tj nsterna kan du be
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or

随机推荐

媒体查询在 VueJS 样式标签中不起作用

我正在尝试在 VueJS 组件的样式标签中使用 media media 中的样式始终有效而不是使用宽度规则
如何使用va_start()？

在具有可变参数的函数中我们使用函数 va start 初始化 va list ap 类型的对象如下所示 void va start va list ap parmN 我不明白1 什么类型的对象可以作为 parMN 最后一个已知参数传递
在 CakePHP 中访问 Configuration::read 控制器

我的 CakePHP 应用程序有一个单独的配置文件该文件加载在 bootstrap php 中我的问题是如何访问控制器中的配置变量 IE 如何在控制器中执行Configure read variable 函数谢谢在我的自定义配置文
获取 Youtube 上的游戏直播列表

我正在尝试使用 Youtube 数据 API 来获取当前与游戏相关的直播流列表但我找不到任何符合我需要的端点并返回每个频道的观看者数量你们知道我该如何做到这一点吗 Thanks 游戏直播列表 videoCategoryId 20 是游
如何从 Backbone 集合中提取多个属性？

我试图从 Backbone 集合中提取多个属性但它返回undefined 收藏 id 1 name raju age 23 sex male hobbies id 2 name ramesh age 43 sex male hobbies
使用哈希检查具有 $_POST 值的页面是否已刷新

当将表单发布到同一个PHP页面时正确的方法是什么来查找页面是否被意外刷新而不是再次提交这是我现在正在使用的 tmp implode POST myHash md5 tmp if isset SESSION myHash SESSION
输入字段如 stackOverflow 标签输入字段

我将 primefaces 与 JSF 一起使用我需要一个输入组件允许用户在单个输入字段中提交最多 5 个标签就像 stackOverflow 上的标签输入字段一样还必须有一个建议标签的功能当用户开始输入时因为它在这里可用我无
仅当元素未分配类时，如何才能选择该元素？

我正在修改现有 WordPress 主题的 CSS 主题有很多特殊样式的列表附在 li 元素正因为如此有一个通用的list style none规则适用于 li li 元素我想更新 CSS 以重新设置list style默认开启 l
2010 年的 java 并发修改异常灾难

绘制一些存储在 ArrayList 中的粒子这段代码工作正常 super paintComponent g for Particle b particleArr g setColor b getColor g fillOval b get
python - lxml：强制执行属性的特定顺序

我有一个 XML 编写脚本可以为特定的第 3 方工具输出 XML 我使用原始 XML 作为模板来确保构建所有正确的元素但最终的 XML 看起来与原始的不同我以相同的顺序编写属性但 lxml 按自己的顺序编写它们我不确定但我怀疑第
$(this) 和 this 有什么区别？

有人可以解释一下它们之间有什么区别吗例如我可以用 that 来做到这一点 var bar button click function if bar this alert same bar this 并且不能使用 that var bar
在 Netlogo 中将函数作为参数传递

在许多其他编程语言中您可以将一个函数作为参数传递给另一个函数并从该函数内调用它无论如何在 Netlogo 中可以做到这一点吗比如下面这样 x y z are all ints to report f x y z report x y
在 Python 中计算时间（datetime.timedelta？）

我相信这对很多人来说都是理所当然的事情但我发现自己对整个 datetime timedelta 事情感到非常困惑本质上我在开始时给一些东西加上时间戳startTime然后我为流程结束添加时间戳endTime我试图找出 HH MM SS
制作一个未知大小的数组 C# [重复]

这个问题在这里已经有答案了可能的重复 C 中未知长度的数组 https stackoverflow com questions 599369 array of an unknown length in c sharp 我想创建一个程序用
如何更改 UIImage 的颜色？ [复制]

这个问题在这里已经有答案了我不想改变图像的背景颜色而是改变整个图像的颜色但问题是我只能改变backgroundColor 接受的答案是正确的但还有更多easy way for UIImageView Obj C UIImage i
AngularJs 位置路径更改，无需重置所有控制器

我的问题的简短版本是如何更改 URL 而不需要触发路由更改或不需要运行当前显示页面上的所有控制器 Details 我有一个模板显示在
Android 电子邮件意图和消息正文

我正在使用意图从我的应用程序启动电子邮件应用程序我使用意图设置主题短信和电子邮件地址除了电子邮件部分中的光标位置之外一切正常我的电子邮件信息类似于感谢您选择不要写在这条线下面我在电子邮件正文中看到该消息但我的光标在请勿写
索引 getter 中的 IndexOutOfRangeException

在我的索引属性中我检查索引是否超出范围如果是的话我抛出一个IndexOutOfBoundsException 当我运行代码分析器在 VS12 中时它抱怨 CA1065 意外位置出现意外异常参考CA1065的描述仅 Syste
如何使用 Gnuplot 在一个图中绘制代表数据集中多个子集行的多个图表？

我有一个数据集其名称为 output txt 格式如下 1 2 4 6 7 10 1 2 5 6 7 1 3 4 6 7 10 2 4 6 7
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main

使用 python 突出显示图像中的特定文本

使用 python 突出显示图像中的特定文本 的相关文章

随机推荐

热门标签

使用 python 突出显示图像中的特定文本的相关文章