python提取图片中的表格内容

2023-05-16

只提供思路，具体场景核图像有关，需做前期调整

一、处理流程：

1、图像灰度化处理

2、图像二值化处理

3、图像腐蚀处理（若得到的横纵交线不清楚，添加膨胀处理）

4、获取表格交点坐标

5、根据交点集获取单元格轮廓并进行过滤

二、使用案例

在这里插入图片描述

三、代码示例及效果

1、灰度化处理

def gray_img(img:'numpy.ndarray'):
    """
    对读取的图像进行灰度化处理
    :param img: 通过cv2.imread(imgPath)读取的图像数组对象
    :return: 灰度化的图像
    """
    grayImage=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    return grayImage

2、二值化处理

def bin_img(img:'numpy.ndarray'):
    """
    对图像进行二值化处理
    :param img: 传入的图像对象（numpy.ndarray类型）
    :return: 二值化后的图像
    """
    ret,binImage=cv2.threshold(img,180,255,cv2.THRESH_BINARY_INV)
    return binImage

在这里插入图片描述

3、图像腐蚀

def erode_img(img,kernel_args=(2,2),iterations=1):
    """
    对图像进行腐蚀
    @param kernel_args 卷积核参数（2，2）
    @param interations erode的迭代次数
    """

    kernel = np.ones(kernel_args, np.uint8)
    return cv2.erode(img, kernel,iterations=iterations)

（1）纵向腐蚀获取横向线条

    img_transverse = erode_img(img,(1,2),40)

需要调节卷积核参数（kernel_args），迭代次数（iterations）
在这里插入图片描述

（2）横向腐蚀获取纵向线条

    img_vertical = erode_img(img, (2,1), 40)

在这里插入图片描述

4、图像膨胀处理

膨胀处理相当于对线条进行加粗

    img_transverse = dilate_img(img_transverse,(2,2),1)
    img_vertical = dilate_img(img_vertical,(2,2),1)

5、获取交点

def get_points(img_transverse, img_vertical):
    """
    获取横纵线的交点
    :param img_transverse:
    :param img_vertical:
    :return:
    """
    img = cv2.bitwise_and(img_transverse, img_vertical)
    return img

在这里插入图片描述

6、获取单元格

def split_rec(arr):
    """
    切分单元格
    :param arr:
    :return:
    """
    # 数组进行排序
    arr.sort(key=lambda x: x[0],reverse=True)
    # 数组反转
    arr.reverse()
    for i in range(len(arr) - 1):
        if arr[i+1][0] == arr[i][0]:
            arr[i+1][3] = arr[i][1]
            arr[i + 1][2] = arr[i][2]
        if arr[i+1][0] > arr[i][0]:
            arr[i + 1][2] = arr[i][0]
        print(arr[i])
    return arr

def get_rec(img):
    """
    获取单元格
    :param img: 
    :return: 
    """
    contours, hierarchy = cv2.findContours(img, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_SIMPLE)
    contours_poly = [0] * len(contours)
    boundRect = [0] * len(contours)
    rois = []
    for i in range(len(contours) - 1):
        cnt = contours[i]
        contours_poly[i] = cv2.approxPolyDP(cnt, 1, True)
        boundRect[i] = cv2.boundingRect(contours_poly[i])
        rois.append(np.array(boundRect[i]))
        # img = cv2.rectangle(img_bak, (boundRect[i][0], boundRect[i][1]), (boundRect[i][2], boundRect[i][3]),
        #                     (255, 255, 255), 1, 8, 0)
    rois = split_rec(rois)
    return rois

在这里插入图片描述

四、完整代码

from PIL import Image, ImageOps
import cv2
import numpy as np




def split_rec(arr):
    """
    切分单元格
    :param arr:
    :return:
    """
    # 数组进行排序
    arr.sort(key=lambda x: x[0],reverse=True)
    # 数组反转
    arr.reverse()
    for i in range(len(arr) - 1):
        if arr[i+1][0] == arr[i][0]:
            arr[i+1][3] = arr[i][1]
            arr[i + 1][2] = arr[i][2]
        if arr[i+1][0] > arr[i][0]:
            arr[i + 1][2] = arr[i][0]
        print(arr[i])

    return arr



def get_points(img_transverse, img_vertical):
    """
    获取横纵线的交点
    :param img_transverse:
    :param img_vertical:
    :return:
    """
    img = cv2.bitwise_and(img_transverse, img_vertical)
    return img




def dilate_img(img, kernal_args:tuple, iterations:int):
    """
    dilate image
    @param kernel_args 卷积核参数（2，2）
    @param interations dilate的迭代次数
    """

    kernel = np.ones(kernal_args, np.uint8)
    return cv2.dilate(img, kernel,iterations=iterations)

    pass


def erode_img(img,kernel_args=(2,2),iterations=1):
    """
    对图像进行腐蚀
    @param kernel_args 卷积核参数（2，2）
    @param interations erode的迭代次数
    """

    kernel = np.ones(kernel_args, np.uint8)
    return cv2.erode(img, kernel,iterations=iterations)




def bin_img(img:'numpy.ndarray'):
    """
    对图像进行二值化处理
    :param img: 传入的图像对象（numpy.ndarray类型）
    :return: 二值化后的图像
    """
    ret,binImage=cv2.threshold(img,180,255,cv2.THRESH_BINARY_INV)
    return binImage

def gray_img(img:'numpy.ndarray'):
    """
    对读取的图像进行灰度化处理
    :param img: 通过cv2.imread(imgPath)读取的图像数组对象
    :return: 灰度化的图像
    """
    grayImage=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    return grayImage
    pass

def get_rec(img):
    """
    获取单元格
    :param img:
    :return:
    """
    contours, hierarchy = cv2.findContours(img, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_SIMPLE)
    contours_poly = [0] * len(contours)
    boundRect = [0] * len(contours)
    rois = []
    for i in range(len(contours) - 1):
        cnt = contours[i]
        contours_poly[i] = cv2.approxPolyDP(cnt, 1, True)
        boundRect[i] = cv2.boundingRect(contours_poly[i])
        rois.append(np.array(boundRect[i]))
        # img = cv2.rectangle(img_bak, (boundRect[i][0], boundRect[i][1]), (boundRect[i][2], boundRect[i][3]),
        #                     (255, 255, 255), 1, 8, 0)
    rois = split_rec(rois)
    return rois

if __name__ == "__main__":
    image  = "D:/cs/ocr/c.png"
    img_bak = cv2.imread(image)
    img = gray_img(img_bak)
    img = bin_img(img)
    img_transverse = erode_img(img,(1,2),40)
    img_vertical = erode_img(img, (2,1), 40)
    # img = img_transverse + img_vertical
    img_transverse = dilate_img(img_transverse,(2,2),1)
    img_vertical = dilate_img(img_vertical,(2,2),1)
    img = get_points(img_transverse,img_vertical)

    rois = get_rec(img)
    for i, r in enumerate(rois):
        cv2.imshow("src" + str(i), img_bak[r[3]:r[1], r[2]:r[0]])
    cv2.waitKey(0)

    cv2.destroyAllWindows()
    pass

五、未解决

1、图像不清楚或倾斜，无法操作

2、若最右侧没有竖线会丢失最后一列

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

提取图片中的表格内容

python提取图片中的表格内容的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
Python、Tkinter、更改标签颜色

有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容是否存在类似的颜色变化 button color red Use the foreground设置按钮
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像

随机推荐

ftp服务器上传文件频率,ftp服务器上传文件速度多少

ftp服务器上传文件速度多少内容精选换一换华为云帮助中心 xff0c 为用户提供产品简介价格说明购买指南用户指南 API参考最佳实践常见问题视频帮助等技术文档 xff0c 帮助您快速上手使用华为云服务使用FTP上传文件时
Android9.0指纹识别BiometricPrompt的简单使用

谷歌在Android 9 0 API版本28 xff0c 发布了生物信息综合验证的基础 API android hardware biometrics BiometricPrompt BiometricPrompt 所以在android9
域名未授权 / 该网站未授权,禁止使用解决办法：

公司买了一个商城项目 xff0c 让我先搭个测试环境 xff0c 然后二开 xff0c 于是我经过披荆斩棘申请二级域名配置LNMP后 xff0c 遇见了诡异的事情 xff1a baidu和google纷纷表示他们也很为难没见过这种提示 x
android页面切换空白问题

问题 xff1a 当切换到第三个fragment时返回到第一个 xff0c 第一个fragment页面空白原因 xff1a viewpage默认会加载三个页面 xff0c 当切换到第三个时会把第一个销毁 xff0c 再返回时重新调用啦On
Adobe Media Encoder“编译影片时出错“ GPU渲染错误错误代码:-1609629695

Adobe Media Encoder 编译影片时出错 GPU渲染错误错误代码 1609629695 xff0c 通过下面方法处理
Manjaro虚拟机安装常用软件

还是安装常用软件系列 1 VMWare 安装Manjaro 默认都安装完了 xff0c 注意 xff0c 有时候Manjaro分辨率会变成800 600不可变 xff0c 我的方法比较懒 xff0c 就是每次开机都执行 sudo syste
kali无法进入gnome桌面环境

如果遇到无法进入桌面环境报错或者开机自动进入命令行模式 xff0c 且无法使用startx命令启动进入桌面环境时 xff0c 如果在本地查找不到startx命令时 xff0c 可以使用CTRL 43 ALT 43 F1进入命令行模式 xff
Collections.singleton()在进行remove操作时抛出UnsupportedOperationException异常原因

Collections singleton 在进行remove操作时抛出UnsupportedOperationException异常原因这个方法主要用于只有一个元素的优化 xff0c 减少内存分配 xff0c 无需分配额外的内存返回一
什么是强化学习，强化学习在控制系统中的应用以及matlab强化学习工具箱的介绍

一 Reinforcement Learning Toolbox介绍强化学习工具箱使用强化学习算法 xff08 包括DQN xff0c A2C和DDPG xff09 为训练策略 xff08 policy xff09 提供函数和模块您可以
输入框限制输入20个中文字（40个字符）。eslint 报错\x00 no-control-regex解决

需求是要限制用户输入的名称 xff0c 最多二十个中文字 xff0c 也就是40个字符但我们平时使用str length来限制都是获取到字符串的长度而已 xff0c 并不能获取到具体的字符这里使用正则来解决一个汉字 61 2字节 61
使用SecureCRT 抓log

使用SecureCRT 抓log 1 点击选项会话选项 xff1a 2 选择Log File xff0c 保存log文件名和位置 xff0c 并在每行前添加 xff1a 日期时间 span class token punctuation
OGG部署过程错误总结

安装过程可参考 xff1a https www cnblogs com houzhiqing p 5289383 html 错误1 xff1a 源端安装完ogg后 xff0c 执行 ggsci 进不去 xff0c 报错 xff1a 无法打开
sparkstreaming 读取本地文件获取不到内容

1 批次间隔大于3s 2 文件地址写成绝对路径且使用file 开头例 xff1a ssc textFileStream file D cs scalaPro SparkDemo data 3 读取目录中的文件以文件流形式写入该目录下
Unable to instantiate SparkSession with Hive support because Hive classes are

spark hive的版本不对应 lt span class token tag span https span class token punctuation span mvnrepository com artifact org apa
安装失败。无法安装 cloudera-manager-agent 包。

File exists var log 进入var 目录 xff0c 删除log文件
Xshell更改命令提示符以及背景配色

PS1是用来设置命令提示符的环境变量 xff0c 输入echo PS1来查看 echo span class hljs formula PS1 span class hljs command span span class hljs com
mysql 创建数据库,添加用户,用户授权

一创建mysql数据库创建数据库语法 CREATE DATABASE IF NOT EXISTS testdb DEFAULT CHARSET utf8 COLLATE utf8 general ci 二创建用户新建用户 creat
TypeError: Required argument 'flags' (pos 2) not found

from os import open 34 data 0 0 txt 34 原因 xff1a 因为导入了os模块后默认的open函数调用的是os下的解决 xff1a 显示的调用os模块下的函数避免函数冲突例 xff1a import
repositories.xml文件位置

1 默认位置默认会存储在C Users 你的用户名如EDZ mettle文件中 2 修改位置修改Spoon bat 文件查找Kettle home查看是否有set KETTLE HOME 61 xff0c 若没有自动添加 xff0c
python提取图片中的表格内容

只提供思路 xff0c 具体场景核图像有关 xff0c 需做前期调整一处理流程 xff1a 1 图像灰度化处理 2 图像二值化处理 3 图像腐蚀处理 xff08 若得到的横纵交线不清楚 xff0c 添加膨胀处理 xff09 4 获取表格

python提取图片中的表格内容

一、处理流程：

1、图像灰度化处理

2、图像二值化处理

3、图像腐蚀处理（若得到的横纵交线不清楚，添加膨胀处理）

4、获取表格交点坐标

5、根据交点集获取单元格轮廓并进行过滤

二、使用案例

三、代码示例及效果

1、灰度化处理

2、二值化处理

3、图像腐蚀

（1）纵向腐蚀获取横向线条

（2）横向腐蚀获取纵向线条

4、图像膨胀处理

5、获取交点

6、获取单元格

四、完整代码

五、未解决

1、图像不清楚或倾斜，无法操作

2、若最右侧没有竖线会丢失最后一列

python提取图片中的表格内容 的相关文章

随机推荐

热门标签

python提取图片中的表格内容的相关文章