Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？

2024-04-14

我有以下图像阈值代码，使用 Bradley-Roth 图像阈值方法。

from PIL import Image
import copy
import time
def bradley_threshold(image, threshold=75, windowsize=5):
    ws = windowsize
    image2 = copy.copy(image).convert('L')
    w, h = image.size
    l = image.convert('L').load()
    l2 = image2.load()
    threshold /= 100.0
    for y in xrange(h):
        for x in xrange(w):
            #find neighboring pixels
            neighbors =[(x+x2,y+y2) for x2 in xrange(-ws,ws) for y2 in xrange(-ws, ws) if x+x2>0 and x+x2<w and y+y2>0 and y+y2<h]
            #mean of all neighboring pixels
            mean = sum([l[a,b] for a,b in neighbors])/len(neighbors)
            if l[x, y] < threshold*mean:
                l2[x,y] = 0
            else:
                l2[x,y] = 255
    return image2

i = Image.open('test.jpg')
windowsize = 5
bradley_threshold(i, 75, windowsize).show()

当windowsize很小，图像也很小。我一直在使用这张图片进行测试：

当使用 5 的窗口大小时，我的处理时间约为 5 或 6 秒，但如果我将窗口大小增加到 20，并且算法检查每个方向 20 个像素的平均值，我得到的时间会增加该图像需要一分钟。

如果我使用尺寸为 2592x1936 的图像，窗口大小仅为 5，则需要近 10 分钟才能完成。

那么，我怎样才能改善这些时间呢？ numpy 数组会更快吗？ im.getpixel 是否比将图像加载到像素访问模式更快？还有其他提高速度的技巧吗？提前致谢。

参考我们的评论，我在这里编写了该算法的 MATLAB 实现：从图像中的统一背景中提取页面 https://stackoverflow.com/questions/30487127/extract-a-page-from-a-uniform-background-in-an-image/30496377#30496377，而且在大图像上速度相当快。

如果您想更好地解释该算法，请参阅我的其他答案：Bradley 自适应阈值——困惑（问题） https://stackoverflow.com/questions/29593939/bradley-adaptive-thresholding-confused-questions/29599155#29599155。如果您想更好地理解我编写的代码，这可能是一个很好的起点。

由于 MATLAB 和 NumPy 相似，因此这是 Bradley-Roth 阈值算法的重新实现，但在 NumPy 中。我将 PIL 图像转换为 NumPy 数组，对此图像进行处理，然后转换回 PIL 图像。该函数接受三个参数：灰度图像image，窗口的大小s和阈值t。该阈值与您所拥有的阈值不同，因为它完全遵循论文。门槛t is a 百分比每个像素窗口的总面积之和。如果总面积小于此阈值，则输出应该是黑色像素 - 否则它是白色像素。默认为s and t分别是列数除以 8 并四舍五入后的 15%：

import numpy as np
from PIL import Image

def bradley_roth_numpy(image, s=None, t=None):

    # Convert image to numpy array
    img = np.array(image).astype(np.float)

    # Default window size is round(cols/8)
    if s is None:
        s = np.round(img.shape[1]/8)

    # Default threshold is 15% of the total
    # area in the window
    if t is None:
        t = 15.0

    # Compute integral image
    intImage = np.cumsum(np.cumsum(img, axis=1), axis=0)

    # Define grid of points
    (rows,cols) = img.shape[:2]
    (X,Y) = np.meshgrid(np.arange(cols), np.arange(rows))

    # Make into 1D grid of coordinates for easier access
    X = X.ravel()
    Y = Y.ravel()

    # Ensure s is even so that we are able to index into the image
    # properly
    s = s + np.mod(s,2)

    # Access the four corners of each neighbourhood
    x1 = X - s/2
    x2 = X + s/2
    y1 = Y - s/2
    y2 = Y + s/2

    # Ensure no coordinates are out of bounds
    x1[x1 < 0] = 0
    x2[x2 >= cols] = cols-1
    y1[y1 < 0] = 0
    y2[y2 >= rows] = rows-1

    # Ensures coordinates are integer
    x1 = x1.astype(np.int)
    x2 = x2.astype(np.int)
    y1 = y1.astype(np.int)
    y2 = y2.astype(np.int)

    # Count how many pixels are in each neighbourhood
    count = (x2 - x1) * (y2 - y1)

    # Compute the row and column coordinates to access
    # each corner of the neighbourhood for the integral image
    f1_x = x2
    f1_y = y2
    f2_x = x2
    f2_y = y1 - 1
    f2_y[f2_y < 0] = 0
    f3_x = x1-1
    f3_x[f3_x < 0] = 0
    f3_y = y2
    f4_x = f3_x
    f4_y = f2_y

    # Compute areas of each window
    sums = intImage[f1_y, f1_x] - intImage[f2_y, f2_x] - intImage[f3_y, f3_x] + intImage[f4_y, f4_x]

    # Compute thresholded image and reshape into a 2D grid
    out = np.ones(rows*cols, dtype=np.bool)
    out[img.ravel()*count <= sums*(100.0 - t)/100.0] = False

    # Also convert back to uint8
    out = 255*np.reshape(out, (rows, cols)).astype(np.uint8)

    # Return PIL image back to user
    return Image.fromarray(out)


if __name__ == '__main__':
    img = Image.open('test.jpg').convert('L')
    out = bradley_roth_numpy(img)
    out.show()
    out.save('output.jpg')

如果需要，图像被读入并转换为灰度。将显示输出图像，并将其保存到您将脚本运行到名为的图像的同一目录中output.jpg。如果您想覆盖这些设置，只需执行以下操作：

out = bradley_roth_numpy(img, windowsize, threshold)

尝试这样做以获得良好的结果。使用默认参数并使用 IPython，我使用以下方法测量了平均执行时间timeit，这就是我从您在帖子中上传的图片中得到的信息：

In [16]: %timeit bradley_roth_numpy(img)
100 loops, best of 3: 7.68 ms per loop

这意味着在您上传的图像上重复运行此函数 100 次，最好的 3 次执行时间平均每次运行 7.68 毫秒。

当我设置阈值时，我也得到了这个图像：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？的相关文章

将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
使用强光混合模式时突出显示伪影

我正在 iPhone 应用程序中使用顶部图像的 HardLight 混合模式混合两个图像它看起来像这样 UIGraphicsBeginImageContext size sourceImage drawInRect rectangle b
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

无法将 Access-Control-Allow-Origin 添加到我的 WCF 库项目

我试图理解为什么这个 ajax 调用不起作用 ajax type GET url http localhost 8732 Design Time Addresses InMotionGIT NT Address Service Addres
使用 R 在荟萃分析中结合森林图和交通灯图

Revman 软件在荟萃分析中生成森林图和交通灯图的组合参见 doi http dx doi org 10 1136 bmjopen 2018 024444 http dx doi org 10 1136 bmjopen 2018 024
如何在 bash 脚本中使用“history-c”命令？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案众所周知 history 命令显示Linux服务器的命令行历史记录 history c 是清除删除此命令行历史记录的命令我必须通过 b
如何使用 PersistentVolumeClaim 在 Deployment/Pod 上挂载持久卷？

我正在尝试在 Pod 上安装持久卷通过部署 apiVersion apps v1 kind Deployment spec template spec containers image volumeMounts mountPath app
派生类未在 __init__ 中运行代码

为什么下面的代码不会打印 Hello C derives from B which derives from A which derives from object class D C def init self args kw print
Azure 容器的保留策略？

我希望为我的一个容器设置一项策略以便它删除或仅保留数据 x 天因此如果 x 为 30 则该容器应仅包含 30 天以内的文件如果文件在容器中放置超过 30 天则应将其丢弃有什么方法可以配置吗目前 Azure Blob 存储不支持
具有多种返回类型的 EitherT

我正在尝试用 for compression 和 EitherT 来编写 future 但由于返回类型我遇到了麻烦请有人能解释一下为什么这不能编译以及我怎样才能让它编译并改变 for compression import scala c
猴子修补 ActiveStorage::Attachment 丢失

所以我决定添加一个urlActiveStorage Attachment 对象的 attr accessor In 发展该补丁会保留一段时间直到它看起来已经丢失这意味着它可以工作几分钟然后就不再工作了然后我需要重新启动服务器才能再
公共交通所有故障消息由一名故障消费者处理

如何拥有一个通用消费者来处理所有故障消息我是否需要为每条故障消息注册故障消费者为何不消费Fault public class WantAllFaultsGimmeThem IConsumer
垂直滚动时在未调用的 collectionView 上向左/向右滑动

我有一个collectionView垂直滚动覆盖设备上的整个屏幕即全屏我已经注册了Swipe Left and Right为我的手势collectionView right swipe gestures in collectionVi
在 Python 中解压嵌套的 C 结构

我正在尝试解压一个 C 结构该结构以二进制形式传递给我的 Python 程序并包含另一个嵌套结构 C 标头的相关部分如下所示 typedef struct uint8 t seq uint8 t type uint16 t flags
阻止 eclipse CDT 从 main() 进行调试？

如果我使用 eclipse CDT 调试我的 C 代码它似乎总是从main 函数即使在开头没有断点main 有没有办法让 Eclipse CDT 从第一个断点开始调试而不是main 在菜单上运行 gt 调试配置右键单击C C 应用程序
在 Android 中开发 Web 监视器

我想监控过滤用户在 Android 中打开的网站我知道如何使用浏览器历史记录中的 ContentObserver 检索上次访问的 URL 在 Android 默认浏览器中 private static class BrowserObse
如何检测客户端线程是否退出？

这是一个有趣的图书馆作家的困境在我的库在我的例子中是 EasyNetQ 中我正在分配线程本地资源因此当客户端创建一个新线程然后调用我的库上的某些方法时就会创建新资源对于 EasyNetQ 当客户端在新线程上调用 Publis
node.js Date#getTime() 的作用是什么？

我现在正在研究 learnyounode 模块 13 在提示部分它声称 Date getTime 也会派上用场我查找了 Date 对象并找到了 getTime 方法但是当存在散列而不是句点时这意味着什么这只是一个参考getTime
无法加载 `Rails.application.database_configuration`：未知别名：默认

我是 Ruby on Rails 的新手我猜我的问题的答案非常简单但我找不到它我最近创建了一个项目并使用 railsgeneratescaffold 一切工作正常我想向数据库添加另一列因此我使用了 railsgeneratemig
ModuleNotFoundError：Heroku 中没有名为“django”的模块

我尝试在 Heroku 中部署我的应用程序并出现此错误 2018 05 03T14 35 40 682441 00 00 heroku web 1 Starting process with command python manage p
为什么编译器无法用文字确定 std::max 的模板？

既不是 clang 也不是 gcc 编译这个 include
我可以使用 Web Config Transform 而不使用 Visual Studio 2012 进行发布吗？

Visual Studio 2012 是否支持使用特定 Web config 转换运行解决方案而无需发布我们正在使用 web config 来更改发布时的客户端设置并希望在本地测试它们不太一样但你可以preview使用 Visua
Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？

我有以下图像阈值代码使用 Bradley Roth 图像阈值方法 from PIL import Image import copy import time def bradley threshold image threshold 75

Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？

Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？ 的相关文章

随机推荐

热门标签

Bradley-Roth 自适应阈值算法 - 如何获得更好的性能？的相关文章