大律法(OTSU) ——图像数据二值化

2023-11-17

二值化的目的，是确定一个像素值，以像素为分界，将图像划分为前景和背景，前景的像素值取相同值，背景的像素也取相同值，从而将前景和背景的差异，在图像中最大化，或者说可以突出前景或者背景信息。

二值化可以有效的降低噪声，并且可以一定程度的增强目标特征

我使用一下，这篇文章的配图：https://blog.csdn.net/bigat/article/details/80889636

该文是关于图像混合的文章，我只是想用这两张图来说明，二值化的效果。

那么最终要的问题就是，选择哪个像素值，作为划分最合适？

日本学者大津(Nobuyuki Otsu)于1979年给出了很好的解答，论文：

OTSU N． A threshold selection method from gray-level histo- grams［ J ］．IEEE Transactions on Systems， Man ， and Cybernetics ， 1979， 9 ( 1 ) : 62 － 66．

算法的核心思想是，选择使得划分出来的前景与背景有最大方差的划分为最优划分，很多文章称为类间方差，因为可以将前景数据作为一类，而背景数据作为另一类，所以可以称为前景类与背景类的类间方差。

所以只要知道，怎么计算图像数据的类间方差就可以实现了，这里引用一下：https://blog.csdn.net/u012198575/article/details/81128799

中的公式，因为很全，所以我就不重新写了，如下：

公式：记 M = 256 单通道灰度分级 Sum = 像素总数

背景像素占比 $\omega1 = \frac{N1}{Sum}$
前景像素占比 $\omega2 = 1- \omega1 = \frac{N2}{Sum} =1- \frac{N1}{Sum}$
背景的平均灰度值 $\mu 1 = \sum_{i = 0}^{t} i *Pr(i | C_{0}) = \sum_{i = 0}^{t} i *Pi / \sum_{i = 0}^{t} Pi = \frac{\mu(t))}{\omega_{1}}$
前景的平均灰度值 $\mu 2 = \sum_{i = t+1}^{M - 1} i *Pr(i | C_{1}) = \sum_{i = t+1}^{M - 1} i *Pi / \sum_{i = t+1}^{M - 1} Pi = \frac{\mu - \mu(t))}{\omega _{2}}$
0~M灰度区间的灰度累计值 $\mu = \mu1*\omega 1 + \mu2*\omega 2$
类间方差： $g = \omega 1 * (\mu - \mu1)^{2} + \omega 2 * (\mu - \mu2)^{2}$
将公式3.4.5带入公式6 可得最终简化公式： $g = \omega 1 * \omega2 * (\mu1 - \mu2)^{2}$

下面使用Python+cv2来实现，并且和cv2中的OTSU的结果进行比较，使用cv2主要是为了读取图片：

将三通道的RGB图像转换为单通道的灰度图像：

公式如下I[i][j] = (299*r[i][j] + 587*g[i][j] + 114*b[i][j])/1000

这里不做过多解释，可以使用cv2的方法进行转换，这里是自己实现的算法：

def Gray(img):
    a = np.shape(img)
    r,g,b = cv2.split(img)
    img_new = np.zeros((a[0], a[1]))
    for i in range(a[0]):
        for j in range(a[1]):
            data = (299*r[i][j] + 587*g[i][j] + 114*b[i][j])/1000
            img_new[i][j] = data
    img_new = img_new.astype('uint8')
    return img_new

效果如下：

统计各个灰度值像素的数量和占比：

def Pixel_num(img):
    num = [0 for _ in range(256)]
    a = np.shape(img)
    for i in range(a[0]):
        for j in range(a[1]):
            num[img[i][j]] += 1
    return num

def Pixel_rate(num_list):
    rate_list = []
    n = sum(num_list)
    for i in range(len(num_list)):
        rate = num_list[i] / n
        rate_list.append(rate)
    return rate_list

遍历0~255的像素值，寻找最优：

def Optimal_partition(rate_list):
    deltaMax = 0
    T = 0
    for i in range(256):
        w1 = w2 = u1 = u2 = 0
        u1tmp = u2tmp = 0
        deltaTmp = 0
        for j in range(256):
            if (j <= i):
                w1 += rate_list[j]
                u1tmp += j * rate_list[j]
            else:
                w2 += rate_list[j]
                u2tmp += j * rate_list[j]
        if w1 == 0:
            u1 = 0
        else:
            u1 = u1tmp / w1
        if w2 == 0:
            u2 = 0
        else:
            u2 = u2tmp / w2
        deltaTmp = w1 * w2 * ((u1- u2) ** 2)
        if deltaTmp > deltaMax:
            deltaMax = deltaTmp
            T = i
    return T

根据最优灰度值进行划分：

def Otsu(img, T):
    a = np.shape(img)
    new_img = np.zeros((a[0], a[1]))
    for i in range(a[0]):
        for j in range(a[1]):
            if img[i][j] > T:
                new_img[i][j] = 255
            else:
                new_img[i][j] = 0
    return new_img

结果如下：

cv2结果：

ret, th = cv2.threshold(new_img, 0, 255, cv2.THRESH_OTSU)

效果一致

使用面向对象的方式将算法封装为类（文件名为Threshold）：

'''
@Author: BTboay
@Date: 2019-12-05 12:28:10
@LastEditTime: 2019-12-05 14:28:25
@LastEditors: Please set LastEditors
@Description: In User Settings Edit
@FilePath: \YOLOv3_01\OTSU.py
'''
import numpy as np
import cv2

class OTSU():
    def __init__(self, img_path):
        img = cv2.imread(img_path)
        self.img = img
        img_gray = self.Gray()
        self.img = img_gray
        num_list = self.Pixel_num()
        self.num_list = num_list
        rate_list = self.Pixel_rate()
        self.rate_list = rate_list
        optimal_pixel = self.Optimal_partition()
        self.optimal_pixel = optimal_pixel

    def Gray(self):
        a = np.shape(self.img)
        r,g,b = cv2.split(self.img)
        img_new = np.zeros((a[0], a[1]))
        for i in range(a[0]):
            for j in range(a[1]):
                data = (299*r[i][j] + 587*g[i][j] + 114*b[i][j])/1000
                img_new[i][j] = data
        img_new = img_new.astype('uint8')
        return img_new

    def Pixel_num(self):
        num = [0 for _ in range(256)]
        a = np.shape(self.img)
        for i in range(a[0]):
            for j in range(a[1]):
                num[self.img[i][j]] += 1
        return num

    def Pixel_rate(self):
        rate_list = []
        n = sum(self.num_list)
        for i in range(len(self.num_list)):
            rate = self.num_list[i] / n
            rate_list.append(rate)
        return rate_list

    def Optimal_partition(self):
        deltaMax = 0
        T = 0
        for i in range(256):
            w1 = w2 = u1 = u2 = 0
            u1tmp = u2tmp = 0
            deltaTmp = 0
            for j in range(256):
                if (j <= i):
                    w1 += self.rate_list[j]
                    u1tmp += j * self.rate_list[j]
                else:
                    w2 += self.rate_list[j]
                    u2tmp += j * self.rate_list[j]
            if w1 == 0:
                u1 = 0
            else:
                u1 = u1tmp / w1
            if w2 == 0:
                u2 = 0
            else:
                u2 = u2tmp / w2
            deltaTmp = w1 * w2 * ((u1- u2) ** 2)
            if deltaTmp > deltaMax:
                deltaMax = deltaTmp
                T = i
        return T

    def Otsu(self):
        a = np.shape(self.img)
        new_img = np.zeros((a[0], a[1]))
        for i in range(a[0]):
            for j in range(a[1]):
                if self.img[i][j] > self.optimal_pixel:
                    new_img[i][j] = 255
                else:
                    new_img[i][j] = 0
        return new_img

调用该类：

'''
@Author: your name
@Date: 2019-12-03 15:43:11
@LastEditTime: 2019-12-05 15:20:49
@LastEditors: Please set LastEditors
@Description: In User Settings Edit
@FilePath: gray.py
'''
import numpy as np
import matplotlib.pyplot as plt
import cv2
import Threshold

if __name__ == "__main__":
    path = 'D:/WorkSpace/YOLOv3_01/05.jpg'
    a = Threshold.OTSU(path)
    new_img = a.Otsu()

    plt.imshow(new_img, 'gray')
    plt.axis('off')
    plt.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像数据二值化

otsu

python

大律法(OTSU) ——图像数据二值化的相关文章

在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
如何计算 pandas datetime 对象的均值和方差？

如何计算 YYYY MM DD 形式的 python 日期时间对象的汇总统计数据均值和标准差我想对具有不同 ID 的不同日期时间对象组执行此操作数据如下 import datetime as dt df pd DataFrame Da
类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

【线上死锁分析】由index_merge引发的死锁事件

1 事情背景背景由于更换新的短信供应商同事之前可能对这块业务不太熟原本是回执ID recordId 一个手机号一个但是同事接的时候将这个批量发送接口只设置了一个recordId 导致了多个手机号共用了一个recordId 2 线上d
Linux系统发生故障时，所有文件会以只读方式挂载

解决办法执行mount o remount rw 让文件可以修改原因挂载磁盘时没有写fstab文件或者fstab文件里写的是磁盘名称而不是uuid
解决问题：EXT4 filefield 文件上传在IE8上返回状态无效，弹出下载页面

解决描述 EXT4 filefield 以form 文件上传基于IE8浏览器不管上传成功与否返回状态无效即success function fp o 方法无效并弹出下载页面原代码情况如下 1 EXT4前台视图层view view
civetweb框架学习和使用(一)

背景 CivetWeb基于Mongoose项目是一个易于使用功能强大的C C 嵌入式Web服务器在2013年8月16日在编写和分发此项目所依据的原始代码后 Mongoosed的许可证已经更改了因此 CivetWeb已从上一个MIT
Windows下在后台运行jar包

为什么80 的码农都做不了架构师 gt gt gt 新建一个bat文件输入 echo off start javaw jar xxx jar exit 执行这个批处理程序就可以在后台运行jar包了转载于 https my oschina
FIddler之Fiddler移动端抓包

前言笔者今天的这篇文章呢想使用通俗易懂的话语让大家明白以下内容什么是抓包哪些场景需要用到抓包Fiddler抓包的原理怎样使用Fiddler进行移动端抓包一抓包包 Packet 是TCP IP协议通信传输中的数据单位一般也称
Apache/Tomcat/JBOSS/Jetty/Nginx区别与选择

总结 Apache Tomcat JBOSS Nginx区别 1 Apache是Web服务器 Tomcat是应用 Java 服务器 Tomcat在中小型系统和并发访问用户不是很多的场合下被普遍使用 Apache支持静态页 Tomcat支持动
千行代码bug率统计

1 计算公式千行代码bug率 bug数代码行数 1000 2 bug率标准 CMMI级别中做出了相关的指标规定千行代码缺陷率 bug率 CMM1级 11 95 CMM2级 5 52 CMM3级 2 39 CMM4级 0 92 CMM5
JWT(Json Web Token)的原理、渗透与防御

关于JWT kid安全部分后期整理完毕再进行更新 2023 05 16 JWT的原理渗透与防御目录 JWT的原理渗透与防御含义原理 JWT的起源传统session认证问题 token与session区别 JWT的结构与内容 JW
CVPR 2020-Object Detection

目录 2D目标检测视频目标检测 2D目标检测 Large Scale Object Detection in the Wild From Imbalanced Multi Labels Rethinking Classification
芯片手册中的英文的表示含义

芯片手册中的英文的表示含义在读芯片的数据手册的时候会有一些英文表示不知道是什么含义现在整理了一些在下面 1 ppm 在一些电压芯片数据手册里有一个描述基准性能的直流参数称为温度漂移也称温度系数或简称TC Temperature
机器学习之朴素贝叶斯: sklearn.naive_bayes

朴素贝叶斯 sklearn naive bayes 1 贝叶斯原理 2 朴素贝叶斯 3 朴素贝叶斯模型 3 1 多项式模型MultinomialNB 3 2 高斯模型GaussianNB 3 3 伯努利模型BernoulliNB 4 skl
Python爬虫之爬取CSDN人工智能栏目的文章

在进行正式开始爬虫之旅前我们要认识几个Python库 urllib2 Python标准库该库中提供了一系列针对url的操作方法 re Python标准库提供了一系列针对字符串匹配的方法 BeautifulSoup4 最主要的功能是从网
【推荐算法】双塔模型介绍

双塔模型的结构不仅在推荐领域的召回和粗排环节中被广泛采用而且在其它领域如文档检索问答系统等都有它的应用场景我们常说的双塔模型的结构并不是一个固定不变的网络而是一种模型构造思路即把模型分成用户侧模型和物品侧模型两部分然后用互操
LaTeX公式、图片编辑中的常见问题（字体、对齐、编号等）

类似博文 https blog csdn net u011698800 article details 109456028 输入保留符号 LaTeX中有许多字符都有特殊的意义 LaTeX中的保留字符有这些在正文中都不能直接呈现反斜杠用
C++数据结构X篇_02_线性表基本概念（线性表是零或者多个数据元素的有限序列；有顺序，有限，类型必须相同；线性表是具有相同类型n个数据元素的有限序列（a0,a1,...an）ai是表项，n是表长度）

接上篇C 数据结构X篇 01 数据结构的基本概念本篇将会学习线性表的基本概念线性表的基本概念 1 线性表的基本概念 1 1 线性表的基本概念 1 1 1 线性表的特性 1 2 线性表的数学定义 1 2 1 线性表的性质 1 3 线性表的
好家伙谷歌翻译又不能用了（有效解决方法）

今天打开idea想翻译单词发现谷歌翻译又又又挂了为什么挂掉可能是那个ip节点太多人用了我也不懂我就是一个小白不bb了说一下解决方法一手动Ping可以连接的ip 这里我使用的是 https ping chinaz com 然后我们
适合有编程基础的人看的《韩顺平零基础30天学java》笔记（374~397）

写在最前边研究生一枚为后端实习和未来工作打基础无意间发现韩顺平老师的课程细心细致讲课和吴恩达老师一样都是保姆式讲解各种基础知识都会补充爱了韩顺平老师课程地址 https www bilibili com video BV1
眼底图像血管增强与分割--（2）Gabor滤波算法原理及实现

在http blog csdn net piaoxuezhong article details 78213672中介绍了匹配滤波算法用于血管分割本篇继续介绍血管分割的另一种方法 Gabor滤波算法具体可以参见论文 Retinal Ve
大律法(OTSU) ——图像数据二值化

二值化的目的是确定一个像素值以像素为分界将图像划分为前景和背景前景的像素值取相同值背景的像素也取相同值从而将前景和背景的差异在图像中最大化或者说可以突出前景或者背景信息二值化可以有效的降低噪声并且可以一定程度的增强目标特

大律法(OTSU) ——图像数据二值化

大律法(OTSU) ——图像数据二值化 的相关文章

随机推荐

热门标签

大律法(OTSU) ——图像数据二值化的相关文章