计算机视觉基础1

2023-11-10

颜色空间  空间之间可以进行转换

RGB空间

HSV空间

CIE-XYZ颜色空间 基于人类颜色视觉的直接测定

主流的颜色空间 RGB三通道彩色图 图片=》三维矩阵[0,255]

单通道灰度图 Gray

图像预处理 是图像增强的过程 

目标 改善图像的视觉效果,转换为更适合与人或机器分析处理的方式,突出对人或机器分析有意义的信息,一直无用信息,提高图像的使用价值

图像锐化、平滑、去噪等

图像处理方法:空间域处理、频率域处理

        空间域处理:点运算、形态学运算、邻域运算

        频率域运算:傅里叶变换、小波变换

点运算  特征提取的方法

        直方图 对图片数据、特征分布的一种统计(统计灰度、颜色、梯度/边缘、形状、纹理,局部特征点、视觉词汇)

                  对数据空间(bin)进行量化

                直方图均衡化 利用图像直方图对对比度进行调整的方法,实质上是对图像进行非线性拉伸,重新分配各个灰度单位中的像素点数量,是一定灰度范围像素点的数量的值大致相等

自适应直方图均衡(AHE)算法通过对局部取余进行直方图均衡。

CLAHE 限制对比度自适应直方图均衡,AHE会过度放大图像中相对均匀区域的噪音,

 

 不同块进行不同的直方图均衡化,不同区域由相邻块的灰度映射值进行插值,线性插值或者双线性插值

CLAHE算法步骤:

形态学运算 膨胀和腐蚀

开运算:先腐蚀再膨胀,可以去掉目标外的孤立点;闭运算:先膨胀再腐蚀,可以去掉目标内的孔

空间域处理

        滤波/卷积  在每个图片位置上进行基于邻域的函数计算

        不同功能需要定义不同的函数 平滑/去噪 梯度/锐化  边缘、显著点、纹理,模式检测

        通过padding边界填充可在卷积后获得同尺寸的输出

        平滑中值滤波 有效去除椒盐噪声  

        平滑高斯滤波 有效去除高斯噪声  高斯核 得到结果关注中心区域

        梯度 拉普拉斯滤波   团块检测 边缘检测

        如何让卷积更快  空域卷积=频域卷积

高斯金字塔

        将图像金字塔化:先进性图像平滑,再进行降采样,根据降采样率,得到一系列尺寸逐渐减小的图像。        目的:捕捉不同尺寸的物体

高斯金字塔本质上为信号的多尺度表示法

拉普拉斯金字塔:高频细节信息在卷积核下采样中丢失,保留所有层所丢失的高频信息用于图像恢复

傅里叶变换  一个信号可以有足够多个不同频率和幅值的正余弦波组成

傅里叶变换 信号分解

欧拉公式描述的是一个随时间变化,在复平面上做圆周运动的点,傅里叶变换描述的就是一系列这样的点的运动叠加效应。

2D傅里叶变换,图像又若干个2D傅里叶基图片构成

相位滤波 频谱滤波

傅里叶变换不足  傅里叶变化假设前提为信号平稳,但实际中信号多数为非平稳信号。 缺乏时间和频率的定位功能,对于非平稳信号的局限性,在实践中和频率分辨率上的局限性。

短时傅里叶变换  添加时域信息的方法时设置窗口,人为窗口内的信号是平稳的,窗口大小很难设置。

小波变换,把傅里叶变换的基给换了,将无限长度的三角函数基换位有限长的会衰减的基,不仅能获取频率还可以定位到时间。

小波函数是一族函数,均值为0 在时域和频域都局部化,Haar小波(梯度的突变)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算机视觉基础1 的相关文章

  • 使用 Xcode 为 OS X Lion / Mountain Lion 编译 OpenCV (2.3.1+)

    谁能给我提供一些如何使用 Xcode 在 OS X Lion 上编译 OpenCV 2 3 1 的详细指南 我对此很生气 我得到了源代码 使用 cmake 创建 Xcode 模板并尝试构建它 但它失败并出现大约 200 个错误 提前致谢 多
  • 使用 OpenCV 绘制固定的网格线集

    是否可以根据 OpenCV 示例文件中颜色检测示例的输出 在所有交叉点处绘制具有定义点的用户定义网格线 基本上 网络摄像头需要从您上方检测人的头部和肩膀 然后 当检测到一个人时 我需要网格线在那里 以便我能够知道在 x 轴和 y 轴 前额和
  • Opencv - Features2D + 单应性不正确的结果

    我在将检测到的物体的轮廓放置在正确的位置时遇到了一些问题 就好像坐标位于错误的位置一样 我将粗麻布设置为 2000 并过滤了小于最小距离 3 倍的匹配 任何帮助 将不胜感激 运行匹配和单应性的结果 代码示例如下 public static
  • OpenCV:处理每一帧

    我想使用 OpenCV 编写一个跨平台应用程序进行视频捕获 在所有示例中 我发现来自相机的帧是使用抓取功能进行处理并等待一段时间 我想处理序列中的每一帧 我想定义自己的回调函数 每次当一个新帧准备好处理时都会执行该函数 例如直播对于 Win
  • 如何使用 Python 3 在 OpenCV 3 上正确加载 cv2.KeyPoint 和描述符?

    有一天 我不得不恢复一个使用 OpenCV 3 和 Python 2 7 的旧项目 在此代码中 要加载 cv2 KeyPoint 我执行以下操作 import numpy as np import cPickle import cv2 ke
  • 将 RGB 转换为黑色或白色

    我如何在Python中获取RGB图像并将其转换为黑白图像 不是灰度 我希望每个像素要么是全黑 0 0 0 要么是全白 255 255 255 流行的 Python 图像处理库中是否有任何内置功能可以完成此任务 如果不是 最好的方法是循环遍历
  • ECC 导致多光谱图像的图像对齐失败

    我正在尝试将 RGB 图像与 IR 图像 单通道 对齐 目标是创建 4 通道图像 R G B IR 为了做到这一点 我正在使用cv2 findTransformECC如中所述这个非常简洁的指南 https learnopencv com i
  • 在 python + openCV 中使用网络摄像头的问题

    我正在使用以下代码使用 openCV python 访问我的网络摄像头 import cv cv NamedWindow webcam feed cv CV WINDOW AUTOSIZE cam cv CaptureFromCAM 1 然
  • 构建 OpenCV 时出错 :: MonitorFromRect 未在此范围内声明

    我试图建立OpenCV version 2 4 8与它一起使用CodeBlocks and MinGw 我按照以下指示进行操作here http kevinhughes ca tutorials opencv install on wind
  • 用于 C++ 中图像分析的 OpenCV 二进制图像掩模

    我正在尝试分析一些图像 这些图像的外部周围有很多噪声 但内部有一个清晰的圆形中心 中心是我感兴趣的部分 但外部噪声正在影响我对图像的二进制阈值处理 为了忽略噪音 我尝试设置一个已知中心位置和半径的圆形蒙版 从而使该圆之外的所有像素都更改为黑
  • 跟踪白色背景中的白球(Python/OpenCV)

    我在 Python 3 中使用 OpenCV 来检测白场上的白 黑球 并给出它的精确 x y 半径 和颜色 我使用函数 cv2 Canny 和 cv2 findContours 来找到它 但问题是 cv2 Canny 并不总是检测到圆的完整
  • 如何计算立体视觉的基本矩阵

    我正在尝试编写一些代码来计算基本矩阵以确定立体图像之间的关系 我从大多数人推荐的 Hartley 和 Zisserman 书开始 但它没有任何实际示例 并且示例代码是在 MATLAB 中 而我没有 然后我切换到这个比较实用 里面有实际例子
  • 如何使用 OpenCV 从图像中获取调色板 [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我想提取图像的调色板 类似于此 来自 我需要它来提取特定的颜色 如黄色 绿色和棕色 并显示该颜色覆盖的区域的百分比 另外 我可以添加更
  • 如何获得垂直线穿过的完整内轴线?

    我有一个图像 我想获取穿过其中轴的像素 我尝试使用骨架化 and 中轴方法来获取它们 但这两种方法都返回比相应对象短的一维线 这是带有示例图像的代码 gt gt gt import skimage filter gt gt gt impor
  • 警告:发生了非法反射访问操作(java 中的便携式 opencv)

    我想做一个便携的opencv将依赖项添加到 maven 文件的应用程序pom xml 简化的代码是 import org opencv core Mat public class Builder public static void mai
  • VideoCapture 未检测到 uEye 摄像头

    我的 uEye 相机遇到了一个问题 使用我的笔记本电脑摄像头 id 0 或 USB 上的网络摄像头 id 1 此行完美运行 TheVideoCapturer open 1 TheVideoCapturer 属于 VideoCapture 类
  • 如何确定透视变换后的点在新图像平面中的位置?

    我使用 OpenCV Python Numpy 图像中有三个点 我知道这些点的确切位置 P1 P2 N1 我要将图像转换为另一个视图 例如 我将透视图转换为侧视图 如果这样做 我将无法获得图像平面中这三个点的确切位置 我应该以一种可以获得这
  • 从凸点获取角点

    我编写了算法来提取图像中显示的点 它们形成凸形 我知道它们的顺序 如何从这些点中提取角点 顶部 3 个和底部 3 个 我正在使用opencv 如果你已经有了物体的凸包 并且该包包含角点 那么你需要做的就是简化包直到它只有 6 个点 有很多方
  • 如何识别与我的对象相关的轮廓并找到它们的几何质心

    问题陈述和背景信息 EDIT 约束 法兰上的红色会随着时间的推移而变化 所以我此时不会尝试使用颜色识别来识别我的对象 除非它足够强大 此外 外部照明也可能是一个因素 因为将来这将是在室外区域 我有 RGB 深度相机 有了它 我就能捕捉到这个
  • 使用 openCV 对图像中的子图像进行通用检测

    免责声明 我是计算机视觉菜鸟 我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子 我的用例有点不同 因为我不希望它是具体的 而且我不确定如何做到这一点 如果可能的话 但我感觉应该如此 我有大量图像数据集 有时 其中一些图像是数据集的

随机推荐

  • iTerm2创建ssh自动登陆脚本

    iterm2保存ssh密码自动登录 前提 OS macOS Big Sur 11 6 ITerm2 3 4 10 CPU x86架构 由于mac没有xshell也没有MobaXterm 找了个据说最好使的iTerm2 但是 iterm2不方
  • 把python的字典文件保存为.json格式的文件

    将字典结构数据保存为 json 格式文件 并打开 import json dict a 4 b 2 6 4 3 2 c d 4 e 5 代保存字典文件 dict json json dumps dict 转化为json格式文件 将json文
  • 公安局计算机岗位应知应会综合基础知识,事业单位考试计算机综合知识基础知识真题...

    事业单位考试计算机综合知识基础知识真题 根据最新事业单位考试真题等汇总而成 事业编考试网 http www shizheng100 com 提供更多笔试真题 面试原创内容等 一 单项选择题 本大题共50个小题 每小题1分 共50分 1 下面
  • 微信小程序:从小程序打开H5页面

    1 样式 关于踩的坑和更多信息请看后续文章 已发布 2 两个wxml 第一个wxml
  • 退役小节

    大学期间我能拿的出手的好像只有acm 貌似acm的成绩也拿不出手 有点荒废的意思 大一被猴哥拉进武术协会 然后第二年这个协会就解散了 解散之前猴哥还在协会找个女朋友 真的是皮 第一学期刷了500道题 然后就进了acm实验室 为什么要进实验室
  • 语义分割系列26-VIT+SETR——Transformer结构如何在语义分割中大放异彩

    SETR Rethinking Semantic Segmentation from a Sequence to Sequence Perspectivewith Transformers 重新思考语义分割范式 使用Transformer实
  • Java 函数式编程 详细介绍

    在兼顾面向对象特性的基础上 Java语言通过Lambda表达式与方法引用等 为开发者打开了函数式编程的大门 下面我们做一个初探 Lambda的延迟执行 有些场景的代码执行后 结果不一定会被使用 从而造成性能浪费 而Lambda表达式是延迟执
  • linux远程管理工具之tabby

    linux远程管理工具之tabby Tabby简介 Tabby下载及安装 PowerShell 快捷键 Tabby简介 tabby是一款开源且免费的终端连接工具 可以使用于多平台 例如 windows mac linux等系统都支持 Tab
  • 峰面积峰高半峰宽_峰高峰面积的计算方法

    峰面积和峰高的计算方法 峰面积和峰高是色谱图上最基本数据 它们的测量精度将直接影响定量分析的精度 在色谱峰是对称 峰 且与其他峰完全分离的情况下 准确地测出峰高和峰面积是不困难的 但是当色谱峰不对称 没 有完全分离开以及基线发生较明显的漂移
  • Hudi学习2:数仓和数据湖介绍

    数据湖解决了 1 数仓无法存储非结构化数据 图像 音视频等 的问题 2 解决了数仓必须分层 数据湖直接存储原始数据 不需要分层 直接用于应用 数仓和数据湖的区别 性价比 分层可能存在冗余
  • Pytorch 中 LSTM 和 LSTMCell 的区别

    LSTM 的官方文档在这里 在例子中 LSTM 函数的参数为输入特征向量的长度 input size 10 隐藏层向量的长度 hidden size 20 隐藏层的数量 num layers 2 输入 input 的维度是时间 序列长度 句
  • Java学习interface4

    A package com mashibing interfacedemo5 public interface A public void show B package com mashibing interfacedemo5 public
  • dataphin如何使用zip文件,离线安装python第三方包?

    好久没写文章啦 快过年了啦 打工人要回家啦 背景介绍 每次在dataphin里使用pandas的时候 都要pip install pandas dataphin需要下载pandas安装包 比较费时 总而言之 这种方式慢 所以我要在datap
  • 台式计算机销量排名,2019台式电脑销量排行_笔记本哪些好 2019笔记本销量排行榜...

    笔记本哪些好 2019笔记本销量排行榜 JPG 594x348 232KB 428 250 笔记本哪些好 2019笔记本销量排行榜 JPG 570x350 128KB 407 250 台式电脑哪款好 2019十款热门台式电脑排行榜 JPG
  • cocos2d-x 旅程开始--(实现瓦片地图中的碰撞检测)

    转眼隔了一天了 昨天搞了整整一下午加一晚上 楞是没搞定小坦克跟砖头的碰撞检测 带着个问题睡觉甚是难受啊 还好今天弄成功了 不过感觉程序不怎么稳定啊 而且发现自己写的东西让我重写一遍的话我肯定写不出来 还要继续学习啊 上次的进度 实现了坦克的
  • 学生信息管理系统——C语言版本(易懂)

    一 功能概述 1 账号的登录与注册 2 学生信息的增添 3 学生信息对于学号的排序 4 学生信息的删除 5 学生信息的修改 6 学生信息的查找 7 学生信息的分类 8 学生信息表的打印 9 结束程序时对信息的在内存中的保存 10 执行程序时
  • 地类图斑代码大全_使用字段计算器对同一地类图斑自动编号(标记重复记录)...

    问题描述 在某个表中把某个字段 如字段一 中具有相同值的记录标出来 并且按照从小到大的排序自动增加一个编号 存储在字段二中 实现如下的效果 FID 字段1 字段2 1 001 0011 2 001 0012 3 002 0021 4 002
  • 离散系统的稳定性分析

    自控笔记 6 5 离散系统的稳定性分析 一 离散系统稳定的充要条件 线性连续系统的稳定的充要条件是特征方程的根全部位于左半s平面 在离散系统中 根据s平面与z平面之间的映射关系 s j z
  • android开发技术要点

    android开发技术要点 应用内HTML5的开发 提升应用内HTML5的开发和使用体验 com tencent smtt 手机京东 第三方登录 腾讯QQ互联平台 热补丁 Tinker 微信Android热补丁方案 地图 腾讯位置服务 百度
  • 计算机视觉基础1

    颜色空间 空间之间可以进行转换 RGB空间 HSV空间 CIE XYZ颜色空间 基于人类颜色视觉的直接测定 主流的颜色空间 RGB三通道彩色图 图片 三维矩阵 0 255 单通道灰度图 Gray 图像预处理 是图像增强的过程 目标 改善图像