机器视觉(Robot Vision)——2

2023-05-16

参考书籍   《Robot Vision》  MIT机器视觉课程指定教材

机器视觉探究两个基本问题:

  • 成像过程的基本原理是什么?
  • 如何探索对成像过程“求逆”的基本知识和方法。
    所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。

基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。

  • 早期视觉:如何从图像中得到简单的符号描述。
  • 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。

文章目录

    • 第2章 成像与图像检测(感知 sensing)
      • 2.1 成像的两个方面
        • 2.1.1 透视投影(广角镜头)
        • 2.2.2 正射投影(望远镜)
      • 2.2 亮度
      • 2.3 透镜
      • 2.4 我们的视觉世界
      • 2.5 图像感知
        • 2.5.1 感知颜色
        • 2.5.2 随机性和噪声
        • 2.5.3 图像量化

第2章 成像与图像检测(感知 sensing)

  • 1、图像是如何生成的?
    通过分析从三维世界到二维图像平面的映射过程,我们知道关于成像的两个核心问题:
    • 是什么决定:物体表面某一点的像的位置?(图像投影)
    • 是什么决定:物体表面所成的像的亮度?(图像辐射)
  • 2、所生成的图像是如何被计算机感知的?
    • 1)图像传感器的基本原理。
    • 2)如何获取和处理不同频带上的信息。

2.1 成像的两个方面

  • 图像是一个二维的亮度模式。
    首先,我们需要知道:场景中的点和图像上的点之间的几何关系。
    然后,我们需要弄清楚:是什么决定(图像中)该点的亮度。

2.1.1 透视投影(广角镜头)

  • 所谓透视投影:图像的每个点都对应一个方向:即从一个点出发,穿过小孔的一条射线。光线沿这个射线传播,进行成像。
  • 数学表达
    [ x ˊ f ˊ , y ˊ f ˊ ] T = [ x z , y z ] T [{\acute{x}\over \acute{f}} ,{\acute{y}\over \acute{f}} ]^{T}= [{x\over z} , {y\over z} ]^{T} [fˊxˊ,fˊyˊ]T=[zx,zy]T

2.2.2 正射投影(望远镜)

  • 所谓正射投影:光线沿平行于光轴的方向传播,从而进行成像
  • 数学表达:
    [ x ˊ , y ˊ ] T = [ m x , m y ] T [\acute{x} ,\acute{y} ]^{T}= [mx ,my]^{T} [xˊ,yˊ]T=[mx,my]T
    放大率 m = f ˊ / ( − z ) m=\acute{f}/(-z) m=fˊ/(z)
  • 景深:场景的深度。
  • 景深的变化:场景的深度范围。即场景中可见物体表面所形成的曲面到相机的距离范围。
  • 如果相对于场景到相机的平均距离来说,景深的变化很小时;透视投影和正射投影差别也很小。
  • 焦距越长,视野越小。

2.2 亮度

  • 图像亮度:与射入像平面的能流有关。
    图像亮度可以用辐照强度来度量:照射到物体表面单位面积上的光的强度。单位: W / m 2 W/m^2 W/m2
    E = δ P δ A E=\frac{\delta P}{\delta A} E=δAδP
  • 场景亮度:与从物体表面发射出的能流有关。
    场景亮度可以用辐射强度来度量:单位面积沿着单位立体角所发射出的光的功率。单位 W ⋅ m − 2 ⋅ s r − 1 W\cdot m^{-2}\cdot sr^{-1} Wm2sr1
    L = δ 2 P δ A δ ω L=\frac{\delta^2 P}{\delta A \delta \omega} L=δAδωδ2P
  • 图像辐照强度的测量结果与场景辐射强度成正比。比例系数取决于成像系统的参数。

2.3 透镜

2.4 我们的视觉世界

2.5 图像感知

2.5.1 感知颜色

2.5.2 随机性和噪声

2.5.3 图像量化

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器视觉(Robot Vision)——2 的相关文章

  • 深度学习相关资料总结

    近这两年里deep learning技术在图像识别和跟踪等方面有很大的突破 是一大研究热点 里面涉及的数学理论和应用技术很值得深入研究 这里总结一些在微博发布和转载的相关资料 以便查阅 一 winsty NIPS2013 Learning
  • HyperLPR车牌识别技术算法之车牌粗定位与训练

    关于HyperLPR HyperLPR是一个使用深度学习针对对中文车牌识别的实现 与较为流行的开源的EasyPR相比 它的检测速度和鲁棒性和多场景的适应性都要好于目前开源的EasyPR HyperLPR可以识别多种中文车牌包括白牌 新能源车
  • YUV学习,详解

    YUV 格式详解 只看这一篇就够了 分类标准 首先 我们可以将YUV格式按照数据大小分为三个格式 YUV420 YUV422 YUV444 由于人眼对Y的敏感度远超于对u和v的敏感度 所以有时候可以多个Y分量共用一组uv 这样既可以极大的节
  • Convolutional Pose Machine - 卷积姿态网络

    Convolutional Pose Machine 卷积姿态网络 论文主要解决 单人单目 RGB图像姿态估计问题 本篇论文也是现在非常火热的openpose开源项目的核心之一 这篇来自CMU的论文为单人姿态估计方面研究注入新的思路 论文网
  • Canny边缘检测算法原理及其VC实现详解(一)

    目录 1 边缘检测原理及步骤 2 Canny边缘检测算法原理 2 1 对原始图像进行灰度化 2 2 对图像进行高斯滤波 2 3 用一阶偏导的有限差分来计算梯度的幅值和方向 2 4 对梯度幅值进行非极大值抑制 2 5 用双阈值算法检测和连接边
  • 缺陷检测公开数据集大全

    一 弱监督学习下的工业光学检测 DAGM 2007 数据下载链接 https hci iwr uni heidelberg de node 3616 数据集简介 主要针对纹理背景上的杂项缺陷 较弱监督的训练数据 包含十个数据集 前六个为训练
  • 【机器视觉】——裂纹检测笔记

    目录 传统算法处理裂缝的基本思路 第一种思路 第二种思路 第三种思路 CPP代码 halcon代码 python代码 Matlab代码 深度学习缺陷检测 裂缝检测文献 传统算法处理裂缝的基本思路 第一种思路 1 先转换彩色图为灰度图 2 进
  • 知乎上对 国内机器视觉行业的发展的 讨论-经典

    如何看待国内机器视觉行业的发展 希望以公司为例盘点 最近关注机器人领域 图像识别行业 感觉国内视觉公司对工业自动化方向更为关注 说说大家对于机器视觉行业发展的看法 以及给研发人员职业规划的建议 添加评论 分享 按投票排序 按时间排序 8 个
  • FFT频谱分析原理

    FFT频谱分析原理 采样定理 采样频率要大于信号频率的两倍 N个采样点经过FFT变换后得到N个点的以复数形式记录的FFT结果 假设采样频率为Fs 采样点数为N 那么FFT运算的结果就是N个复数 或N个点 每一个复数就对应着一个频率值以及该频
  • 机器视觉及其应用发展

    导读 一 机器视觉的研究和发展动态 机器视觉的研究 发展和应用还远没有达到成熟的程度 机器视觉从诞生到今天才只有短短的三十多年时间 在机器视觉中承担 大脑 作用的图像分析处理 图像理解和模式识别理论和技术基础还非常不完善 甚至 机器视觉的图
  • 拉普拉斯的原理

    拉普拉斯是一种二阶导数算子 是一个与方向无关的各向同性 旋转轴对称 边缘检测算子 若只关心边缘点的位置而不顾其周围的实际灰度差时 一般选择该算子进行检测 拉普拉斯算子为二阶差分 其方向信息丢失 常产生双像素 对噪声有双倍加强作用 因此它很少
  • 相机曝光与增益

    曝光 和 增益 是直接控制传感器 CCD CMOS 上读出来的数据 是要优先调节的 以调节曝光时间为主 不过曝的前提下 增加曝光时间可以增加信噪比 使图像清晰 软件上有个选项可以把过曝的区域显示出来 当然 对于很弱的信号 曝光也不能无限增加
  • 【机器视觉学习笔记】大津法/Otsu最大类间方差法 最佳阈值处理(C++)

    目录 概念 C 源码 OtsuThreshold 主函数 效果 完整源码 平台 Windows 10 20H2 Visual Studio 2015 OpenCV 4 5 3 本文所用源码修改自C opencv 图片二值化最佳阈值确定 大津
  • 使用Matlab相机标定库(Camera Calibration Toolbox)问题小记

    使用Matlab相机标定库 Camera Calibration Toolbox 问题小记 Camera Calibration Toolbox的官方网站 http www vision caltech edu bouguetj calib
  • 施努卡:基于深度学习的裂缝检测技术

    不同于传统的裂缝检测方法 基于深度学习的检测方法不需要人工干预 能自主学习有代表性的特征 直接对输入图像的裂缝进行检测 随着深度学习方法在许多应用场景中取得了很好的检测结果 国内众多研究人员也开始把基于深度学习的目标检测模型和语义分割模型用
  • 机器视觉基础

    机器视觉基础 什么是机器视觉 机器视觉常见的应用 机器视觉常用的概念 硬件选型 控制器 相机 镜头 附件选型 什么是机器视觉 机器视觉常见的应用 机器视觉常用的概念 快门时间越短 图片越暗淡 光圈小了 照片会暗淡 硬件选型的时候考虑物距 W
  • CV 经典主干网络 (Backbone) 系列: CSP-Darknet53

    CSP Darknet53 0 引言 1 网络结构图 1 1 输入部分 1 2 CSP部分结构 1 3 输出部分 2 代码实现 2 1 代码整体实现 2 2 代码各个阶段实现 3 代码测试 4 结论 0 引言 CSP Darknet53无论
  • MAttNet

    PyTorch Implementation of MAttNet Introduction This repository is Pytorch implementation of MAttNet Modular Attention Ne
  • Android Vision Api - 条码检测如何获取条码类型?

    我正在使用 AndroidGoogle Vision API 并创建了一个标准条形码阅读器 但我想检测读取什么类型 格式的条形码 i e CODE 39 CODE 128 QR Code ETC 有没有办法返回类型 Thanks 因为我没有
  • 人眼注视检测:识别用户正在看板上的位置[关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我正在开发一个项目 上面有板和相机 目标是识别正在看黑板的学生 并确定他们视线的位置 在黑板上 目前 我计划从以下几个方面来应对挑

随机推荐

  • LED高效恒流驱动电源的设计指导书

    参考链接 LED高效恒流驱动电源的设计指导书 LED灯驱动电源设计 LED恒流驱动电路 精 LED恒流驱动电路 led灯驱动电源电路图 led灯的驱动原理电路图方案详解 KIA MOS管 一 LED驱动电源原理 1 由于LED的光特性通常都
  • 恒流源驱动电路 随笔一

    方案一 参考论文 LED光源驱动电路研究 华科 硕士 08 06 采用恒流源控制的原因 1 LED的PN结的温度系数为负 温度升高时LED的势垒电势降低 由于这个特点 所以LED不能直接用电压源供电 必须采用限流措施 否则LED随着工作时温
  • 恒流源驱动电路 随笔二

    参考论文 LED的驱动电路研究 大理 硕士 07 06 三个简单方案 电荷泵驱动的典型电路 CAT3604是一个工作在1x 1 5x分数模式下的电荷泵 可调节每只LED白光管脚 xff08 共4只LED管脚 xff09 的电流 使背光的亮度
  • gcc编译c文件常用命令参数解释

    gcc编译c文件 gcc是常用来编译c语言程序的编译器 xff0c 了解它编译c语言的命令参数 xff0c 对c c 43 43 语言的学习是有一定好处的 gcc编译文件一步到位的命令格式 gcc main c o main exe 设置了
  • 恒流源驱动电路 随笔三

    参考论文一 LED蓝绿光黄疸光疗系统的研究与设计 天工 硕士 15 12 AMC7150是一种仅需 xff15 个外部零件的高功率LED驱动IC AMC7150内建P xff37 xff2d 和功率晶体管 xff0c 工作频率可达200kH
  • 光源系统厂商、结构

    参考论文 基于PWM的LED机器视觉光源技术的研究 哈工大 硕士 span class token number 2009 span fpga 前言 机器视觉系统包括 xff1a 照明 镜头 相机 图像采集卡 视觉处理器 led光源分为两大
  • LED驱动IC厂家

    厂家芯片类别 世微半导体 英飞凌Infineon 壹芯半导体科技 xff08 深圳 xff09 有限公司 欧司朗OSRAM xff1a 汽车照明 深圳天微电子有限公司 中铭电子 深圳市华芯光电有限公司 宁波欧特电子科技有限公司 芯片介绍 l
  • 2D/3D模板匹配

    2D 对象 正交视图 物体的组成部分之间的角度和距离可以改变 xff0c 不需要缩放 需要缩放 存在遮挡 杂乱或颜色 物体的特征是具有特定的纹理 xff0c 而不是清晰可见的轮廓 图像高度散焦 对象变化显著 期望物体轮廓的局部变形 xff0
  • linux基础操作之三

    文章目录 10 命令执行顺序控制与管道命令执行顺序的控制1 顺序执行多条命令2 有选择的执行命令 管道3 1 试用3 2 cut 命令 xff0c 打印每一行的某一字段3 3 grep 命令 xff0c 在文本中或 stdin 中查找匹配字
  • 2020华为软挑总结——baseline

    span class token macro property span class token directive keyword include span span class token string lt bits stdc 43
  • 2020华为软挑总结——复赛方案一code

    span class token macro property span class token directive keyword include span span class token string lt iostream gt s
  • 2020华为软挑总结——方案二code

    span class token macro property span class token directive keyword include span span class token string lt iostream gt s
  • 机器视觉照明技术与装置实验研究(论文纪要)

    参考文献 机器视觉照明技术与装置实验研究 中原 硕士 2016 有用 摘要 图片质量很大程度上是由目标周围的照明环境和目标物体表面材质 物体摆放位置所决定的 1 首先 xff0c 对照明系统主要技术进行了研究 研究内容包括光源的参数与选择
  • Affine Transformations(仿射变换)

    英文版原文链接 先修教程 xff1a Remapping 重映射 下一教程 xff1a Histogram Equalization 直方图均衡化 文章目录 结果目标原理什么是仿射变换 我们如何得到一个仿射变换 代码这个程序是做什么的 代码
  • Linux 网桥功能使用

    Linux 网桥功能使用 网桥是在数据链路层 xff0c 将两个LAN连接起来 xff0c 根据MAC地质来转发帧 xff0c 可以看作是低层的路由器 安装网桥配置工具 检测系统中是否有有bridge 工具 xff1a rpm qa gre
  • Remapping(重映射)

    英文版原文链接 上一教程 xff1a Hough Circle Transform Hough圆变换 下一教程 xff1a Affine Transformations 仿射变换 文章目录 结果目标原理什么是重映射 xff1f 代码这个程序
  • 机器视觉(Robot Vision)——1

    参考书籍 Robot Vision MIT机器视觉课程指定教材 机器视觉探究两个基本问题 xff1a 成像过程的基本原理是什么 xff1f 如何探索对成像过程 求逆 的基本知识和方法 所谓 求逆 xff1a 具体来说 xff0c 就是从一张
  • 机器视觉实验架套装选型

    文章目录 0 机器视觉集成商0 1 上海热驰自动化1 海康威视2 集云誉创3 深圳新次元4 机器视觉光源控制器厂5 恒视科技6 小厂商6 机器视觉检测配套商 0 机器视觉集成商 购买链接 基础款 xff1a 580 970 加强款 xff1
  • meiqua / shape_based_matching(issue记录)

    文章目录 readmeissue 1 如何加快responsemap的创建 issue 2 请问一下是否抗缩放呢 xff1f issue 3 匹配准确定位精度还能再提高吗 xff1f branch有些多了 xff0c 能否写个文档介绍一下各
  • 机器视觉(Robot Vision)——2

    参考书籍 Robot Vision MIT机器视觉课程指定教材 机器视觉探究两个基本问题 xff1a 成像过程的基本原理是什么 xff1f 如何探索对成像过程 求逆 的基本知识和方法 所谓 求逆 xff1a 具体来说 xff0c 就是从一张