机器视觉(Robot Vision)——2

2023-05-16

参考书籍   《Robot Vision》  MIT机器视觉课程指定教材

机器视觉探究两个基本问题：

成像过程的基本原理是什么？
如何探索对成像过程“求逆”的基本知识和方法。
所谓“求逆”：具体来说，就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。

基本研究方法：建立物理模型 ==> 导出数学公式 ==> 实现相应算法。

早期视觉：如何从图像中得到简单的符号描述。
后期视觉：如何使用这些简单的符号描述来生成一个复杂的结构化描述。

文章目录

- 第2章成像与图像检测(感知 sensing)
- - 2.1 成像的两个方面
  - - 2.1.1 透视投影(广角镜头)
    - 2.2.2 正射投影(望远镜)
  - 2.2 亮度
  - 2.3 透镜
  - 2.4 我们的视觉世界
  - 2.5 图像感知
  - - 2.5.1 感知颜色
    - 2.5.2 随机性和噪声
    - 2.5.3 图像量化

第2章成像与图像检测(感知 sensing)

1、图像是如何生成的？
通过分析从三维世界到二维图像平面的映射过程，我们知道关于成像的两个核心问题：
- 是什么决定：物体表面某一点的像的位置？（图像投影）
- 是什么决定：物体表面所成的像的亮度？（图像辐射）
2、所生成的图像是如何被计算机感知的？
- 1）图像传感器的基本原理。
- 2）如何获取和处理不同频带上的信息。

2.1 成像的两个方面

图像是一个二维的亮度模式。
首先，我们需要知道：场景中的点和图像上的点之间的几何关系。
然后，我们需要弄清楚：是什么决定（图像中）该点的亮度。

2.1.1 透视投影(广角镜头)

所谓透视投影：图像的每个点都对应一个方向：即从一个点出发，穿过小孔的一条射线。光线沿这个射线传播，进行成像。
数学表达
[ x ˊ f ˊ , y ˊ f ˊ ] T = [ x z , y z ] T [{\acute{x}\over \acute{f}} ,{\acute{y}\over \acute{f}} ]^{T}= [{x\over z} , {y\over z} ]^{T} [fˊxˊ,fˊyˊ]T=[zx,zy]T

2.2.2 正射投影(望远镜)

所谓正射投影：光线沿平行于光轴的方向传播，从而进行成像
数学表达：
[ x ˊ , y ˊ ] T = [ m x , m y ] T [\acute{x} ,\acute{y} ]^{T}= [mx ,my]^{T} [xˊ,yˊ]T=[mx,my]T
放大率 m = f ˊ / ( − z ) m=\acute{f}/(-z) m=fˊ/(−z)
景深：场景的深度。
景深的变化：场景的深度范围。即场景中可见物体表面所形成的曲面到相机的距离范围。
如果相对于场景到相机的平均距离来说，景深的变化很小时；透视投影和正射投影差别也很小。
焦距越长，视野越小。

2.2 亮度

图像亮度：与射入像平面的能流有关。
图像亮度可以用辐照强度来度量：照射到物体表面单位面积上的光的强度。单位： W / m 2 W/m^2 W/m2
E = δ P δ A E=\frac{\delta P}{\delta A} E=δAδP
场景亮度：与从物体表面发射出的能流有关。
场景亮度可以用辐射强度来度量：单位面积沿着单位立体角所发射出的光的功率。单位 W ⋅ m − 2 ⋅ s r − 1 W\cdot m^{-2}\cdot sr^{-1} W⋅m−2⋅sr−1
L = δ 2 P δ A δ ω L=\frac{\delta^2 P}{\delta A \delta \omega} L=δAδωδ2P
图像辐照强度的测量结果与场景辐射强度成正比。比例系数取决于成像系统的参数。

2.3 透镜

2.4 我们的视觉世界

2.5 图像感知

2.5.1 感知颜色

2.5.2 随机性和噪声

2.5.3 图像量化

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Robot

Vision

机器视觉

机器视觉(Robot Vision)——2 的相关文章

深度学习相关资料总结

近这两年里deep learning技术在图像识别和跟踪等方面有很大的突破是一大研究热点里面涉及的数学理论和应用技术很值得深入研究这里总结一些在微博发布和转载的相关资料以便查阅一 winsty NIPS2013 Learning
HyperLPR车牌识别技术算法之车牌粗定位与训练

关于HyperLPR HyperLPR是一个使用深度学习针对对中文车牌识别的实现与较为流行的开源的EasyPR相比它的检测速度和鲁棒性和多场景的适应性都要好于目前开源的EasyPR HyperLPR可以识别多种中文车牌包括白牌新能源车
YUV学习，详解

YUV 格式详解只看这一篇就够了分类标准首先我们可以将YUV格式按照数据大小分为三个格式 YUV420 YUV422 YUV444 由于人眼对Y的敏感度远超于对u和v的敏感度所以有时候可以多个Y分量共用一组uv 这样既可以极大的节
Convolutional Pose Machine - 卷积姿态网络

Convolutional Pose Machine 卷积姿态网络论文主要解决单人单目 RGB图像姿态估计问题本篇论文也是现在非常火热的openpose开源项目的核心之一这篇来自CMU的论文为单人姿态估计方面研究注入新的思路论文网
Canny边缘检测算法原理及其VC实现详解(一)

目录 1 边缘检测原理及步骤 2 Canny边缘检测算法原理 2 1 对原始图像进行灰度化 2 2 对图像进行高斯滤波 2 3 用一阶偏导的有限差分来计算梯度的幅值和方向 2 4 对梯度幅值进行非极大值抑制 2 5 用双阈值算法检测和连接边
缺陷检测公开数据集大全

一弱监督学习下的工业光学检测 DAGM 2007 数据下载链接 https hci iwr uni heidelberg de node 3616 数据集简介主要针对纹理背景上的杂项缺陷较弱监督的训练数据包含十个数据集前六个为训练
【机器视觉】——裂纹检测笔记

目录传统算法处理裂缝的基本思路第一种思路第二种思路第三种思路 CPP代码 halcon代码 python代码 Matlab代码深度学习缺陷检测裂缝检测文献传统算法处理裂缝的基本思路第一种思路 1 先转换彩色图为灰度图 2 进
知乎上对国内机器视觉行业的发展的讨论-经典

如何看待国内机器视觉行业的发展希望以公司为例盘点最近关注机器人领域图像识别行业感觉国内视觉公司对工业自动化方向更为关注说说大家对于机器视觉行业发展的看法以及给研发人员职业规划的建议添加评论分享按投票排序按时间排序 8 个
FFT频谱分析原理

FFT频谱分析原理采样定理采样频率要大于信号频率的两倍 N个采样点经过FFT变换后得到N个点的以复数形式记录的FFT结果假设采样频率为Fs 采样点数为N 那么FFT运算的结果就是N个复数或N个点每一个复数就对应着一个频率值以及该频
机器视觉及其应用发展

导读一机器视觉的研究和发展动态机器视觉的研究发展和应用还远没有达到成熟的程度机器视觉从诞生到今天才只有短短的三十多年时间在机器视觉中承担大脑作用的图像分析处理图像理解和模式识别理论和技术基础还非常不完善甚至机器视觉的图
拉普拉斯的原理

拉普拉斯是一种二阶导数算子是一个与方向无关的各向同性旋转轴对称边缘检测算子若只关心边缘点的位置而不顾其周围的实际灰度差时一般选择该算子进行检测拉普拉斯算子为二阶差分其方向信息丢失常产生双像素对噪声有双倍加强作用因此它很少
相机曝光与增益

曝光和增益是直接控制传感器 CCD CMOS 上读出来的数据是要优先调节的以调节曝光时间为主不过曝的前提下增加曝光时间可以增加信噪比使图像清晰软件上有个选项可以把过曝的区域显示出来当然对于很弱的信号曝光也不能无限增加
【机器视觉学习笔记】大津法/Otsu最大类间方差法最佳阈值处理（C++）

目录概念 C 源码 OtsuThreshold 主函数效果完整源码平台 Windows 10 20H2 Visual Studio 2015 OpenCV 4 5 3 本文所用源码修改自C opencv 图片二值化最佳阈值确定大津
使用Matlab相机标定库（Camera Calibration Toolbox）问题小记

使用Matlab相机标定库 Camera Calibration Toolbox 问题小记 Camera Calibration Toolbox的官方网站 http www vision caltech edu bouguetj calib
施努卡：基于深度学习的裂缝检测技术

不同于传统的裂缝检测方法基于深度学习的检测方法不需要人工干预能自主学习有代表性的特征直接对输入图像的裂缝进行检测随着深度学习方法在许多应用场景中取得了很好的检测结果国内众多研究人员也开始把基于深度学习的目标检测模型和语义分割模型用
机器视觉基础

机器视觉基础什么是机器视觉机器视觉常见的应用机器视觉常用的概念硬件选型控制器相机镜头附件选型什么是机器视觉机器视觉常见的应用机器视觉常用的概念快门时间越短图片越暗淡光圈小了照片会暗淡硬件选型的时候考虑物距 W
CV 经典主干网络 (Backbone) 系列: CSP-Darknet53

CSP Darknet53 0 引言 1 网络结构图 1 1 输入部分 1 2 CSP部分结构 1 3 输出部分 2 代码实现 2 1 代码整体实现 2 2 代码各个阶段实现 3 代码测试 4 结论 0 引言 CSP Darknet53无论
MAttNet

PyTorch Implementation of MAttNet Introduction This repository is Pytorch implementation of MAttNet Modular Attention Ne
Android Vision Api - 条码检测如何获取条码类型？

我正在使用 AndroidGoogle Vision API 并创建了一个标准条形码阅读器但我想检测读取什么类型格式的条形码 i e CODE 39 CODE 128 QR Code ETC 有没有办法返回类型 Thanks 因为我没有
人眼注视检测：识别用户正在看板上的位置[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在开发一个项目上面有板和相机目标是识别正在看黑板的学生并确定他们视线的位置在黑板上目前我计划从以下几个方面来应对挑

随机推荐

LED高效恒流驱动电源的设计指导书

参考链接 LED高效恒流驱动电源的设计指导书 LED灯驱动电源设计 LED恒流驱动电路精 LED恒流驱动电路 led灯驱动电源电路图 led灯的驱动原理电路图方案详解 KIA MOS管一 LED驱动电源原理 1 由于LED的光特性通常都
恒流源驱动电路随笔一

方案一参考论文 LED光源驱动电路研究华科硕士 08 06 采用恒流源控制的原因 1 LED的PN结的温度系数为负温度升高时LED的势垒电势降低由于这个特点所以LED不能直接用电压源供电必须采用限流措施否则LED随着工作时温
恒流源驱动电路随笔二

参考论文 LED的驱动电路研究大理硕士 07 06 三个简单方案电荷泵驱动的典型电路 CAT3604是一个工作在1x 1 5x分数模式下的电荷泵可调节每只LED白光管脚 xff08 共4只LED管脚 xff09 的电流使背光的亮度
gcc编译c文件常用命令参数解释

gcc编译c文件 gcc是常用来编译c语言程序的编译器 xff0c 了解它编译c语言的命令参数 xff0c 对c c 43 43 语言的学习是有一定好处的 gcc编译文件一步到位的命令格式 gcc main c o main exe 设置了
恒流源驱动电路随笔三

参考论文一 LED蓝绿光黄疸光疗系统的研究与设计天工硕士 15 12 AMC7150是一种仅需 xff15 个外部零件的高功率LED驱动IC AMC7150内建P xff37 xff2d 和功率晶体管 xff0c 工作频率可达200kH
光源系统厂商、结构

参考论文基于PWM的LED机器视觉光源技术的研究哈工大硕士 span class token number 2009 span fpga 前言机器视觉系统包括 xff1a 照明镜头相机图像采集卡视觉处理器 led光源分为两大
LED驱动IC厂家

厂家芯片类别世微半导体英飞凌Infineon 壹芯半导体科技 xff08 深圳 xff09 有限公司欧司朗OSRAM xff1a 汽车照明深圳天微电子有限公司中铭电子深圳市华芯光电有限公司宁波欧特电子科技有限公司芯片介绍 l
2D/3D模板匹配

2D 对象正交视图物体的组成部分之间的角度和距离可以改变 xff0c 不需要缩放需要缩放存在遮挡杂乱或颜色物体的特征是具有特定的纹理 xff0c 而不是清晰可见的轮廓图像高度散焦对象变化显著期望物体轮廓的局部变形 xff0
linux基础操作之三

文章目录 10 命令执行顺序控制与管道命令执行顺序的控制1 顺序执行多条命令2 有选择的执行命令管道3 1 试用3 2 cut 命令 xff0c 打印每一行的某一字段3 3 grep 命令 xff0c 在文本中或 stdin 中查找匹配字
2020华为软挑总结——baseline

span class token macro property span class token directive keyword include span span class token string lt bits stdc 43
2020华为软挑总结——复赛方案一code

span class token macro property span class token directive keyword include span span class token string lt iostream gt s
2020华为软挑总结——方案二code

span class token macro property span class token directive keyword include span span class token string lt iostream gt s
机器视觉照明技术与装置实验研究（论文纪要）

参考文献机器视觉照明技术与装置实验研究中原硕士 2016 有用摘要图片质量很大程度上是由目标周围的照明环境和目标物体表面材质物体摆放位置所决定的 1 首先 xff0c 对照明系统主要技术进行了研究研究内容包括光源的参数与选择
Affine Transformations(仿射变换)

英文版原文链接先修教程 xff1a Remapping 重映射下一教程 xff1a Histogram Equalization 直方图均衡化文章目录结果目标原理什么是仿射变换我们如何得到一个仿射变换代码这个程序是做什么的代码
Linux 网桥功能使用

Linux 网桥功能使用网桥是在数据链路层 xff0c 将两个LAN连接起来 xff0c 根据MAC地质来转发帧 xff0c 可以看作是低层的路由器安装网桥配置工具检测系统中是否有有bridge 工具 xff1a rpm qa gre
Remapping(重映射)

英文版原文链接上一教程 xff1a Hough Circle Transform Hough圆变换下一教程 xff1a Affine Transformations 仿射变换文章目录结果目标原理什么是重映射 xff1f 代码这个程序
机器视觉(Robot Vision)——1

参考书籍 Robot Vision MIT机器视觉课程指定教材机器视觉探究两个基本问题 xff1a 成像过程的基本原理是什么 xff1f 如何探索对成像过程求逆的基本知识和方法所谓求逆 xff1a 具体来说 xff0c 就是从一张
机器视觉实验架套装选型

文章目录 0 机器视觉集成商0 1 上海热驰自动化1 海康威视2 集云誉创3 深圳新次元4 机器视觉光源控制器厂5 恒视科技6 小厂商6 机器视觉检测配套商 0 机器视觉集成商购买链接基础款 xff1a 580 970 加强款 xff1
meiqua / shape_based_matching（issue记录）

文章目录 readmeissue 1 如何加快responsemap的创建 issue 2 请问一下是否抗缩放呢 xff1f issue 3 匹配准确定位精度还能再提高吗 xff1f branch有些多了 xff0c 能否写个文档介绍一下各
机器视觉(Robot Vision)——2

参考书籍 Robot Vision MIT机器视觉课程指定教材机器视觉探究两个基本问题 xff1a 成像过程的基本原理是什么 xff1f 如何探索对成像过程求逆的基本知识和方法所谓求逆 xff1a 具体来说 xff0c 就是从一张

机器视觉(Robot Vision)——2

文章目录

第2章 成像与图像检测(感知 sensing)

2.1 成像的两个方面

2.1.1 透视投影(广角镜头)

2.2.2 正射投影(望远镜)

2.2 亮度

2.3 透镜

2.4 我们的视觉世界

2.5 图像感知

2.5.1 感知颜色

2.5.2 随机性和噪声

2.5.3 图像量化

机器视觉(Robot Vision)——2 的相关文章

随机推荐

热门标签

第2章成像与图像检测(感知 sensing)