参考书籍 《Robot Vision》 MIT机器视觉课程指定教材
机器视觉探究两个基本问题:
- 成像过程的基本原理是什么?
- 如何探索对成像过程“求逆”的基本知识和方法。
所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。
基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。
- 早期视觉:如何从图像中得到简单的符号描述。
- 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。
文章目录
- 第2章 成像与图像检测(感知 sensing)
- 2.1 成像的两个方面
- 2.1.1 透视投影(广角镜头)
- 2.2.2 正射投影(望远镜)
- 2.2 亮度
- 2.3 透镜
- 2.4 我们的视觉世界
- 2.5 图像感知
- 2.5.1 感知颜色
- 2.5.2 随机性和噪声
- 2.5.3 图像量化
第2章 成像与图像检测(感知 sensing)
- 1、图像是如何生成的?
通过分析从三维世界到二维图像平面的映射过程,我们知道关于成像的两个核心问题:
- 是什么决定:物体表面某一点的像的位置?(图像投影)
- 是什么决定:物体表面所成的像的亮度?(图像辐射)
- 2、所生成的图像是如何被计算机感知的?
- 1)图像传感器的基本原理。
- 2)如何获取和处理不同频带上的信息。
2.1 成像的两个方面
- 图像是一个二维的亮度模式。
首先,我们需要知道:场景中的点和图像上的点之间的几何关系。
然后,我们需要弄清楚:是什么决定(图像中)该点的亮度。
2.1.1 透视投影(广角镜头)
- 所谓透视投影:图像的每个点都对应一个方向:即从一个点出发,穿过小孔的一条射线。光线沿这个射线传播,进行成像。
- 数学表达
[
x
ˊ
f
ˊ
,
y
ˊ
f
ˊ
]
T
=
[
x
z
,
y
z
]
T
[{\acute{x}\over \acute{f}} ,{\acute{y}\over \acute{f}} ]^{T}= [{x\over z} , {y\over z} ]^{T}
[fˊxˊ,fˊyˊ]T=[zx,zy]T
2.2.2 正射投影(望远镜)
- 所谓正射投影:光线沿平行于光轴的方向传播,从而进行成像
- 数学表达:
[
x
ˊ
,
y
ˊ
]
T
=
[
m
x
,
m
y
]
T
[\acute{x} ,\acute{y} ]^{T}= [mx ,my]^{T}
[xˊ,yˊ]T=[mx,my]T
放大率
m
=
f
ˊ
/
(
−
z
)
m=\acute{f}/(-z)
m=fˊ/(−z) - 景深:场景的深度。
- 景深的变化:场景的深度范围。即场景中可见物体表面所形成的曲面到相机的距离范围。
- 如果相对于场景到相机的平均距离来说,景深的变化很小时;透视投影和正射投影差别也很小。
- 焦距越长,视野越小。
2.2 亮度
- 图像亮度:与射入像平面的能流有关。
图像亮度可以用辐照强度来度量:照射到物体表面单位面积上的光的强度。单位:
W
/
m
2
W/m^2
W/m2
E
=
δ
P
δ
A
E=\frac{\delta P}{\delta A}
E=δAδP - 场景亮度:与从物体表面发射出的能流有关。
场景亮度可以用辐射强度来度量:单位面积沿着单位立体角所发射出的光的功率。单位
W
⋅
m
−
2
⋅
s
r
−
1
W\cdot m^{-2}\cdot sr^{-1}
W⋅m−2⋅sr−1
L
=
δ
2
P
δ
A
δ
ω
L=\frac{\delta^2 P}{\delta A \delta \omega}
L=δAδωδ2P - 图像辐照强度的测量结果与场景辐射强度成正比。比例系数取决于成像系统的参数。
2.3 透镜
2.4 我们的视觉世界
2.5 图像感知
2.5.1 感知颜色
2.5.2 随机性和噪声
2.5.3 图像量化
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)