资源预览内容
第1页 / 共82页
第2页 / 共82页
第3页 / 共82页
第4页 / 共82页
第5页 / 共82页
第6页 / 共82页
第7页 / 共82页
第8页 / 共82页
第9页 / 共82页
第10页 / 共82页
亲,该文档总共82页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一章 绪 论1.1 概述 人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性,因而发明和创造了许多机器来辅助或代替人类完成任务。智能机器或智能机器人是这种机器最理想的模式。智能机器 能模拟人类的功能、能感知外部世界,有效解决问题。人类感知外部世界:视觉、听觉、嗅觉、味觉、触觉 眼 耳 鼻 舌 身所以对于智能机器,赋予人类视觉功能极其重要。机器视觉:用计算机来模拟生物(外显或宏观)视觉功能的科学和技术。机器视觉目标:用图像创建或恢复现实世界模型,然后认知现实世界。1.2 机器视觉的研究内容 1 输入设备 成像设备:摄像机、红外线、激光、超声波、X射线、CCD、数字扫描仪、超声成像、CT等 数字化设备 2 低层视觉(预处理):对输入的 原始图像进行处理(滤波、增强、边缘检测),提取角点、边缘、线条色彩等特征。 3 中层视觉:恢复场景的深度、表面法线,通过立体视觉、运动估计、明暗特征、纹理分析。系统标定 4 高层视觉:在以物体为中心的坐标系中,恢复物体的完整三维图,识别三维物体,并确定物体的位置和方向。 5 体系结构:根据系统模型(非具体的事例)来研究系统的结构。(某时期的建筑风格据此风格设计的具体建筑)1.3 机器视觉的应用 工业检测文件处理,毫微米技术多媒体数据库。 许多人类视觉无法感知的场合,精确定量感知,危险场景,不可见物感知等机器视觉更显其优越十足。1 零件识别与定位 生产线 机器人足球赛2 产品检验 外形、表面、装配位置、超声探测内部裂纹和气孔3 移动机器人 双目识别恢复场景。无人驾驶汽车4 遥感图像分析 航空摄影、气象卫星、资源卫星 航空摄影:利用普通摄影机航拍。制图、制导用气象卫星:红外成像、气象云图海洋资源:合成孔径雷达,获取海辰形象。找矿农作物调查,自然灾害测报,生态环境检测。5 医学图像分析 X射线、CT(Computer Tomography)、核磁共振MRI(magnetic resonance imaging ),超声成像。 作用:(1)图像增强、标记、染色距离X力量速度(有效作用力) (2)专家系统,自动研制6 安全鉴别、监视跟踪 车辆识别、车牌号识别 人脸、眼底、指纹、表情7 其他 体育运动分析:游泳 制衣(人体扫描) 影视制作1.4 人类视觉简介1 人眼所能看到的光谱范围,只是电磁波辐射范围的很小的一部分,为380nm780nm,可见光谱红外780紫 蓝 青 绿 黄 橙 红380紫外2 人眼的构造 角膜占表面的1/6具有屈光作用 晶状体、玻璃体等都有屈光作用 视网膜:杆状细胞(暗)玻璃体晶状体(调焦)视网膜虹膜瞳孔 锥状细胞(明)3 视觉信息处理(1) 亮度 (2) 形状(3)运动(4)颜色(5)深度感(6)通道(7)并行人眼对运动物体特别敏感锥状细胞有三种,分别对430、540、570,敏感,构成了三基色原理的基础。深度感 因视差而产生视觉过程:A1C2B2A2CBA光刺激视网膜接收光路光路视网膜接收视觉通道大脑皮层处理1存储参考图像2信息处理3特征提取4决策5描述响应(1)视觉的时间特性 视觉在时间上有累积效应 对一般的物体进行观察时,接收光的总能量E与物体可见面积、表面宽度L和时间距(观察时间长度)T成正比。另外:人对光的感觉有潜伏期,多次闪光会导致闪烁的知觉。降龙十八章(2)视觉的空间特性 小而弱的光点单独呈现时可能看不见,但当多个连在一起作为一个大的光点时同时呈现时便能看见了。视觉度表示人所能看到景物细节的准确性。认知解像觉察定位觉察:检测在视野中的某个给定物体是否存在定位:对两物体相对位置精确辨别的能力解像:对一视觉形状各组成部分之间距离的辨别能力认知:综合的能力和方法,包括明度识别,一定的解像力和定位能力。(3)形状知觉:轮廓、图形、背景轮廓:轮廓把物体与视野中的其它部分区分开来,轮廓不等于形状。轮廓只是边界,是局部概念,而形状则是全体概念。主观轮廓:主观轮廓产生的必要条件是有些不完整的因素出现将它完整起来就有一种把它变成简单和稳定正规图案的倾向。(4)视觉的相对性视觉感知的结果不仅仅取决于刺激本身,还与经验对比有关系。(早晨、中午的太阳哪个更近)前景与背景:前景:视觉关心的主体。背景则是与前景相关联的其它刺激视觉知觉的对比:(1)前景和背景可相互置换 (2)前景受背景的影响(5)视觉的选择性听而不闻视而不见。依赖先验知识而取向。(6)视觉的整体性对部分感知之和而产生的一种整体知觉经验(7)视觉的恒常性亮度恒常性:黑布、白布各自一半在阳光下,一半在阴影中,我们仍然能够判定它为黑布白布。大小恒常性:物体在视网膜上的象随距离而变化,但我们的感觉则并不是大小的变化而是距离的变化。(感觉到远方的牛仍然比近处的狗大)形状恒常性:直线投影为一点,通过经验加以矫正颜色恒常性:在相当宽的光明变化条件中,能够感受到颜色的恒常。(8)视觉的组织性 相似性 接近性三列点列四行点列按列按行封闭性封闭轮廓更容易够成图形。连续性一条直线和曲线的多次交汇,心理上倾向于连续。(9)错视现象高度长度平行大小主从错觉 马赫带Hering方格错觉(10)眼球微动现象1.5 颜色和知觉牛顿用三棱镜研究白光的折射,就此便发现白光可被分解成一系列从紫到红的连续光谱。从而证明白光是由不同颜色的光线相混合而形成的,而这些光实际上是不同频率的电磁波。 (1)无颜色 白 灰 黑 黑白系列颜色 (2)有颜色 除黑白系列之外的各种颜色色觉的产生: 光源的光 反射或透射 视网膜 人脑解释物体均匀的反射各种光 白色物体只反射某种或某几种颜色 彩色CIE 国际明度委员会 R:700nm (570) G:546.1nm(540) 光的三基色 B:435.8nm(430) 二基色叠加形成三补色颜料的三基色正是光的三补色。人眼的锥状细胞有三种,分别对 430,540,570光谱敏感。设三种刺激量分别为:X、 Y、 Z 则: ,为刺激量的比例系数,称为色系数。可见:x+y+z=1CIE1931色度图 三色比例系数x、y、z均大于零。 Y的数值正好是彩色光亮度。 x=y=z 表示标准白光。这样: 每一点对应一种颜色。 色度图边界上二点代表纯颜色。 连接两端点直线上的点可由二端点颜色合成。 3端点三角形内的颜色可由三端点颜色合成。 3基色不能组合出所有的颜色。补色律:两个以适当比例混合能得到白色或灰色的颜色,互称为补色。中间色律:两个非补色混合,便产生一个新的中间色或混合色,色调的混合比例确定。代替律:如颜色 X+YB ,A+BC 则有 A +X +Y C 颜色模型 RGB模型 (面向显示器、打印机等硬设备) 规划为单位正方体 则所有RGB的值在0,1 R = 700 nm G =546.1 nm B =435.8 nm 根据不同需要提出了:RGB、CMY、XYZ、 YIQ、HSV(HIS) 标准白色的RGB光通量、为: : = 1:4.5907:0.0601 这样把光通量为1Lm的红色,4.5079流明的绿光,0.0601流明的蓝光作为三基色的单位基色量。这样某彩色光通量(C)= R(R)+G(G)+B(B)(C)表示光的明亮程度,其色度只取决于R、G、B之间的比例关系。合 , , r、g、b为色度坐标,r + g + b = 1 CMY 各种光也都可以用CMY三基色混合而成。 RGB,由黑 白,增色过程。 CMY,由白 黑,减色过程。 (绘图,打印机)颜料。 YIQ 保证彩色电视和黑白电视的兼容。NTSC(国际电视系统)协会。 Y对应于XYZ中的Y,为亮度信息。 选择三色的基色量为R=0.299, G=0.587, B=0.114 Y=0.299R+0.587G+0.114B 规定: I =0.74(RY)0.27(BY) Q=0.48(RY)+ 0.41(BY) 综合有: 这里RGB为NTSC制式RGB HIS模型 H :色调。混合光谱中的主要波长。 S : 饱和度。一定色调的纯度。纯光谱色是 完全饱和,加入反光饱和度逐渐减小。 I: 密度、亮度(与反射率成正比)RGB到HIS转换 HIS转到RGB 0,120 发光强度定义:光源的单色光,在指定方向辐射强度为1.6 光度学光度学:研究光的强弱的学科。(Photometry)当光源足够小,或足
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号