机器视觉5种三维成像的技术流派
发布日期:2021-01-25 15:29

机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。但由于机器视觉是一门交叉学科,涉及数字图像处理技术、模式识别、自动控制、照明、人机界面等多个领域。因此,很难给机器视觉下一个准确的定义。


制造工程学会(SME)和机器人工业协会(RIA)将机器视觉定义为:机器视觉利用光学和非接触式传感器自动获取和解释真实物体的图像,以获取有用的信息来控制机器的运动或过程控制。


在机器视觉系统中,其基本工作流程为:首先照明光源发出的光照射在被测物体上;然后再通过镜头成像后由相机捕获;随后,由图像采集卡收集并经计算机处理;最后,以预先设计的图像形式显示在计算机屏幕上,如图1所示。在这其中,机器视觉成像系统的成像质量决定了整体机器视觉系统的检测精度,发挥着极为重要的作用。


图1 机器视觉系统工作流程示意图


机器视觉成像的一个重要特点是从图像中获取目标的信息,传统视觉成像主要依赖于2D视觉技术:根据灰度或彩色图像中的像素灰度特征获取目标中物体的纹理、形状、位置、尺寸和方向等信息。但随着当前“智能制造”技术对机器视觉性能的要求逐渐增高,2D视觉技术的局限性愈发明显,迫切需要3D视觉成像技术的发展及应用。


目前,3D视觉成像技术主要依赖于飞行时间法(TOF)、结构光法、立体视觉法、三角测量法和调频连续波(FMCW)法等实现对目标3D信息的感知和收集。


一、TOF法


TOF法的基本工作原理为利用光飞行的时间差来获取物体的深度:探测系统与光源同时启动,发射的光脉冲经目标物体后反射回探测中并由探测系统直接存储往返时间,最后根据时间和光速的关系求得与目标物体之间的距离。


这种测试方法也称为直接TOF法(D-TOF),通常适用于单点测距系统,与扫描技术相结合便可实现3D视觉成像。


图2 PMD公司的工业TOF相机以及基于TOF法的自动导引叉车示意图

图2 PMD公司的工业TOF相机以及基于TOF法的自动导引叉车示意图


TOF成像可用于大视野、远距离、低精度、低成本的3D图像采集。其特点是:检测速度快、视野范围较大、工作距离远、价格便宜,但精度低,易受环境光的干扰。


二、结构光法


结构光投影3D成像目前是机器人3D视觉感知的主要方式,结构光成像系统是由若干个投影仪和相机组成,如图3所示,常用的结构形式有:单投影仪单相机、单投影仪-双相机、单投影仪多相机、单相机-双投影仪和单相机多投影仪等典型结构形式。


图3 基于红外结构光的深度相机:Astra Stereo S U3

图3 基于红外结构光的深度相机:Astra Stereo S U3


结构光投影3D成像的基本工作原理是:利用计算机生成结构光图案或用特殊的光学装置产生结构光,经过光学投影系统投射至被测物体表面,然后采用图像获取设备(如CCD或CMOS相机)采集被物体表面调制后发生变形的结构光图像,利用图像处理算法计算图像中每个像素点与物体轮廓上点的对应关系;最后通过系统结构模型及其标定技术,计算得到被测物体的三维轮廓信息,如图4所示。根据结构光投影次数划分,结构光投影3D成像可以分成单次投影3D成像和多次投影3D成像方法。


图4 结构光投影3D成像的基本工作原理图

图4 结构光投影3D成像的基本工作原理图


其中,单次投影3D成像方法曝光和测量时间短,抗振动性能好,适合机器人实时运动引导和手眼机器人等需要对运动物体进行3D成像的应用。但该方法景深较低,无法在大视场情况下获得较高的垂直空间分辨率。


而多次投影3D成像方法恰能实现较高的空间分辨率,能有效解决目标表面斜率阶跃变化的问题,但也具有相应的不足之处:抗振动性能较差,无法准确的测量连续运动的物体;测量精度对投影仪、相机的环境变化敏感;实时性相对较差。


三、立体视觉法


立体视觉字面意思是用一只眼睛或两只眼睛感知三维结构,一般情况下是指从不同的视点获取两幅或多幅图像重构目标物体3D结构或深度信息。目前立体视觉3D成像方法可以分为单目视觉、双目视觉、多(目)视觉和光场3D成像等,其中最为典型的便是双目立体视觉3D成像。


图5 Intel实感深度摄像头D455示意图及内部结构图

图5  Intel实感深度摄像头D455示意图及内部结构图


双目立体视觉方法是利用两个相机从两个不同的视点对同一个目标物体获得两个视点图像,然后计算两个视点图像的视差以此获得目标物体的3D深度信息,如图6所示,该计算过程一般分为以下四个步骤:图像畸变矫正、立体图像校对、图像配准和三角法重投影视差图计算。


图6 双目立体视觉工作原理示意图

图6 双目立体视觉工作原理示意图


这种双目立体视觉3D成像的方法是被动视觉成像的一种,比较依赖于机接收到的由目标场景产生的光辐射信息,已成功应特定条件下的3D测量场景,但场景应用有限,对场景要求较高,比如:目标场景光辐射动态范围较小且无遮挡、目标物体表面光滑或纹理清晰、几何规则明显等。


四、三角测量法


激光三角测量法已经存在了数十年,且目前仍然被广泛使用,其主要作用是测量目标物体上单个点的准确深度。


其工作原理是利用激光光源、目标物体和相机定义一个空间三角形,并通过确定三者之间的相交角度来计算目标物体单个点的3D坐标信息,如图7所示。在此基础上,将其与线扫描技术和面扫描技术相结合便可实现2D和3D的测量。


图7 三角测量法工作原理示意图

图7  三角测量法工作原理示意图


三角测量法具有非常高的分辨率和测量精度,其分辨率可扩展到毫米及微米级别,但在实际应用中受相机和激光光源横向距离的限制,并且测量时间较长,仅适用于较短的距离的测量。


五、FMCW法


FMCW法也称为相干3D成像法,是通过一系列连续调制(如正弦调制、平方幅度调制等)的出射激光或LED发射探测光,经目标物体反射后,根据发射和接收信号之间的调制幅度的相移来获得物体距离等信息。


相比于TOF法,FMCW法不依赖于光脉冲的飞行之间和发射光的幅度和功率,而是依赖于窄线宽激光器与相干接收器耦合产生的低功率频率啁啾,具有更高的灵敏度、精度和准确度,并且具有较为优异的抗干扰性,但由于确定相移需要更长的测量和积分时间,且由于相移重复回产生距离歧义的问题,因此该方法仅适用于短距离的测量。


图8 SiLC Technologies的“4D + Vision Chip”FMCW激光雷达传感器示意图

图8 SiLC Technologies的“4D + Vision Chip”FMCW激光雷达传感器示意图


总结


随着对机器视觉系统的研究和探索,它已经在制造业生产、日常生活、以及医疗健康等方面扮演者越来越重要的角色,极大地提高了现有的生产力和自动化水平,必将是我国智能制造中亟需发展和研究的项目。


但该系统较为复杂,涉及多个学科的交叉,比如光学成像、图像处理、自动化、控制等。因此必将出现大量的学科交叉问题及瓶颈,而如何在其中探索出高准确性、实时性和强鲁棒性等性能的复合方案将是研究者和应用企业追寻及探索的方向。

关键词:机器视觉 三维成像 技术流派
浏览量:13531
来 源:光电汇
编辑:仪器仪表WXF
声明:凡本网注明"  来源:仪商网"的所有作品,版权均属于仪商网,未经本网授权不得转载、摘编使用。
经本网授权使用,并注明"来源:仪商网"。违反上述声明者,本网将追究其相关法律责任。
本网转载并注明自其它来源的作品,归原版权所有人所有。目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。如有作品的内容、版权以及其它问题的,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
本网转载自其它媒体或授权刊载,如有作品内容、版权以及其它问题的,请联系我们。相关合作、投稿、转载授权等事宜,请联系本网。
QQ:2268148259、3050252122。
展开全文