知名百科  > 所属分类  >  科技百科    百科词条   

图像识别

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。 现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域 。

图像识别图像识别

图像的传统识别流程分为四个步骤:图像采集→图像预处理→特征提取→图像识别。图像识别软件国外代表的有康耐视等,国内代表的有图智能、海深科技等。另外在地理学中指将遥感图像进行分类的技术。

目录

基本介绍 编辑本段

如何识别人脸?识别人脸的方法有很多,最常用的是图像识别。例如,人脸图像从背景中提取信息,通过将面部与背景进行对比来确定是否为同一人。有很多图像识别方法是需要在多张图像中寻找特征点来进行识别,但是因为图像所处的环境不同,所以其识别过程也是不一样的。

一、特征提取

特征提取是指将待识别人脸图像进行分割,并在分割之后,将其分为几个部分。在特征提取过程中,需要考虑目标的具体特征,比如是否具有人脸特征、是否具有人脸的纹理特征等。在提取特征的过程中,需要对不同的目标设置不同的阈值,以达到不同的目的。阈值设置的越低,对人脸的影响越小;阈值设置的越高,对人脸的影响越大。当目标不具有人脸特征时,阈值设置为低;当目标具有人脸特征时,阈值设置为高。人脸特征提取过程中要注意以下几点:提取目标的人脸特征,必须考虑目标所处环境变化以及与背景图像等效的影响;提取人脸的纹理特征不能是孤立的,必须注意对面部进行多尺度化处理;提取目标特征必须考虑影响阈值设置的因素;提取目标的纹理特征后需要将其与背景图像进行比较;将所有的图像处理方法结合起来使用以提高特征识别效率而非降低识别结果;从多尺度化效果上考虑提取特征效果影响阈值设置等。

1、人脸特征

人脸特征是通过利用不同的算法来提取人脸的图像特征,在提取人脸特征时,首先要解决的问题是目标的轮廓特征以及面部五官特征。目前比较常用的人脸特征有三种,分别是最小二乘(Loss Vector)、 Logistic Synthetic Device以及 Perception Synthetic Device。在这些提取法中, LSD是基于最小二乘模型而设计的一个二分算法,该模型用三种不同大小的均方误差作为滤波器,再将三种不同大小的均方误差乘以一个固定值作为输出函数,最后用一个固定值作为该滤波器的初始参数。LSD自定义参数有很多,目前常用如 RMSE、 RMSE等函数。在所有选择 RMSE作为特征值时,最小二乘(Logistic Synthetic Device)是非常重要的指标之一,其数值越大说明对目标越有价值;反之则可认为是一个负值,通常由梯度消失、梯度消除、平均曲率等方法构成,因此从梯度消失中能够判断出这个人是否具有生物相似性。

2、纹理特征

纹理特征是对人脸图像的分割,主要包含了两个方面的特征:即不同深度下的纹理信息;不同亮度下的纹理信息。通过纹理特征能够对待识别的目标进行很好的分割。纹理特征主要包含纹理值、纹理空间等三个方面。对两种不同深度下的纹理分量进行研究,将两种不同深度下的纹理分量进行了比较,可以发现,纹理参数对纹理特征的影响是比较大的。对于含有纹理的图像,需要先对其进行预处理,然后再利用上述三个参数对其进行分析,这样才能获得更加准确的纹理值。

3、人脸检测

人脸检测是在计算机视觉中进行的一种简单、快速、高效的特征识别方式。其检测方式包括了最大似然理论、最小似然理论等。为了进行图像分类,人们需要对图像进行比较。人们对计算机视觉领域研究较多的是应用最大似然理论进行面部识别,而对图像进行分类的最重要手段是最小似然理论。

图像特征提取 编辑本段

首先通过图像处理软件对图像进行预处理,然后利用特征提取算法对图像进行特征提取,出人脸特征点,用函数将图像分割为若干个特征部分。图像分割的目的是使图像中各部分不相干,并使识别结果更加接近于实际图像。人脸分割的原理是用图像分割技术来提取人脸图像中各个部分的特征,然后根据各特征进行计算,最后将计算所得的结果与特征点进行比较,将两个相似的特征点进行比较,从而确定人脸是否为同一人:特征点最少必须与相似特征点相吻合;其次是图像中不相干部位特征点的提取;最后便是在特征点旁边一定范围内的点来作为特征信息进行提取。这种方法可以达到快速快捷、结果准确的目的,但是它只能在人脸特征点比较密集的情况下才能有效地使用,对于一些较大数量或者形状较复杂的人脸特征点就不能使用此方法来进行识别。而且当人脸出现明显变化时,还会影响识别进度会导致识别结果有一定损失,这也是采用人脸分析方法来辅助人脸识别的缺点。

1、人脸识别方法的分类

人脸识别方法主要分为以下几类:第一类是基于规则和几何结构的人脸识别方法,包括人脸检测算法、人脸特征点检测算法、脸部识别数据处理算法等。第二类属于基于特征和时间序列的人脸模型识别法,主要包括基于面部图像的各种特征提取算法、脸部特征提取算法和模型搜索等。第三类属于视觉和非视觉人脸识别方法,包括图像处理方法、计算机辅助设计和人工智能等。第四类是支持向量机预测应用软件。这类方法具有强大的鲁棒性,在一定程度上也是对图像处理和支持向量机算法进行优化的一种重要方法。但是它只能对人脸进行定性研究,没有明确的算法,同时它存在着明显的局限性,这使得人脸识别在实际应用中遇到了许多问题。

2、特征提取与分析

由于人脸的形状复杂,很多特征点的数量很多,所以,对于该问题,我们首先要利用数学分析中的线性回归和梯度下降法对其特征进行提取和分析。对于这些性质不同的特征,使用线性回归或梯度下降法是不能有效地将其作为识别人脸的依据。而且对梯度下降法进行分析时,必须将梯度下降函数设为阈值,这对梯度值有一定的要求。梯度下降法采用的是梯度图构造法,通过图可以看出梯度变化对图像有影响,因此这种梯度法适合对图像有显著影响的数据。梯度下降法计算速度比较快,在某些情况下还可以提高识别率,但梯度下降法需用到大量数据,而且对某些需要特殊处理后才能得到更好数据的情况是无法满足实际要求的。因此采用梯度下降法提取人脸特征会大大降低该方法所需耗费的时间以及计算复杂程度。

人脸特征提取 编辑本段

人脸识别技术一般需要将人脸图像转换成特定图像,通过识别对图像中人物脸部的提取来确定人脸。首先,对人脸图像的处理,对图像进行预处理,使其含有一些信息。然后,根据人脸与背景相似程度,利用人脸的不同方向和角度将人脸分割成若干个区域,使其具有相似的特征,如直角面点,圆弧面点等。最后,将人脸图像分割后,在适当的位置与背景图像进行对比,就可以得到人脸特征了。在实际应用中,这种方法既能将人脸检测到,又能将其提取出来,且识别率很高。在图像提取中,通常通过三种方法进行分析:首先,基于背景分析法,在图像中加入背景信息;其次是基于特征提取法,先将人脸图像预处理,将图像映射到背景图像中;最后一种方法是利用图像的不同角度提取人脸特征。

1、背景分析法

背景分析法是将背景看成是人脸图像的背景,以得到该人脸图像中的信息,是一种最简单的方法。该方法不需要进行人脸图像预处理,只要用灰度图像中相同色调的颜色图像和亮度相同强度的灰度图像作为背景,就可以得到该人脸的信息。但背景分析方法存在着一定的局限性,它不能很好地保留背景信息,在实际应用中一般用该方法将人脸提取出来。背景分析法对人脸有很强的针对性,所以它是非常实用的一种方法。其优点在于:首先需要提取较多信息,并且需要对背景颜色有较高的要求;其次,由于每个人脸上最小特征为5×5,因而其背景与该图像中每个人脸上最小特征相比具有很高相似性;最后,该方法由于可以与其它特征结合使用,所以应用范围很广。

2、特征提取法

特征提取法又称图像处理特征提取法,是指在对人脸图像进行预处理时,首先利用具有相似特征的图像提取其形状或颜色、纹理特征,然后再对图像特征进行人工处理(如去除面部皱纹、阴影等),使其具有相似程度。在使用这一方法时,可以通过训练样本进行预处理,从而将样本分成两组,一组样本采用一元的像素,另一组样本采用四元的像素,最后将样本进行归一化处理,得到一个具有相关特征的图像。但该方法不能完全反映出人物面部的真实面部情况,所以在实际应用中需根据人脸的面部分布特征来决定其提取方式。该方法主要由三部分组成:首先是对图像的预处理;其次是对样本空间进行分割;最后是对特征值进行计算。此外,对于不同颜色、纹理、几何特征等不同种类特征值,应通过对所对应对象进行识别选择其最为合适或最具代表性特征进行描述分析以供识别与检测人员使用。

智能领域 编辑本段

图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。

为了解决模板匹配模型存在的问题,格式塔心理学家又提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。这种模型从神经上和记忆探寻的过程上来看,都比模板匹配模型更适宜,而且还能说明对一些不规则的,但某些方面与原型相似的图像的识别。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。

一般工业使用中,采用工业相机拍摄图片,然后利用软件根据图片灰阶差做处理后识别出有用信息,图像识别软件国外代表的有康耐视等,国内代表的有图智能等。

在人工智能中图像识别技术具有智能化、便捷化以及实用性的优势,为人们的生活与工作带来极大的便利。

研究现状 编辑本段

图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别, 应用非常广泛。

数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差,一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。

图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术,自20世纪70年代,其研究已经有几十年的历史,一直都受到人们的高度重视,至今借助于各种理论提出了数以千计的分割算法,而且这方面的研究仍然在积极地进行着。

现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子,使得边缘检测产生了不少经典算法。但在近二十年间,随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展,有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、 方法和工具,如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 自然语言处理    下一篇 机器学习

标签

同义词

暂无同义词