汇聚全球视觉新闻资讯
你所在的位置:汇视网 > 聚焦 >科技

人机大战之网红脸识别,人类能否一雪前耻?

发布时间:2016-09-05 10:34  来源:汇视网   编辑:叶知秋  阅读量:6906   

本文由 ARinChina(www.arinchina.com)原创,转载请联络 ARinChina(微信 ID:arinchinaservice)

继“围棋”人机大战——以李世石为代表的人类,输给了 Alpha Go 代表的计算机后,人类又提议了“人脸辨认”之人机大战。这一次是诞生于杭州的人脸辨认机器人蚂可,对战“鬼才之眼”王昱珩。

15 年“最强脑袋”中,在同质同量同源的 520 杯水中,王昱珩成功指出评审选中的那杯,并精准说出水杯盘旋了 15 度,中心经人手,从此,“水哥”一战成名。

(腾讯视频)

此次,对上“万变不离其宗”的网红脸,人类能够一雪前耻么?

结果揭穿前,先了解计算机“看人”的套路。

人眼和计算机,都爱好瞄“点”。只可是,人眼在鉴别物体时,常常通过不一样点来推断。而计算机则相反,它找的是一样点。

人机大战之网红脸辨认,人类可否一雪前耻?

通过摄像头“视察”目的,计算机将拍摄到的物体,以图片方式传给计算机,这就是图象辨认过程。淘宝的图片搜索、百度的图片辨认功能,都属于这类应用。

在辨认中时,计算机遇找一些“与众不一样”的点,来和“脑海”中的图片进行配套。这些“佼佼不群”的点,通常被称为“角点”或“关键点”。这些点在图象中具有必定特征,如部分最大或最小灰度(即图象亮度)、某些梯度特征(描写图象灰度变化情形的量)。

人机大战之网红脸辨认,人类可否一雪前耻?

好比人脸上的一颗痣,在计算机辨认时就会被当做参考点。那么计算机是如何找到这些“角点”的?

人机大战之网红脸辨认,人类可否一雪前耻?

角点图

计算机在查找某个像素点时,是遵行逐一查询的规则。为了推断一个点是不是为“角点”,会拔取一个大小适合的窗口(好比 3*3 的窗口),让窗口中心遍历(即顺次拜访)全部图象像素,同时,判定中心点与它的四周点是不是有显著不一样。

所以,当窗口在腻滑区域(图 a),窗口在各方向上移动时,图中三个窗口内部的图象无变化。当窗口在沿边缘方向上移动时(如图 b),三个窗口内图象也是不变的。当窗口在“角点”处时(如图 c),窗口不管朝哪一个方向移动,三个窗口内部图象均不一样,所以推断该点为“角点”。

人机大战之网红脸辨认,人类可否一雪前耻?

不一样的“角点”检测算法应用的窗口不一样,采取圆形窗口检测“角点”的 FAST,和采取 16*16 采样窗口的 SIFT 算子中,是图象特征点检测的两大算法。

“配对”又是怎样一回事?

找到特征点,对它们进行描写后,才能够开始图象配套。描写的大条件是,我们需求利用特征点四周像素的梯度方向散布特征,为每个关键点指定方向。

好比在 SIFT 算子中,将采样点与特征点的相比较方向,通太高斯加权后获得一个 4*4*8 的 128 维特征描写子。

人机大战之网红脸辨认,人类可否一雪前耻?

(一系列加工后,就成了上图这个“鬼模样”)

有了特征点描写子,便能够和模板图的特征点描写子进行比较,得分最高的就是最好配套点。然后对一切特征点进行遍历。

计算机的“人脸辨认”就是基于以上理论。同时,它还会进行一些纵向比较,好比通过图片上五官的散布距离,来进行比较。

所以,结果是?

第一局,从 150 张网红照片中找出 3 人,蚂可胜

第二局,从 300 张网红照片中找出 3 人,“水哥”胜

第三局,从 80 张网红童年照中找出 2 人,“水哥”胜

(腾讯视频)

三局两胜,“水哥”代表的咱人类成功了~ 蚂也许胜一局,说明计算机在图象识其余将来可期,但最后失败,也说明还存在一些问题。

人机大战之网红脸辨认,人类可否一雪前耻?

胜败分析

此次竞赛挑选的辨认对象——网红脸,看上去都是从一个模子里刻出来的,无疑增加了竞赛的难度。

人机大战之网红脸辨认,人类可否一雪前耻?

面临这些一模一样的网红脸,蚂可在辨认近照时髦可,但到了童年照就有点费劲。

蚂可在识他人脸时,部分程序是通过五官之间的距离来推断的。然而,人在少小时五官比较居中,跟随年纪增长会疏散开些,“长开了”。更不需求说,有些网红还进行了“微整”,连亲妈都认不出了,况且是蚂可。

第三局失败情有可原。但为何蚂可还能赢第一局?缘由是快。

假如你细心看上文视频,也许对这句话还有印象:计算机辨认时,先将照片划分为四个区域,再分成几百个关键点。

这是加速图象识其余关键一步,在一切的图象辨认中,几乎都采取了这类方法。图象辨认中有个专业名词来描述,称为“图象金字塔”。

人机大战之网红脸辨认,人类可否一雪前耻?

图象金字塔

图象金字塔起初用于机器视觉和图象紧缩,一幅图象的金字塔是一系列以金字塔外形排列的辨别率慢慢下降的图象聚集。底部是待处置图象的高辨别率表示(上图 G0),而顶部是低辨别率的近似(上图 G3)。当向金字塔的上层移动时,尺寸和辨别率就下降,辨认速度得以提升。(注:辨别率越高,图片越大越明了)

同时,人在竞赛中会遭到外界搅扰,心理用处比较大,但计算机没有。所以“水哥”在开始得胜,也有非专业因素在内。

然而,后面蚂可连输两局,还有更深条理的缘由。

竞赛中,两位选手都需求通过本身移动来辨认图象,这对蚂可是很不利的。缘由是摄像机移动时图象辨认会不稳固,就像我们坐在车中看窗外风景,跟随车速增加,风景越隐约。

同时,现场灯光组给力,反光很强,也会影响蚂可的辨认。

人机大战之网红脸辨认,人类可否一雪前耻?

生活中,当我们背光看屏幕,因为反射光太强会致使看不清屏幕,这时候我们会拉上窗帘或用手遮光,来下降光的反射。而计算机就得对现实环境亮度进行实时检测,依据检测结果对图象亮度阈值进行调整后,再进行比较。

如今,机器对光的调理用处还赶不上人眼的调理,又碰上“水哥”,只能甘拜上风了!

可是,即使此次蚂可败给了“水哥”,但“水哥”只有一个,蚂可还有许多。下一次,我们还会赢么?

题图起源:wzxun

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关搜索热词: