计算机视觉简史:为了让机器学会“看”,人类到底有多努力(5)
2023-05-03 来源:飞速影视
大发展:卷积神经网络与深度学习
90年代计算机视觉的发展整体比较落寞,因为训练神经网络是一项资源非常密集、并且进展极为缓慢的工作。
一直到2005年之后,才又迎来快速发展阶段。
2006年左右,杰弗里·希尔顿(Geoffrey Hilton)和他的学生首次提出了深度置信网络(DBN)的概念。他给多层神经网络相关的学习方法赋予了一个新名词–“深度学习”(Deep Learning)。
人脑视觉系统的信息处理是分层的。简单来说,就是要先从功能相对低级的区域分辨出朝向、空间位置和运动方向,然后到下一个区域再去处理形状和颜色等信息。
比如当你看《黑客帝国》时,你是先看到一个人朝着镜头走过来,然后才分出这个人的脸型和各种面部特征、穿着的衣服颜色,根据这些信息和你大脑中原有的海量信息做匹配,你就能够判断出来这个正在运动的人是基努里维斯。
所以在大脑中,对一个形象的判别是分层次处理的,并不是一股脑把所有信息交给某个部分,然后它突然得出结论这个人是里维斯。
而深度学习就是借鉴人脑的信息处理过程,对信息进行分层处理,进行特征提取和分类。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类的准确性。
计算机需要学习足够的数据,才能训练出一个能够用于识别的模型。
数据量很重要,对你的大脑也是一样。一个不是特别恰当的例子是,如果你没见过里维斯,你就算看到了这个五官、清晰地分别出头发和瞳孔颜色,也没有办法判断他到底是谁。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号