仿制人眼,相当于仿制了人类的整个大脑?(10)
2023-04-29 来源:飞速影视
这是猴子的大脑构造,就是它的视觉皮层,也就是枕叶这个地方还有几个区,比如V1、V2、V3、V4,其实还有V5没画出来,还有MT这些特征。
我们可以逐步给这些特征分类,比如V1就是做边缘的,做视差计算的。在V2这里,局部的纹理,边界界定,相对视差等。
其实这些功能,我们在视觉领域搞视觉研究或者图像处理的人,已经有类似的可以匹配的地方,叫做特征线的提取与匹配。
当空间上的一个图像进来后,有一种特征点和特征线的抽取方式,因为点和线的特征比较强烈,所以它很稳定。
我在不同角度都能看得到,就能抽得出来,这样有什么效果?
我根据空间上的这些点,就能反算出自己的位置,反算出自己的坐标。
所以可以根据右面那些空间的特征点、特征线,反算出自己摄像机的位置,这个摄像机是怎么走的、轨道是怎么样的就出来了。
当然轨道生成是另一方面,至少特征点、特征线,应该是在枕叶最基础的V1领域做的。V1领域和V2领域还有别的特征,比如边缘的抽出。
下面就是上面这张图的边缘抽出。
同时它还有远近测量的功能,把空间所有点的深度距离算出来,叫视差图或深度图。
红的是近,蓝的远,然后再把它的颜色贴上,就是三维图了。
在计算机的坐标上,每个点是三维的,再走到V2这一块,可以看到上面的V2是局部纹理、边界界定、相对视差等。
我们在图像处理上就叫做语义识别,也就是把空间的各个东西都分离出来,墙是墙,地面是地面,门是门,然后它再把语义分离出来。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号