「万字长文」虚拟人漫谈|技术篇(3)
2023-05-20 来源:飞速影视
2)动态
指人的动作,一般来说,人的动态分为三个主要部分:
躯体动作面部表情口型动作这一点对于真人和虚拟人都是比较类似的(虚拟人暂时不涉及动耳朵、动头皮这种高级艺能)。虚拟人的动态主要依靠驱动技术来实现,目前驱动技术主要有真人驱动和AI驱动两种流派。
2. 灵魂
就像电影《心灵奇旅》里演的那样,灵魂也是一个人的重要组成部分。对于虚拟人来说,灵魂主要是通过AI技术来打造的。这里,我把灵魂也分成了几个要素:
1)感知
感知是人最生物性的层面,主要是和我们的五感有关,具体来说就是看、听、说三个部分,分别由眼睛、耳朵、嘴来负责,结合到AI能力,就是CV、ASR、TTS。
2)认知
认知是在感知的基础上进一步形成的思考能力,这里我把认知能力进一步分成两个方面,分别是理性的认知能力和感性的认知能力,其中,理性的认知还可进一步分为知识储备、理解、决策三个层级的能力,对应于AI中的KG、NLP、ML;感性的认知主要指的是利用AI构建的情感识别功能。
3)创造
就像我们小学的时候会先学习汉字,学习造句,再学习写作文一样,创造是更高一级的智力活动,只有在进行过大量的学习之后,才能进行有效的创造,人如此,虚拟人亦如此,虚拟人的创造主要依赖于生成类的AI算法来进行输出。
3. 世界
对于一个人,我们要给他一个世界,一个舞台,这个人才算有了一个全面展示自己的空间,虚拟人亦如此,这个世界就是虚拟人生活的空间。关于世界,这里我也(强行)分成两个要素:
1)渲染
渲染就是让这个虚拟的“人”呈现在我们面前,渲染技术分为离线渲染、实时渲染等,渲染技术的选型会直接影响虚拟人的呈现效果,你看到的是4k还是1080p与它有直接关系,渲染技术很大程度上决定了虚拟人演出的舞台效果。
2)终端
虚拟人没有物质性的实体,目前阶段我们必须借助终端才能看到它,现在可以承载虚拟人终端的设备数量越来越多,移动端、IoT、VRAR等都有大量的空间。在未来,虚拟人技术也有可能真正和实体机器人进行结合,变身成真正几乎“以假乱真”的智能体。
4. 人设
我们总说明星有人设,其实每个人都有人设。人生在世,谁又能时时刻刻保持自己永远都是一个耿直的real boy/real girl呢?我们在面对家人、朋友、同事时,甚至会换上不同的人设。对于虚拟人而言,这也是一样的,而且由于虚拟人现在还比较「笨」,不能像真实的小精灵鬼们一样多种人设无缝切换,因此,对于每一个虚拟人而言,打造一个专有场景的专有人设至关重要。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号