做一个数智人,现在你只需要3分钟视频和100句短语(2)
2023-05-01 来源:飞速影视
一、从数字人到数智人,腾讯数字人在口播等多领域应用
据腾讯云智能数智人产品总经理陈磊透露,从2016年开始,腾讯就已经开始接触对话式AI,也就是早期的数字人。2018年,腾讯正式投入数智人研发和服务,成为国内最早投入数字人领域的企业之一,目前腾讯已发布数百篇相关技术顶会、期刊论文、专利近百份。
数智人的发展阶段一共分为三个阶段,离线阶段、在线阶段、在场阶段。
在场阶段,数智人在生产效率和生产效能大幅提升。从三年前的百万级价格,到如今的千元级,数智人的成本正在迅速下降,数智人也开始走向更广泛商用市场,“普惠化”、“场景化”趋势明显。
腾讯云智能还提出自动化“AI 数智人工厂”,提供让企业开箱即可以直接使用的数智人生产服务。该数智人工厂依托于腾讯云TI平台,内置超过10项AI算法能力。
未来,无需任何算法、研发经验,企业只要在平台导入视频、语音训练素材,即可通过“自助式”服务,完成大批量数智人形象、音色定制。
目前,已经有数十家合作伙伴依托平台,向行业提供数智人直播SaaS、知识口播SaaS应用,覆盖医疗、传媒、金融多个行业。
“腾讯和其他相比,更懂行业内的市场需求。”在陈磊看来,未来人们可以在腾讯云上传自己的照片,然后选择下一个虚拟数智人的订单,在一天内就可以获得自己的数智人。
二、以“小样本”见“大模型”,揭开小样本打造数字人背后的AI黑科技
腾讯优图实验室研究总监汪铖杰认为目前数智人服务的问题主要聚焦在两大方面:如何将数智人做的更高效,以及如何将数智人做得更逼真。
比如说,想要虚拟数智人更加逼真,要考虑如何将此前的产品变得更加标准化和流程化,离不开人像编辑生成、人像3D技术、生成辅助技术等多样的AI技术帮助。
他觉得2D小样本技术的背后是3D技术。“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通过3D人脸结构的先验信息引入,使数智人口型、表情更到位。”
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号