无人车的眼睛、UP主的生产力工具,都藏在百度CVPR的这十个冠军里(6)
2023-04-29 来源:飞速影视
为了解决这些难题,百度研究院图文转视频 VidPress 团队设计了一个两阶段的系统:首先让特征提取器提取足球视频特征,再将提取出的特征作为第二阶段具体任务模块的输入,进行事件定位或者回放溯源。其中,事件定位和回放溯源阶段采用了 Transformer 架构。该架构在两个任务中体现了对视觉语义特征的精确的时序处理能力,优于基线算法中 Siamese 网络的学习能力和训练速度。
基于 SoccerNet-v2 挑战赛拿下双料冠军的 AI 技术能力,百度已支持开头提到的自定义足球精彩集锦生成、足球图文战报一键转换视频等应用工具。这项技术能力也已基于智能创作平台进行落地。
PaddleCV:优秀方案都到碗里来
作为中国人工智能的「头雁」,百度的计算机视觉方向技术研究早在十一年前成立多媒体部时就已经开始了。这帮助百度积累了全方位的技术能力,也为飞桨视觉模型库 PaddleCV 提供了强大的核心动力。
PaddleCV 中,既包含经过产业实践长期打磨的主流模型,也包含百度在国际竞赛中的夺冠模型。在 CVPR 2021 的一场技术分享中,百度资深算法工程师为参会者详细分享了 PaddleCV 的技术报告。PaddleCV 作为飞桨重点研发的视觉模型库,为开发者提供了面向图像分类(PaddleClas)、目标检测(PaddleDetection)、图像分割(PaddleSeg)、文本识别(PaddleOCR)、图像生成(PaddleGAN)等视觉场景的多种端到端开发套件和海量视觉方向模型,其中 PaddleOCR 和 PaddleDetection 开发套件更是在能源、金融、工业、农业能众多领域被企业广泛使用。本届 CVPR 各项比赛结束后,部分成果也将在 PaddleCV 中开源。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号