北京科技大学主页平台管理系统张文宇--中文主页-- 面向图像和视频数据的深度语义编码与实时传输方法

已经得到个称赞给我点赞

教师英文名称：Zhangwenyu

职称：副教授

硕士生导师

学科：通信与信息系统

学位：博士

所在单位：智能科学与技术学院

职务：认知计算与智能信息处理系副主任

电子邮箱：

研究方向

当前位置: 中文主页 >>研究方向

面向图像和视频数据的深度语义编码与实时传输方法

实时视频传输在直播、无人机、人机交互控制、交通、国防等领域具有广泛应用需求。视频或图像数据对带宽需求大，需要较高的信道质量才能保证其稳定流畅传输。然而，在存在恶意干扰或链路质量一般的情况下，视频或图像数据的传输会受到资源竞争、信号损耗、干扰、噪声、器件功能失常等各种因素的影响，不可避免地会出现误码、丢失或延迟抵达的情况，使视频或图像出现卡顿、花屏的现象，甚至传输完全中断，严重影响用户的体验质量。相关测试表明，即使1%的丢包率，也会使视频传输质量明显下降；在丢包率达到5%时画面质量将大幅度下降，严重影响用户体验质量。

虽然已有的方法从协议机制设计、编解码、提升网络传输能力等各方面增强传输稳定，但仍无法有效改善复杂网络环境下的视频传输稳定性问题，其根本原因是当前的图像和视频编解码方法只针对信源信源编码问题，没有信道编码功能，因此无法有效应对传输损失或传输错误所带来的负面影响；另一方面，当前的传输网络属于无损传输体系，即要求所有比特均被正确传输，否则将无法通过校验过程而被丢弃，而一旦信道的质量相对较差时，误码和丢包将不可避免。虽然重传等机制可以实现可靠传输，但无法保证是实时性。因此，在实时传输情况下，信息传输损失往往难以避免的情况，而如何进一步增强图像和视频等多媒体数据的传输鲁棒性一直以来都是相关行业的痛点问题之一。

不同于传统的无损传输体系，基于深度语义编码的图像和视频传输方法是一种全新的基于深度学习的多媒体数据有损语义传输方法，通过深度容错编解码模型和传输机制设计，可在出现大比例误码或丢包（如超过40%误码或60%丢包）的情况下，仍能有效重构出所传输的图像或视频帧，保持视频等多媒体数据的稳定传输，有效增强存在干扰、波动或弱网环境下多媒体数据的传输鲁棒性，提升用户体验。此外，基于深度语义编码的传输方法与当前TCP/IP协议族、WiFi协议族、4G/5G协议等主要协议兼容，可实现跨网语义通信过程，对其他应用的通信过程不造成影响，也可以与已有的传输模式灵活切换，具有良好的兼容性。