10月 14日-1 0月16日 ,2022年IEEE (电气电子工程师学会)组织的国际电子商务工程会议(ICEBE会议)在英国伯恩茅斯举行。
保利威技术副总裁梁瑛玮、保利威CTO黄海亮、华南理工大学博导吴庆耀教授在【AI音视频技术】领域的两篇学术论文入选 ,并在会议中公开发表。
(资料图片仅供参考)
截至2022年10月, 保利威已获得52项发明专利 以及 62项软件著作权。
《基于共享编码器的端到端语音识别系统》一文介绍了行业上对于智能语音识别存在大量需求, 不仅于语音转文字,更在于对语音实时监测并屏蔽 ,以确保直播的安全合规性。
论文详解了基于共享编码的语音识别机制,将每一个音节作为独立的单元模块提升语音识别准确度,并采用流失+智能断句的方式,在保证可接受的延迟范围内保障直播稳定推流。
▲基于音节单元模块的共享编码系统
基于与华工合作的语音识别引擎,保利威目前已完成产品功能层面的对接与测试, 显示出适配各项业务场景、高度安全、识别稳定等优势 (如视频所示 ) ,为技术商业化提供有力支撑。
▲直播中智能屏蔽 关 键词效果演示
关键词:直播、开播
随着双方的进一步研究深入,该智能语音引擎将有望大规模应用于 直播字幕、翻译、警报、自动化营销 等企业业务场景。 据保利威观察, AI语音违法内容自动识别屏蔽在 金融合规、营销直播、活动直播 等场景有着重要意义, 能切实有效地帮助客户降低直播风险,保障直播合规。
《基于深度神经网络和系统学习的高可用性视频水印》一文则是 介绍了视频水印对于视频防盗的重要性,并阐释了视频切片编码技术在添加动态水印的底层逻辑 。
该技术会自动对视频每一帧进行切片并嵌入动态水印,最后输出成私有化格式(区别于常见的视频格式,如MP4、MOV等),从而提升视频破解难度,兼顾兼容性和安全性。
▲嵌入和提取视频水印的完整流程
目前,保利威已将该视频切片技术应用于旗下PlaySafe版权防盗体系中,从 防录屏、防下载、异常行为监测 等多维度护航视频安全。
▲ 保利威PlaySafe视频安全保护体系 ▲
据保利威观察, 防止视频内容被盗已 不局限与职教、培训等内容生产机构 ,在企业侧,尤其是 金融、医疗、汽车等大型企业 对于内容安全的要求也更愈发高涨 ,视频水印技术应用愈发深入,能有效地帮助企业方式视频内容失窃。
2019年, 华南理工大学和易方信息科技股份有限公司成立了「智能音视频联合实验室」!
该实验室充分发挥了保利威在音视频领域的技术积累和行业经验,并结合华工在大数据分析、AI技术、智能训练模型等领域的研究实力,共同创新智能音视频技术领域的应用!
此次,两篇论文被国际学术会议公开发表,不仅是实验室技术探索的成果体现,也是校企合作的一次成功实践,更是产教融合,产学研一体化的缩影。
未来,双方将继续深化合作,促进产教融合,推动音视频技术的应用和产业化进程,构建产学研用一体化平台,为数字中国注入新动能。
深耕企业直播赛道9年,保利威持续探索音视频技术的可能性,坚持与高校及科研机构协同共创,并将创新成果付诸于产品之上,打造符合市场需求及可用性的产品。
作为企业级视频SaaS领导品牌, 保利威自研并落地了SaaS化MR、PRTC无延迟直播、PlaySafe版权保护等一系列前沿音视频技术 ,技术产品化,技术服务化,推动音视频技术商业化,引领行业发展!