首页 公文范文 建设新时代地球站智慧运维系统研究

建设新时代地球站智慧运维系统研究

时间:2022-11-11 10:52:36 关键词: 新时代 地球站 智慧 运维系统
摘要:如何有效做好日常值班是安全播出运维工作的重中之重,也是地球站安全播出可持续发展的基础性工作。目前,日常值班工作基本由值班员人工来承担。由人来做,不可避免地存在值班员发现问题慢、反应慢、操作慢、判断不精准、失误多、压力大、值夜班、劳动强度大等问题。抓住主要问题的主要方面,可对问题进行归纳并划分为3类:一是动作慢;二是失误多;三是劳动强度大。

建设新时代地球站智慧运维系统研究

1引言

以新时代中国特色社会主义思想引领,国家广播电视总局立足“智慧广电”新发展阶段,贯彻推进实施“智慧广电”六大工程建设新发展理念,构建广播电视新发展格局。国家广播电视总局某地球站根据总局战略部署,紧紧围绕《广播电视和网络视听“十四五”发展规划》,通过技术创新和科技赋能,开展运维管理保障播出安全,建设新时代地球站智慧运维管理系统。地球站运维全部由技术人员人工完成日常值班、设备检修、业务培训和故障处理等工作,本文重点研究日常值班运维管理工作。目前,地球站日常值班是24小时值班模式,主要值班工作任务基本依靠一线值班员眼睛的监测和手的操作完成。

2存在问题与原因分析

如何有效做好日常值班是安全播出运维工作的重中之重,也是地球站安全播出可持续发展的基础性工作。目前,日常值班工作基本由值班员人工来承担。由人来做,不可避免地存在值班员发现问题慢、反应慢、操作慢、判断不精准、失误多、压力大、值夜班、劳动强度大等问题。抓住主要问题的主要方面,可对问题进行归纳并划分为3类:一是动作慢;二是失误多;三是劳动强度大。动作慢和失误多是由人的本身特性决定的,劳动强度大是因没有机械化、智能化造成的。因此,要想解决目前地球站日常值班中存在的问题,就需要用创新给设备和系统技术赋能,由智能值班机器人来代替值班员的日常值班工作,解放值班员。值班员日常值班工作实行24小时值班制,1天4个班组,1个班组平均6小时,实行六班四倒模式,即连续值班4天休息2天。要想完成值班期间的安全播出保障工作,包括播出安全、信息安全和消防治安安全等,抓住影响“动作慢、失误多和劳动强度大”的主要值班工作是解决问题的关键。值班员的主要值班任务:一是通过眼睛对电视墙电视画面和节目载波频谱进行实时监测;二是手动对设备的主备切换和升降功率等操作。所以,可以将值班员的主要值班任务概括为“两看一操作”,即“看画面看频谱”两看与“切换升降功率”一操作。

3对策措施

3.1应对策略

本智慧运维系统的目标是减少对值班员的依赖,全面提升全流程人工智能化安全播出保障能力。重点是从值班人员的角度出发,思考解决智慧运维系统怎样在第一时间智能准确发现节目异态、怎样在第一时间智能有效操作处理异态,保障播出问题。地球站通过采取相关性原理、组合逻辑、物联网、大数据、云计算、数据挖掘及技术赋能等技术手段,解决了当前卫星广播电视地球站运行维护管理工作中存在的问题,通过完成6个模块技术框架功能,建设了卫星广播电视地球站智慧运维管理平台。地球站智慧运维系统其实就是智能值班机器人系统,它主要由数字频谱监测、音视频监测、逻辑判断、智能调度、设备网管和大数据等6个子系统组成,其功能原理如图1所示。该智慧运维系统的功能主要是完成信号实时监测、数据采集、智能分析、逻辑判断、指令下达、完成操作等一整套工作任务,各部分各司其职,又相互关联。

(1)数字频谱监测子系统

数字频谱监测子系统是地球站智慧运维系统的一只“眼睛”,主要完成各个节目系统载波频谱的实时监测及采集告警数据工作等任务,并将告警数据实时推送给逻辑判断子系统。

(2)音视频监测子系统

音视频监测子系统是地球站智慧运维系统的另一只“眼睛”,主要完成各个节目系统画面和声音的实时监测及采集告警数据工作等任务,并将告警数据实时推送给逻辑判断子系统。

(3)逻辑判断子系统

逻辑判断子系统是地球站智慧运维系统的“大脑”,是核心,是关键。它实时接收参与逻辑的信息及告警数据,主要按照既定逻辑完成逻辑分析判断,将各类操作指令发送给智能调度子系统。

(4)智能调度子系统

智能调度子系统是地球站智慧运维系统的“心脏”,主要完成统一指挥调度、并行下发各种操作指令等调度功能。

(5)设备网管子系统

设备网管子系统是地球站智慧运维系统的“两只手”,主要完成所有播出设备指标、告警和故障的实时监测和各类自动切换操作。同时,接收智能调度子系统下发的操作指令,并由设备网管子系统完成最终的指令操作等任务。

(6)大数据子系统

大数据子系统是地球站智慧运维系统的“两条腿”,主要完成大数据采集挖掘等工作。它为地球站智慧运维系统提供大量数据生产资料,并通过大数据挖掘,形成新的有效保障安全播出的各类具体算法,支撑地球站智慧运维系统不断完善,不断前行。

3.2解决措施

地球站智慧运维系统通过数字频谱监测子系统和音视频监测子系统两只“眼睛”和设备网管子系统两只“手”,基本完全可以替代值班员的人工实时监测和相关操作。本文重点阐述音视频监测子系统怎样实现地球站智慧运维系统“眼睛”的功能。地球站智慧运维系统根据大数据挖掘和相关性原理算法,能定义一个准确的组合告警数据,组合告警规避了许多误告警,提升了“眼睛”判断画面和声音异常的准确度和可靠性。

(1)数据采集算法

数据采集算法将地球站主备节目源、调制器上行和大小天线接收5个监测点的音视频告警和码流告警数据作为原始采集数据。以地球站上星发射传输中星9号卫星XX转发器户户通10套电视节目为例,当大小天线2个不同监测点分别设置监测1套不同节目,若其中1套或2套不同节目出现音视频报警时,并不能代表该上星节目系统出现异常。为了解决此类问题,地球站智慧运维系统采用相关性算法,将大小天线2个不同监测点分别设置监测3套不同节目的组合告警,当出现该组合6套不同节目同时出现音视频告警时,就可以判定该上星节目系统出现异常。此外,为了解决因音视频监测误告警多导致的值班员对告警不敏感问题,对所有报警根据相关性原理算法进行分类组合处理。根据广播电视安全播出监测实际和相关性算法原理,从音视频模拟信号和码流数字信号层面,分别定义了A类、B类和C类报警算法。其中,A类报警(音视频模拟信号层面)算法定义为大小天线2个不同监测点不同节目的组合设置同时出现视频丢失、马赛克等现象,不仅声音告警,同时弹字幕,定义为最严重的异态;B类报警(码流数字信号层面)算法定义为大小天线2个不同监测点不同节目的组合设置同时出现PAT等错误,不仅声音告警,同时弹字幕,定义为最严重的异态;C类报警(含模拟和码流层面)算法定义为所有节目的所有告警(含误告警)全部在后台记录,没有声音告警,也不弹字幕,保证不影响值班员,但可查询、可统计。

(2)数据统计分析

根据地球站安全播出的实际运行情况,通过智慧运维系统数据库,统计了从2017年9月至2021年9月的A、B、C类告警数据及占比情况和A类告警数据及其分类占比情况。2017年9月至2019年9月,共产生C类告警260万条,B类告警80万条,A类报警9000条。其中,260万条告警中,真正有效的组合B类告警为80万条,即B类告警占C类告警的比例为30.8%;真正有效的组合A类告警为9000条,即A类告警占C类告警的比例为0.35%,也就是说,A类告警出现概率是1000次出现3.5次。9000条A类告警由系统测试、节目代播和节目中断造成的A类告警组成。其中,系统测试告警8860条,节目代播告警139条,中星9号卫星XX转发器户户通节目调制器输出有载无调节目中断有效告警1次。在9000条A类告警中,系统测试告警占比约98.4%,节目代播告警占比约1.54%,真正影响播出的节目中断有效告警仅占比约0.0111%。从数据可推出260万条告警中,真正影响安全播出的“节目中断”1次有效告警出现的概率是不到1/2600000,概率非常低,大大提升了有效告警的准确度和可靠性。2019年10月至2020年8月,共产生C类告警6560万条,B类告警2009条,A类告警3975条。其中,6560万条告警中,真正有效的组合B类告警为2009条,即B类告警占C类告警的比例为0.003%;真正有效的组合A类告警为3975条,即A类告警占C类告警的比例为0.006%,也就是说,A类告警出现的概率是1000次中出现0.06次。3975条A类告警由系统测试、节目代播和节目中断造成的A类告警组成。其中,系统测试告警3860条,节目代播告警114条,中星9号卫星XX转发器户户通节目调制器输出有载无调节目中断有效告警1次。在3975条A类告警中,系统测试告警占比约97.1%,节目代播告警占比约2.87%,真正影响播出的节目中断仅占比约0.03%。从数据可推出6560万条告警中,真正影响安全播出的“节目中断”1次有效告警出现的概率是不到1/65600000,概率非常低,大大提升了有效告警的准确度和可靠性。2020年9月至2021年9月,共产生C类告警1.11213768亿条,B类告警1290条,A类告警2885条。其中,1.11213768亿条告警中,真正有效的组合B类告警为1290条,即B类告警占C类告警的比例为0.0001%;真正有效的组合A类告警为2885条,即A类告警占C类告警的比例约为0.0003%,也就是说,A类告警出现的概率是1000次中出现0.003次。2885条A类告警由系统测试、节目代播和节目中断造成的A类告警组成。其中,系统测试告警2724条,节目代播告警160条,中星9号卫星XX转发器户户通节目调制器输出有载无调节目中断有效告警1次。在2885条A类告警中,系统测试告警占比约94.4%,节目代播告警占比约5.55%,真正影响播出的节目中断有效告警仅占比约0.03%。从数据分析可推出1.11213768亿条告警中,真正影响安全播出的“节目中断”1次有效告警出现的概率约是1/110000000,概率非常低,大大提升了有效告警的准确度和可靠性。

4结语

经过长时间运行实践,地球站运维测试验证数据表明采用相关性原理的数据采集算法理论正确有效,大量实验数据证明,该系统已解决了地球站智慧运维系统“眼睛”准确稳定有效的问题。长期安全播出运行实践结果证明,当出现真正影响安全播出的“节目中断”1次有效告警时,地球站智慧运维系统能够在第一时间自动准确发现中星9号卫星XX转发器户户通“节目中断”的异态,并自动切至备播系统恢复播出,有效保障了播出。综上所述,从实践测试数据和实际保障播出效果来看,地球站智慧运维系统能够在第一时间智能准确发现节目异态,并且能够在第一时间智能有效操作处理异态,保障播出。目前,地球站智慧运维系统功能更趋完善,在日常值班运维中发挥了不可替代的作用,大大提升了地球站安全播出保障水平,达到了预期目标。该系统采用相关性原理的数据采集算法理论正确有效,它将音视频告警等系统与播出网管实现逻辑联动,并经过实践证明可行,具备推广意义。

作者:桑波 单位:国家广播电视总局呼和浩特地球站