2021-4-10 | 互联网
1系统组成
根据系统总体框架和软件模型,将互联网电视内容监管系统划分为三个子系统,分别是:互联网电视用户端数据采集系统、互联网电视内容监管平台、数据库服务系统。互联网电视用户端数据采集系统与内容监管平台之间实时业务通过HTTP协议进行通信,数据通过XML格式进行封装,音视频数据流通过RTSP实时流媒体协议传输,非实时数据通过数据库服务系统进行数据存储与交换,文件流通过FTP协议传输。
数据库服务系统:实现数据的统一存储与管理,包括EPG数据、节目元信息、审批机构信息、下载及录像文件、用户管理信息、设备状态信息、数据处理分析结果等。
2系统总体功能
系统的主要功能包括:互联网电视机用户端数据采集、互联网电视节目监看、下载和存储、EPG、节目元采集、管理和核查、违规节目鉴别、取证录制、审批机构管理与核查、统计分析报告、系统运行管理等。
1.互联网电视用户端数据采集及存储:从用户端(内容接收端)获取互联网电视接收节目的EPG信息、节目元信息、点播节目内容、直播节目码流;下载点播节目文件、录制直播节目内容;违规节目搜索及效果验证。
2.节目内容监看:通过监管门户提供的用户配置界面节目单,选择互联网电视机实际播出的点播/直播节目,实现对相应实时/历史节目的多源、多码率、多画面监看监听。
3.EPG及节目元信息管理:对7种电视机采集终端获得的EPG信息、节目元信息进行汇总和统一存储,建立互联网电视EPG信息库。
提供EPG及节目元信息查询、分析处理功能。
4.机构信息管理与核查:建立全国互联网电视业务审批基础信息库,审批机构包括互联网电视集成业务持证机构,以及互联网电视内容服务持证机构;通过采集前端采集的节目元信息,以及对相关节目内容、呼号、台标等的抽查,对实际播出情况进行核对。一是确保终端收看的节目来自合法的集成播控平台,二是确保集成播控平台中的节目来自合法的互联网电视内容服务持证机构,三是确保各类持证机构按照审批范围和标准开展业务。
5.违规节目鉴别:通过预定义的节目文本关键字规则,自动标记EPG信息库中的节目元信息、归类筛选疑似违规节目;对用户指定的疑似违规待下载/录制节目,在下载/录像完成回传到监管平台后,利用视频拷贝检测技术,通过镜头划分、关键帧抽取等视频语义分析手段,辅助实现节目内容的智能识别。
6.违规节目取证:建立违规取证数据库,存储已确认违规节目的相关信息和录像文件,包括节目元信息、节目内容、节目静态视频摘要、违规性质、违规类别、审核时间、审核人、下线通知时间、下线确认时间等。
7.查询、统计分析功能:对系统内各类监管数据的查询、综合统计、分析、报表功能。
8.系统运行管理:运行管理实现对系统业务参数和运行参数的配置和管理,分配用户权限,监控系统网络、软硬件等运行状态,出现异常时进行报警等。
9.系统安全:为防止网络攻击及反向定位,在网络层将所有访问互联网的终端地址加以隐藏,并在应用层设置访问黑/白IP地址,保证系统的安全。
3系统软件总体设计
互联网电视内容监管系统软件在结构上分为数据采集、数据逻辑和数据表示三个部分,如图4所示。其中数据表示层(即监管门户)采用B/S架构,整个系统采用模块化设计,每个功能模块保持相对的独立性,具有较好的开放性和易扩展性,结构清晰、维护简单易行。
第一部分是数据采集和回传。互联网电视用户端的数据采集用于采集互联网电视用户接收端的节目信息及音视频内容信息。模拟电视机终端通过公共互联网访问对应的集成播控平台。互联网电视机采集终端由数据采集服务器、互联网电视机和相关应用软件组成,自动采集实际传输到用户端的互联网电视EPG、节目元信息等,并能根据监管平台的远程指令,对点播节目内容、直播节目码流进行主动下载、轮播、录制,对违规节目进行搜索验证和下线效果验证。
第二部分是监管数据回传网络。互联网电视机采集终端设置两块网卡,一块与互联网连接,一块与内网连接;与外网连接的网络通过硬件防火墙NAT等技术接入公共互联网,与内网连接的网络应用安全策略逻辑隔离后,通过交换机与监管平台组成内部局域网。
第三部分是内容监管平台,主要由流媒体服务器、WEB服务器、EPG管理/机构管理与核查服务器、数据库服务器、违规节目鉴别服务器、违规节目取证服务器组成。互联网电视内容监管平台作为全国互联网电视内容监管数据统一分析与处理平台,通过指令控制互联网电视机采集终端,接收采集终端回传的监管数据。监管平台对互联网电视内容监管采集数据进行统一解析、存储、分析和处理,为监管人员和管理部门提供多源、多画面监看和各种监管数据,从而实现对互联网电视的有效监管。
4关键技术
1.网络抓包技术
捕获流过网卡的数据包,工作在混杂模式下的网卡接收所有流过网卡的帧,信包捕获程序就是在这种模式下运行的。
网卡的缺省工作模式包含广播模式和直接模式,即它只接收广播帧和发给自己的帧。如果采用混杂模式,一个站点的网卡将接受同一网络内所有站点所发送的数据包,这样就可以达到对网络信息监视捕获的目的。
2.网络爬虫及XML解析技术
采用网络数据包截获手段来获取节目播出平台的首页地址,从而得到初始网页URL,根据初始网页的XML描述,配置网页爬取规则,用来把需要采集的网页批量保存到本地,进行一定的分析、过滤,并建立索引。在模块内部构建一个XML解析器,不断获取新的URL放入队列,这样一直循环下去,直到把节目播出平台所有的网页都爬取完为止。为了提高网络爬取的效率,此模块使用多线程方式进行。