2021-4-10 | 证券交易论文
1概述
随着互联网的普及以及网上证券交易系统功能的不断丰富、完善和使用的便利性,网上交易正成为证券投资者交易的主流模式,据统计,证券经营机构网上交易业务的交易量已经占到总交易量的80%以上,网上证券交易系统已经成为证券公司交易系统的重要组成部分。另一方面,随着互联网应用的普及,针对网上证券交易的安全事件日益增多。
“盗买盗卖”恶意行为、“证券大盗”等病毒木马给投资者和证券公司带来经济损失的同时,也影响到网上证券交易市场的长远发展,如何提升网上证券交易系统的安全性,已成为证券行业关注的热点。
2网上证券交易面临的问题和分析
2.1网上证券交易面临的安全问题
在当前信息技术日新月异、电子商务高速发展、资本市场规模不断扩大、业务创新层出不穷的前提下,证券业的信息系统变得越来越庞大和复杂。在行业信息化建设过程中,信息安全的各个环节都暴露了一些亟待解决的问题。
互联网应用的快速发展,促使攻击事件变得越来越普及,网络犯罪活动已经从最初的个人恶意攻击行为,转变成目标明确,有组织、有分工的职业化行为。危及网上证券交易安全的病毒、木马、钓鱼、窃取、篡改等攻击手段层出不穷,大部分网上证券交易的用户安全防范意识不高,对于可能盗取用户口令的攻击手段没有任何防范能力。这些问题极大地影响了证券交易体系的安全性。同时,以盈利为目的的黑色产业链,正促使这种局面愈加恶劣。
如近期集中爆发的网络钓鱼事件,更是给广大的网上用户,直接带来了巨大的经济损失。因此,维护网络安全成为了证券业信息化建设的重要工作。
网上证券交易系统的安全可以分为账户安全和系统安全。保护账户安全是指保护个人账户的账户/密码、资金、交易行为等信息的机密性,不被他人窃取或监听;保护系统安全是指保护网上证券交易系统,使之不受合法账户的非法交易行为的影响。
分析证券交易中的异常行为,有针对性地提出安全信息系统的解决方案,是保障网上证券交易系统安全、可靠运行的有效途径。
2.2网上证券交易异常行为定义和分析
证券交易中的异常行为主要表现在用户在买卖股票、债券或资金划转过程中出现的异常举动。根据《上海证券交易所证券异常交易实时监控指引》对证券交易异常行为的归类和定义,基本包括以下几种异常交易类别:高买低卖利益传送、资金频繁存取、长期闲置账户频繁异动、大量委托或查询请求、虚假申报、短线操纵、连续集中交易等。
1)高买低卖利益传送
证券交易盗买盗卖行为,通常是通过频繁交易国债或企业债品种,利用债券T+0交易、无涨跌停、且交投不活跃的特点,通过高买低卖方式,实现利益输送。此类异常行为一般在市场整体交投不活跃、投资者不经常查看账户状态的情况下进行,降低了被投资者及时发现的可能。
2)长期闲置账户频繁异动
长期闲置的账户突然发生异常波动,包括频繁登录、频繁交易,或无交易频繁转账等,都可以视为疑似异常行为。如,正常交易日无交易账户资金划转每天发生3次以上,或者无交易账户资金划转每天发生1次,且持续发生3天以上,出现接近于大额现金交易标准的现金收付的交易行为。
3)大量委托或查询请求
攻击者通过利用多个账户发送大量无效的委托或查询请求(如失败委托或不可能成交委托),攻击证券公司的交易系统。交易系统需要对委托、查询订单进行处理,势必会占用券商交易系统和交易所撮合系统的资源,也会影响到其他用户的正常交易行为。
除上面介绍的异常行为外,虚假申报、短线操纵、连续集中交易等也严重影响了网上证券交易的政策秩序,需要及时发现并予以控制。
但是,网上证券交易的异常行为是在不断变化的,很难仅凭借现有的行为特征予以识别和防范,还需要不断了解新的异常行为,并作出反应。本文提出了一种基于数据挖掘的异常行为分析方式,它通过收集交易行为数据,利用挖掘算法,对数据进行清理、降维、归纳、模式识别、结果分析与评价,不断丰富异常行为数据库,从而实现对网上证券异常交易行为的及时预警。
3基于数据挖掘的证券交易异常行为分析
3.1数据挖掘的概念及方法
数据挖掘常特指数据库数据挖掘(KnowledgeDiscoveryinDatabase),按照Fayyad的定义,“KDD是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”[1]。
数据挖掘的过程大体分为三个阶段:数据准备、数据挖掘以及结果的解释评估,可以参见图1中给出的多处理阶段过程模型。
1)数据准备
数据准备包括数据选取(Selection)、数据预处理(Preprocessing)和数据变换(Transformation)等工作。数据选取用来确定发现任务的操作对象,即目标数据(TargetData),根据用户的需要从原始数据中抽取一部分数据。数据预处理把目标数据处理成便于挖掘的形式,一般包括去噪声、缺值数据处理、消除重复记录以及数据类型的转换等操作。
2)数据挖掘
数据挖掘首先确定挖掘的任务,如分类、聚类、关联规则发现,或序列模式发现等。然后选择采用哪种挖掘算法,算法的选择主要基于两点考虑:一是针对数据本身的特点,采取相应的算法挖掘;二是针对用户的需求(是获取显式的规则还是抽象的模型等)采取相应的算法挖掘。数据挖掘阶段是数据挖掘过程的核心,目前的大多数研究也都是针对挖掘算法展开的。