树人论文网一个专业的学术咨询网站!!!
树人论文网

基于知识图谱的审计风险点识别研究

来源: 树人论文网发表时间:2021-01-28
简要:摘 要:传统审计模式在大数据时代已显疲态,审计智能化已经成为了行业未来发展的必然趋势。审计收费高昂、抽样审计覆盖率低以及审计失败加剧了传统审计模式面临的威胁,基于专

  摘 要:传统审计模式在大数据时代已显疲态,审计智能化已经成为了行业未来发展的必然趋势。审计收费高昂、抽样审计覆盖率低以及审计失败加剧了传统审计模式面临的威胁,基于专家先验知识的知识图谱可以有效帮助提升审计效率,实现审计智能化与审计风险点全覆盖。审计数据经过知识抽取转化成三元组的形式构造审计知识图谱,专家审计经验经过量化等处理形成专家审计经验库,审计知识图谱通过遍历专家审计经验库中的阈值、条件,最终实现审计风险点的识别。

商讯

  本文源自商讯 2021-01-28《商讯》本刊创刊于1983年,以研究商业经济理论和实践探索,发展大流通、大商业,建设大市场,搞活商业经济和转换企业经营管理机制,提供专业的、有价值的经济信息服务为宗旨。

  关键词:知识图谱;审计;人工智能;大数据;审计风险识别

  在人力成本日渐高昂的今天,审计行业仍存在着大量的人力资源输出,并且在分析处理数据方面片面且效率较低,还存在财务舞弊的可能性。为发挥信息技术内部审计中的作用,提升审计工作质量,拓展审计监督深度和广度,审计技术亟需一次安全性与实时性上的革命。2012年,谷歌提出知识图谱并将其用于语义搜索中后,知识图谱再度引起了关注,基于知识图谱的可视化与知识推理可以有效帮助缓解当前审计行业面临的困境。

  知识图谱的应用使得抽样审计将成为过去,审计数据的全覆盖可以帮助审计人员降低检查风险,基于专家审计经验的推理机使审计知识图谱具备知识推理的能力,并排查所有潜在的审计风险点,并且对审计风险点排查的能力随着专家审计经验库的完善而提升,审计人员可以根据排查出的审计风险点进行有针对性地排查以避免重复性的工作,提升审计工作效率。

  一、智能审计近年发展动态智能审计的概念自1994年初次被提出已经经历了二十多年的发展。2019年,学者们研究对比了中外人工智能审计,总结国内外人工智能审计的热点及趋势,提出了对人工智能审计的展望[1];针对图形化云桌面面临的安全审计问题,有学者设计并实现一种基于光学字符识别(Optical Character Recognition)技术的操作行为审计方案,实现在代理服务器上对用户操作图片的采集、识别以及行为审计的相关工作,无需在远程云主机上安装任何Agent软件,是一种非侵入式的轻量级审计方案,实现了智能审计[2]。通过人工智能的专家系统、神经网络、模糊逻辑等方法,有学者建立了dialing工程审计平台,实现了更方便、快捷、有效的电力工程审计工作[3];为了提升审计质量与效率,有学者提出了财务共享体系,以及该体系下智能审计的方法设计[4];人工智能的发展势必会给审计行业带来一定的冲击,因此有学者探讨了人工智能对审计工作的影响,以及如何正确认识和应用人工智能给审计带来的影响和发展[5]。随着5G、物联网、人工智能与区块链等新兴技术的发展给智能审计注入了新的生命力,“审计智能+”通过整合这些前沿的新兴技术,保证审计数据自产生开始便在线上真实、完整地运行,实现数据采集、分析到报告生成全过程自动化,完成智能审计升级。

  二、基于知识图谱的审计智能化

  在传统审计工作中,往往采取业务驱动数据的模式,限制了审计工作的效率,也不易于发现隐藏的审计线索。为实现审计平台的信息化、透明化。将知识图谱算法体系融入自动化审计中,能够将审计数据高效地组织利用,减少了数据冗余。同时,知识图谱的数据可视化能力,使得审计数据间的关系也更加形象化,直观呈现出审计数据的知识网络构架。对比传统数据库的管理能力,知识图谱通过数据挖掘算法与语义引擎进行数据结构化储存,与审计工作的需要更为契合,在未来的审计工作中将发挥重要作用。

  (一)基于神经网络的审计数据知识抽取

  大数据时代的海量数据背景,对数据审计提出了新的要求。由于大量非结构化和半结构化数据的存在,亟需一种文本挖掘方案,便捷、有效、安全地实现非结构化数据的知识抽取。为此,提出了一种基于神经网络的审计数据知识抽取方案,能够提取出数据中的实体、属性、关系等,并将这些非结构化数据以三元组形式关联起来。

  我们使用selenium爬虫框架,与requests库、re库、 BeautifulSoup库等相结合,从巨潮资讯自动获取目标公司的公告。在对原始数据收集、清洗、加工、处理及整合后,将数据模型化,基于神经网络模型对文本进行深入分析,提炼出有价值的信息。为保证模型准确、可靠,引入google 开源的BERT预训练网络。BERT模型因其独特的Masked 语言模型和NextSentencePrediction等机制,解决了传统的 word2vec模型无法解决的多义词表达问题,从而使得该模型训练出的词向量可以更加准确地表示出词语间的语义关系,可认为是当下自然语言处理领域内最先进框架。通过审计数据三元组,即<实体 (公司名称,会计师事务所名称,人员名称等) -关系 (关联交易、子母公司、职位) -实体>的构建,以集中整理分析员对企业的信用研究,将不同信息之间的内在联系挖掘出来,帮助审计工作人员形成完整清晰的业务逻辑,大幅提高研究工作的效率,有望深刻改变策略模型的产生、验证、优化和运用方式,同时提高突发事件响应速度,提高分析工作的质量。

  (二)审计数据知识图谱自动生成

  图数据库是当前主流高性能NOSQL数据库,将结构化数据以知识图谱的形式进行存储。该数据库善于处理复杂、互连接、结构化的数据,因而应用场景丰富。通过解析审计数据构建审计数据知识图谱,将审计数据表层数据关系和隐含数据关系可视化。数据经过格式化处理后存入数据存储列表,之后通过匹配、筛选数据存储列表中的格式化数据存入关系图谱所需的结点列表以及关系列表。

  通过自然语言处理技术对非结构化数据进行实体关系的抽取,构建审计知识图谱。图中使用了平安银行近年的关联交易公告构建的平安银行关联交易知识图谱 (如图1所示),该知识图谱清晰且详细地展示了平安银行近年来在公告中披露的关联交易,同时,在公告中披露的子母公司关系也展示在了此知识图谱中,除子母公司间的关联交易外,平安银行与其他关联方的关联关系仍需对发布的公告和其他公司非结构化数据进行进一步处理获得。

  (三)基于知识图谱和推理机的审计异常识别

  针对目前人工可疑数据排查的片面性,发挥计算机能处理大量数据的能力,以审计规则构建的推理机作为审计工具,达到全面比对、审查数据疑点,不断更新知识图谱反馈给审计人员,通过这样的方式逐步提高审计风险预警的正确性。

  行业专家的经验可以经过量化等处理被转化成计算机可以理解的形式以此来构建专家审计经验库。推理机通过读取知识图谱中相关数据进行搜索、匹配以获取相关审计规则需要的数据,根据审计经验的阈值和条件,对审计数据进行遍历并得到最终的判断结果,根据判断结果返回审计知识图谱并进行可疑风险点的标注。同时,根据审计经验和关系规则可以帮助发现知识图谱中的隐含,并能够同时对冲突即异常进行检测,以实现全面高效的审计,增强审计可疑点的可发现性。

  三、结语

  在大数据时代背景下,传统审计模式暴露的种种弊端表明传统审计模式亟需一次巨大的变革。基于知识图谱的审计风险点识别流程通过数据获取、数据处理、比对审计规则库和最终结果推演分析几个层面致力于为专业注册会计师大幅度减轻重复工作,一改现今审计工作中可能会遗漏重要风险点的抽查模式,通过全面审查计量分析公司各项经营交易,最终推演出潜在风险点。为注册会计师提供目标,精简注册会计师的工作,辅助注册会计师出具恰当的审计报告。审计人员可以更加直观地审查可疑审计实体与审计关系,并将精力着重于筛除企业财务风险点知识图谱上的企业财务风险,节省大量时间成本并提高了审计效率。

  随着国家对上市公司、预上市公司透明度要求的提高。审计工作成了常态化,人工智能化审计是必然的需求。把握大数据时代对智能审计的需求,以各大上市及预上市公司内部审计与国家审计机关为基点,利用知识图谱能够处理并展现复杂关联交易的特点对企业进行全面高效的审计,可以有效规范企业行为,促进资本市场的健康发展。