摘 要:随着人工智能和区块链技术的齐驱并进,近几年受追捧的程度有目共睹。越来越多人开始关注两者融合发展的可能性。文章分析了人工智能领域存在的问题,并探究了区块链技术优势,以及对人工智能的数据、算力、算法等所存在痛点的帮助,为学术界和产业界继续深入研究人工智能与区块链技术融合发展提供了新的思路。
本文源自网络空间安全 2020年11期《网络空间安全》(国际统一刊号:ISSN 2096-2282;国内统一刊号:CN 10-1421/TP)期刊创刊于2010 年,由中华人民共和国工业和信息化部主管,中国电子信息产业发展研究院、赛迪工业和信息化研究院主办,是集学术性、技术性、专业性和权威性为一体的国家级学术期刊。
1 引言
近年来,随着我国人工智能(Artificial Intelligence, AI)技术推进政策不断落地,企业逐步重视对人工智能的应用。人工智能技术为人们带来了便捷,并获得了迅速的发展。但由于人工智能技术在数据、算力和算法等方面存在不足,导致数据质量差、信息丢失、算法过分集中等问题的出现,使得技术创新受阻、应用落地实施困难。因此,改变、优化、升级人工智能技术模式,将传统的人工智能技术与其他新兴技术相结合变得尤为重要。
区块链(Blockchain)技术是以网络技术为基础发展起来的一种综合型技术,凭借其去中心化、可追溯、不可伪造等的特点,在互联网技术的安全领域之中发挥着强大的作用与优势。区块链技术为促进实现全球网络的共享共治、处理数字世界和现实世界关于用户隐私保护、能源粗放使用等问题的矛盾提供了新思路。随着区块链技术不断深入研究,研究者们利用区块链技术的优势,对人工智能技术发展中存在的困难进行改善,并取得了较好的成绩,为我国科学技术的发展提供了一个全新的模式。
2 人工智能领域存在的问题
自人工智能出现以来,便得到了各个行业的广泛关注及大力支持。它极大地方便了人类的生活、学习,为科学技术的发展带来了新可能。但在人工智能技术不断改善人们生活质量和促进科学研究的同时,它带来的问题也着实令人困扰。
2.1 数据垄断
各领域数字化进程的加速使得数据量呈现爆炸式增长,海量数据蕴藏的巨大衍生价值使其成为数字经济时代的战略性基础资源。由此引发的“数据争夺”和数据积累差异,逐渐出现了数据垄断现象,数据寡头持有并控制海量数据[1]。
人工智能技术不是一个单一的技术,它是由数据、算法、服务等统合的新兴技术。它的重心在于决策、评估和理解某些模式和数据集,最终产生自主交互。人工智能的可供学习、分析的数据越多,人工智能的预测、评估、决策才能更准确。但由于数据垄断现象的产生,很多从事人工智能行业的公司由于缺乏数据,人工智能发展一直停滞不前,即便是像阿里、谷歌、腾讯这样的互联网巨头,所能获取的也只是基于自身业务的有限数据,所以大部分企业逐步将目光从数据收集转向了数据交易。由于数据的缺口较大,不少大数据来自数据黑市,其真实度和质量都大打折扣。这些黑市买来的数据大多过期失效,再或是对同一份数据进行稍加修改,反复售卖。少部分数据虽然来源真实,但还是存在实时性较低,数据标注质量不高等情况。在人工智能应用中,包括图像识别、语音识别、动作识别等领域都需要对数据进行精准标注,高质量的标注数据决定了人工智能建模的效率[2]。
2.2 算力受限
算力,也称作计算力,顾名思义就是设备的计算能力。例如,对数字货币而言,算力是衡量在一定的网络消耗下生成新块的单位的总计算能,能够处理的数据量越大,也就意味着算力越大。
算力是人工智能发展的技术保障,是人工智能发展的动力和引擎。人工智能的开发和训练需要大量的图片、视频以及训练场景的导入,运算量庞大、过程繁琐,需要高配置的CPU、GPU、FPGA等硬件资源。例如,谷歌公司的AlphaGo使用的TPU,类似与GPU的一种算法芯片,能耗功效比极高,训练AlphaGo需要的算力相当于大约12,000块市面上常见的消费级1,080TI,至少千万级别的开支。庞大的配置开销对于大部分中小型企业来说难以负担,从而引起算力受限的现象发生[3]。
人工智能对计算的需求非常高,因此对高性能计算定制深度学习芯片的要求很高,意味着很多企业要花很多钱买算力、建很多计算中心,造成了很大的资源浪费。目前,提高人工智能算力的途径只有购买机器和租用机器两种,而这两种途径本质上是算力的购买和租用,为此需要付出相当高的费用。
2.3 算法匮乏
人工智能的基础为算法,它的高速发展离不开基础研究的突破性进展,算法的更新是人工智能进步的最大推力。
我国在人工智能领域前景一片向好,创新创业氛围活跃、专利论文发表的数量已位居世界前列,应用性研究中的语音和人脸识别也已跻身国际第一梯队。但由于我国人工智能的发展起步略晚,发展时间短,导致人工智能领域专家匮乏、人才培养方面明显落后,使得人工智能核心算法缺失。许多打着人工智能招牌的投资者、创业者还是聚焦在人工智能的初级应用层面,在基础理论、核心算法等领域与国际水平仍有较大差距,存在许多不足。
2.4 技术滥用
人工智能技术若得到合理的使用和管理,将对人类探索世界、改造世界带来很大的帮助。但如果人工智能技术被不法人员滥用,就会带来安全问题。
在用户和算法的共生关系中,人类处于被动地位。例如,手机经常会提示你离家或是离公司有多远,频繁提示你是否开启定位功能。再或者是智能算法向用户定向推送广告、新闻、内容的事件每一天都在发生。
另外,黑客可能通过智能方法发起网络攻击,智能化的网络攻击软件可以通过自我学习,模仿计算机系统中的各种行为,并适应网络环境,不断进行升级,长时间滞留在网络系统中;黑客还可滥用人工智能技术非法窃取私人信息,造成网络治安混乱;通过根据用户不同的认知,定制不同网络内容供其阅读,人工智能技术甚至会被用来左右和控制公众的认知和判断。单一企业掌握数据后,如果将数据违规转移至其他模型中,以算法作恶,损失的将是消费者的使用体验甚至利益和安全。
2.5 隱私泄露
通过人脸识别、智能推荐、智能信用评估等技术的应用,使人们感受到人工智能为生活带来的诸多便利,但大多数人工智能技术首先需要获取用户的个人信息再实现具体服务,这就加大了信息泄露的风险,用户可能在不知不觉中就被曝光了隐私。
2019年英国广播公司曾报道,IBM在未经用户同意的情况下,在图片分享网站Flickr上获取了大约100万张照片,用于训练其人脸识别算法。对于技术公司而言,这些照片的价值不言而喻。庞大的图片数据集有助于将人脸识别算法训练得更加精确,从而可以快速地从不同照片或不同场景中识别出某个用户。然而,那些照片上的人,大概没有想到,自己的肖像数据就这样被技术公司收集,个人信息就这样被泄露。以上事例说明,人工智能应用需要以海量的个人信息数据作支撑,海量信息数据对于人工智能迭代升级是不可或缺的。人工智能技术的进步,需要获取、存储、分析海量信息数据。但在获取、处理海量信息时,个人隐私极易以数据的形式被存储、复制、传播,如个人身份信息数据、网络行为轨迹数据以及对数据处理分析形成的偏好信息、预测信息等。
可以预见,在不远的未来,越来越多的人工智能技术将出现在人们的身边。在给人们生活带来便利的同时,也会被轻易获取更多有关个人隐私的数据信息,潜藏着不容忽视的隐私泄露风险。
3 区块链在人工智能领域的探索
区块链技术是以网络技术为基础发展起来的一种综合型技术,它的去中心化、不可伪造、全程留痕、公开透明等优点,为科技发展奠定了坚实的信任基础。在互联网技术的安全领域之中发挥着强大的作用与优势,为促进实现全球网络的共享共治、处理数字世界和现实世界关于用户隐私保护、能源粗放使用等问题的矛盾提供了新思路。
区块链技术的出现给人工智能存在问题的解决带来新的契机,随着区块链技术不断深入研究,研究者们利用区块链技术的优势,对人工智能技术发展中存在困难进行改善,并取得了较好的成绩,为我国科学技术的发展提供了一个全新的模式。针对人工智能领域痛点,以人工智能的数据、算法、算力为基础,搭建了基于区块链的人工智能技术应用架构,如图1所示。
3.1 区块链有助于人工智能获取更全面的数据
人工智能技术的进步取决于不同来源数据的可用性。尽管像谷歌、脸书、亚马逊等公司可以访问大量数据源,这些数据可以证明对许多人工智能流程有用,但市场上无法访问这些数据。区块链重心在于保持记录、认证和执行的准确,旨在通过引入点对点连接的概念来解决数据垄断的问题,它以去中心化的方式,对大量数据进行组织和维护,用户控制自己的数据,改善数据难共享及科技巨头垄断数据的现状。
为打破人工智能技术数据垄断搭建的基于区块链的数据共享平台模型包括四个部分:数据提供方、数据源、去中心化数据共享平台和数据需求方(此为人工智技术研发需求),如图2所示。
数据提供方指的是拥有数据所有管理权限的个体或机构,例如科研机构、政府、拥有数据管理权的科技巨头等;数据源代表具备数据库管理系统基本功能,且能够提供远程数据访问的计算机、中心服务器或云服务器等,它包含了由数据提供方用于共享的数据;去中心化数据共享平台是基于区块链网络信息数据沟通平台,它的更新和信息记录由分布式主体共同交互完成,并非由某个权威机构执行[4]。
由于区块链是一个开放的分布式链表,因此网络上的每个角色都可以访问这些数据。在该模型中,数据提供方通过去中心化数据共享平台发布数据,构造信息流起点。根据需求,人工智能研发机构可以通过检索、查看数据质量评价、发布数据订阅需求等。最终需求方和提供方可以在平台上进行数据权限可信、透明、平等的共享交互。通过区块链激励机制维持生态圈模型的正常运行,有助于营造良好的数据共享生态环境。
基于区块链的数据共享平台实现数据共享和溯源,促进跨机构数据的流动共享,形成一个自由开放的数据市场,让人工智能技术的研发可以获取更加全面的数据,进行大量训练,真正变得“智能”。
3.2 区块链帮助人工智能共享算力
全球范围内的大多数普通计算机的算力都处于闲置状态,如果能够把这部分算力利用起来,就可以极大地降低人工智能建模的成本和提高资源利用效率。而区块链的分布式特点,可以充分利用分布在世界各地处于闲置状态的算力,有助于构建去中心化的人工智能算力设施基础平台,转变传统的不断提高设备性能以提高算力的思路并降低企业的运行成本。此外,通过区块链的智能合约,根据用户所需的计算量对网络计算节点进行动态调整,从而提供弹性的计算能力以满足用户的计算需求。如图3所示,人工智能研发机构利用海量数据并将深度学习模型提交至基于区块链的算力共享平台,并根据每个节点设施能力来分配相应算力对人工智能模型进行训练。
近几年来,基于区块链的人工智能算力共享逐步热了起来。以深脑链为例,深脑链把分布式挖矿与人工智能结合,将大型GPU或者FPGA服务器集群、中小型企业闲散的空余GPU服务器以及个人闲置GPU作为计算节点,利用区块链技术通过共享算力,让人工智能神经网络运算可以去中心化分布在全世界海量节点之上,通过发行深脑币及闲置计算资源再利用达到低成本,运用海量数据节点进行动态计算,为人工智能提供算力供给。虽然每个设备的算力很小,但是当设备的数量达到一定基数时,其累计起来的算力也是巨大的。
3.3 区块链协助人工智能算法搭建研究平台
导致人工智能核心算法匮乏的主要原因有三个:一是相关技术人才匮乏;二是人工智能的开发耗时耗力,需要大量数据进行训练,同时如果出现错误,无法及时修复;三是大多人工智能算法研发不对外公开,导致技术出现重复开发现象。
在加强专业人才培养的同时,可以借助区块链技术打造人工智能算法研究平台。该平台旨在利用群体智慧优化人工智能算法。一套复杂的人工智能算法由多个人工智能专家更新维护,不再是由一家研究机构决定,这对人工智能算法的准确性有了极大的保障。各国各地的研究人员,尤其是基础稍弱的发展中国家,可以在区块链上使用公开的人工智能模型,再在基础上进行优化,无需再次开发、浪费不必要的人力资源。
3.4 区块链可以帮助人工智能搭建可追溯的算法监管架构
中心化商业模式下的人工智能算法,其难以达到完全的公开、公正,并可能会出现技术滥用的现象。但若将人工智能算法处理数据的每个环节全部记录至区块链,使其可追溯且不可篡改,并将人工智能模型加密计算上链后相对透明避免作恶,或可以让部分人工智能的行为全程处于监管之下。这将帮助人工智能搭建可追溯的算法監管架构,防止人工智能技术的滥用及霸权。图4中展示了人工智能技术应用的追溯流程图,人工智能技术应用主要分为四个阶段,包括人工智能技术准备阶段、人工智能技术训练学习阶段、投入使用阶段和面向对象使用信息阶段。
(1)人工智能技术准备阶段。人工智能技术开发所需要准备基础数据,在区块链平台上记录材料的相关数据,包含技术开发商、开发人员、开发时间、数据提供方信息、数据的类型、得到数据的时间等,将这些信息录入到区块链平台。
(2)人工智能训练学习环节。技术开发方将人工智能神经网络模型训练学习过程中利用及产生的数据和硬件设备信息记录到区块链上,经各节点确认后,这些数据将会永久的保存在区块链上。
(3)投入使用环节。人工智能技术通过用户需求分析进行后台分析计算,为了更好地追溯人工智能技术应用及数据流向,不仅仅需要将后台数据上链,同时还需要记录面向对象的信息和需求、计算过程中利用和产生的数据信息、运营商信息等。在这个环节,需要将基于人工智能技术的平台搭载到区块链平台上,实现数据实时记录,在数据流动的同时,同步接入到区块链平台,从而实现对数据、技术的跟踪。在区块链的数据层,采用公私钥非加密对称技术,无论是平台还是业务需求方都拥有自己的公私钥对,这在一定程度上保障了信息的安全可靠,出现问题时可以快速查询出是哪个环节的问题。
(4)需求方。对需求方在平台得到需要的数据后的进一步处理,也需要提交到区块链中,更好地防止了技术的滥用。
将人工智能技术应用的各个阶段产生的数据利用区块链的智能合约上传至区块链平台,营造可追溯、不可篡改的信息流。
数据、算力、算法是人工智能发展的三大要素。人工智能的发展离不开海量数据和强大算力。如果使单一商业机构握有大量数据、雄厚研究力量和算力资源,在信息技术领域就获得相对垄断的优势,增加了作恶的风险。区块链建立了新型治理架构,使操作记录和认证取决于多个机构,可以限制算法权力滥用,从而可以帮助更多科研机构或者规模相对较小企业融入科学发展的大环境,促进其技术开发。
3.5 区块链为AI提供安全、可靠的发展环境
数据安全问题是人工智能进一步发展所遇到的障碍之一,如果开发者们没有提高所管理数据的安全性,那一旦数据被暴露,人工智能将会失去公信力,最终只能沦落为一个被美化后的科技。而区块链技术则可以极大程度上解决这个问题。
区块链的智能合约和智能交易机制,可以很好地发挥隐私保护和数据开放、数据融合功能,可使数据交易信息主体处于加密状态。同时,由于区块链记录的不可篡改性,也能方便人们对人工智能设备记录进行查询和监督,提升人们对人工智能的信任和接纳度[5]。
在数据至上的时代,人们可以从数据中提取很多有价值的信息。区块链及技术既能保障数据的安全,又能协助提取有价值的信息。因此,区块链对人工智能所存在的信息泄密问题的改善方面可起到至关重要的作用。
首先,区块链技术的不可篡改和可追溯性使得数据从采集、交易、流通,以及计算分析的每一步记录都可以留存在区块链上,任何人采用任何手段在区块链网络中,都不可以篡改数据、修改数据和造假,使得数据的可信性和质量得到一定程度的信用背书,有助于人工智能进行高质量的建模,从而使用户获得更好的用户体验。其次,区块链中的基于同态加密、零知识证明、差分隐私等技术使数据共享得到了隐私安全保护。
4 结束语
随着区块链技术和人工智能技术不断进步,两个技术在各领域都展示了不俗的优势,引起了各个行业对区块链与人工智能的融合技术越来越广泛的关注。特别是在信息共享、安全保密、监督透明、溯源确权和信任协作等领域。区块链和人工智能结合发展,可以产生更高的价值,不少的领域已将两者融合,例如数字版权、医疗行业、无人驾驶汽车等。
我国近年来人工智能技术虽然不断进步,但起步较晚,技术与发达国家还是存在一定的差距。而人工智能与区块链技术的融合可以为我国科技发展提供一个新的方向,但在此过程中会面临着许多的问题,例如技术本身还需优化、技术进入门槛高、相关政策法规还不够完善、应用场景还需继续拓展、相关科技人才缺乏等。为此,我国需要加强人工智能和区块链领域的人才培养、完善“互联网 +”利益机制、重视“人工智能+区块链”的基础设施建设等。
随着区块链与人工智能技术进一步的完善,学术界和产业界不断将理论转化为技术并落地应用,相信未来区块链与人工智能这两种技术融合将更加深入,应用场景会更加丰富。
参考文献
[1] 孟小峰,朱敏杰,刘立新,等.数据垄断与其治理模式研究[J].信息安全研究,2019(9).
[2] 程显毅,胡海涛,曲平,等.大数据时代的人工智能范式[J].江苏大学学报(自然科学版),2017, 38(4):455-460.
[3] 刘权.区块链与人工智能 构建智能化数字经济世界[M].北京:人民邮电出版社,2019.
[4] 苏雄业.基于区块链的大数据共享模型与关键机制研究与实现[D].北京:北京工业大学,2018.
[5] 刘曦子.区块链与人工智能技术融合发展初探[J].网络空间安全, 2018, 9(11):57-60.
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >