“AI改变生产力,区块链改变生产关系”,AI与区块链,这两个词汇都是近来最令人心潮澎湃的词汇。
简单地说,AI希望利用机器复制人类的智能,从而将人从各种复杂的工作中解救出来;而区块链本质上是一种新的数字信息归档系统,它在加密的分布式账本存储数据,由于抛弃了传统的中心化机构,区块链真有可能彻底改变目前以中心化公司为主体的社会经济体制。
区块链本质庞华栋:从BTC到区块链,近几年相关的讨论和观点层出不穷,区块链领域的创业风口也一直热度不退。那么区块链技术到底是什么?
数矩科技总裁庞华栋介绍,从技术的角度来讲,区块链就是分布式账本。这个“账本”的特点就是人人可参与、数据透明可溯源。它解决了两个关键问题:增加了信息的安全性以及降低了信任成本。
如果说互联网的出现连接了机器与机器,解决了机器与机器间的契约关系;人工智能让机器按照人的意愿做事情,解决了人与机器的契约关系;那我们不妨这样解释区块链:通过协作机制的设立最大程度的解决了人与人之间的契约关系。
简单来讲,区块链绑定个体之间的利益,使形成的相关群体达成一种共识,再利用激励机制促使群体高效合作。这就是区块链的本质。)
近年来,中国特别流行“赋能”二字,互联网+、AI+、区块链+……,各种“+”是层出不穷。这种现象在某种程度上的确反应了产业需求的变化和革新,但同时不可忽略的是,在很多时候,这已经沦落成强行蹭热点的营销手段罢了。
那么,问题就来了,作为当今科技圈内的当红小花旦,AI与区块链的结合究竟是强强联合,还是相互蹭热点?
我们不卖关子,答案就是“AI+区块链,强拧的瓜居然也很甜”。接下来,我们将对此进行详细分析。
人工智能的瓶颈
人工智能的三要素是数据、模型与算法、硬件计算力。很不幸的是,AI资源三要素需要很大的资金投入,对于众多的AI创新实体和个人来说,是难以承受的:
AI模型与算法需要较强的科研能力,这是高校科研机构和AI科技创新企业的强项,而数据和算力往往掌握在政府、计算中心和大公司手中。而上述三要素便是目前人工智能的三大瓶颈。
因此,区块链对于人工智能的意义其实就是打破这三大瓶颈。
1
数据共享
首先,就是利用区块链技术实现数据的共享。
我们大部分人都有大量的数据遗留在互联网上,这些数据是属于我们的,但在目前,这些数据大多都实际控制在了Google、Facebook等大公司手里,这些公司利用本属于我们数据赚钱,但赚到的钱却跟我们一点关系也没有。
而区块链则能够有效地帮助我们实现数据的产权确认,共享账本技术也使得数据在多方之间的流动将得到实时的追踪和管理。同时,利用区块链的激励机制,也能进一步鼓励用户分享自己的数据。
另外,个人隐私的泄露和数据版权的侵犯是影响数据共享意愿的最大因素,利用区块链及安全加密技术可以有效避免数据的泄漏,减除数据共享的顾虑:
1、Hash技术
採用SHA256等散列算法对涉及用户ID、手机号、年龄等用户信息的字段进行加密,可以在一定程度上保障个人信息的匿名。
另外,利用哈希函数对数据进行签名,还可以得知数据是否被篡改。
2、差分隐私保护
然而,研究表明,通过recordlinkage技术仍能发现Hash后数据中的用户id。例如,将VISA交易数据的卡号等信息hash后,花旗银行等发卡行仍能将自己的交易与VISA交易根据交易时间、交易金额、交易机构等明文字段进行匹配,一旦匹配成功就推测出真实卡号并间接获取该卡号在VISA中的所有交易。
为此差分隐私保护技术出现了。
差分隐私保护技术是为了允许研究者在不洩露用户隐私的前提下对一个数据集的用户行为进行分析而研究出的加密手段。利用差分隐私保护,研究者可以计算出用户群体的行为模式,但是对每个用户个体的数据却无法解析。
据了解,差分隐私保护核心思想是在数据集中加入随机性,在保证数据集的每个个体都不被洩露的情况下,数据的整体的统计学信息仍可以被外界了解。
3、不经意传输协议
考虑到这样的安全需求:Alice要从Bob那里接收信息,但出于隐私考虑,Alice不希望Bob知道她接收的是哪条信息。比如,网上购物,消费者不想暴露自己购买了什么某种药品等。
传统信息查询过程中,Alice将请求发送给Bob,Bob在收到请求后将相应的信息发送给Alice。在这个过程中,Bob是知道Alice的数据请求的。但是不经意传输(ObliviousTransfer,OT),使得服务的接收方以不经意的方式得到服务发送方输入的某些消息,这样就可以保护接受者的隐私不被发送者所知道。即Bob并不知道Alice的数据请求,同时Alice只拿到了自己请求的数据。
据了解,不经意传输协议的思路为:发送方Bob发出多条消息,执行协议后,接收方Alice将得到其中的一条或几条信息。发送方无法控制接收方的选择,也不知道接收方收到的都是哪些消息。而接收方也无法得到其接收消息之外的消息。
4、同态加密
同态加密是一种特殊的加密方法,允许对密文进行处理得到仍然是加密的结果。即对密文直接进行处理,跟对明文进行处理后再对处理结果加密,得到的结果相同。从抽象代数的角度讲,保持了同态性。
同态加密可以保证实现处理者无法访问到原始数据自身的信息。而这则解决了用户不敢将敏感信息直接共享或者存放在云平台上的问题。
目前全同态的加密方案主要包括如下三种类型:
a)基于理想格(ideallattice)的方案:Gentry和Halevi在2011年提出的基于理想格的方案可以实现72bit的安全强度,对应的公钥大小约为2.3GB,同时刷新密文的处理时间需要几十分钟。
b)基于整数上近似GCD问题的方案:Dijk等人在2010年提出的方案(及后续方案)采用了更简化的概念模型,可以降低公钥大小至几十MB量级。
c)基于带扰动学习(LearningWithErrors,LWE)问题的方案:Brakerski和Vaikuntanathan等在2011年左右提出了相关方案;Lopez-AltA等在2012年设计出多密钥全同态加密方案,接近实时多方安全计算的需求。
目前,已知的同态加密技术往往需要较高的计算时间或存储成本,相比传统加密算法的性能和强度还有差距。
2
算力共享
人工智能应用一般需要经历模型训练和模型推断两个阶段,其中模型训练过程需要消耗大量的计算资源。人工智能产品想要达到更好的产品指标,除了算法,就是需要海量的数据来进行训练,但是越多的数据,在同等计算资源的情况下,意味着更长时间的训练,比如超过一周甚至一个月到几个月是时间。而且如果训练过程中有参数不正确,还需要反复地进行训练,导致训练时间进一步拉长。显然,这对于企业产品迭代更新而言是极其不利的,很可能导致企业在行业竞争中失败。
因此,很多厂商不得不投入大量资金租用云服务,或者购置显卡(GPU)、FPGA等硬件资源自建计算集群。巨额硬件成本、电力成本以及维护成本对于大部分中小型企业来说,是一个难以承受的负担。
英国的一份AI工业分析报告指出,当前训练一个模型平均需要1万英镑,而复杂深度网络的训练过程则更为昂贵。因此,目前50%以上的人工智能公司都存在可用算力不足的问题。
而利用区块链为AI共享算力则不失一个解决AI行业算力瓶颈的方法。
利用区块链共享算力主要存在着以下两种思路,一是利用区块链的激励机制,共享社会上闲置的显卡等资源;二是试图改造BTCPOW挖矿机制,希望将目前浪费了大量资源的哈希挖矿变成对人工智能的训练。
1、关于将挖矿改造为AI模型训练
不管是pow挖矿,还是AI模型训练,都需要消耗大量的算力与能源。因此,将POW挖矿与及其学习模型训练相结合,似乎更加契合。
据了解,挖矿函数应该具有这样一些特点:
首先,函数具有单向性,即计算结果难度较高,但验证结果的正确性却很容易;其次,函数计算应具有一定强度,同时难度可以调整;第三,计算该函数时不需要传递大量数据,即不会给区块链网络带来额外带宽负载;第四,函数应具有公平性,也就是说,算力强的节点只是拥有较高概率获得奖励。
因此,对于深度学习,深度学习训练过程也确实具有单向性,不过,深度神经网络的训练难度很难预测,不容易控制,而且训练时一般需要传递大量的训练样本数据,网络传输压力很大。由此,深度神经网络的训练过程作为挖矿函数仍具有很大困难。
另外,马尔可夫链蒙特卡洛算法(MCMC)也是AI挖矿函数的重要待选算法,不过,虽然MCMC具有单向性,难度相对可控。但是,MCMC作为挖矿函数的缺点是在验证时需要传递比较大量的数据。
目前并没有看见特别出众的AI挖矿算法,但相信未来一定会出现合适但AI挖矿算法。
2、利用区块链激励闲置算力共享
人工智能对算力极度渴望,然而,市面上其实也有很多闲置算力没有得到充分利用,比如你的计算机在关机时的算力等。利用闲置算力进行宇宙研究等科学研究早已经有之,然而,由于没有足够的激励机制,这一直不成规模。
而区块链的激励机制正好弥补了这个短板。
而且值得一提的是,运用好挖矿变现这个激励机制,企业甚至有可能以相对于传统云计算更加便宜的价格获得需要的算力。比如,深脑链就计划每个挖矿节点的收入70%来自于挖到的DBC变现,30%是来自于用户训练支付费用。人工智能厂商只需要为30%训练支付费用买单。另外,另一家共享算力企业NebulaAI的矿机还可以开启双挖模式,持Sia,storj类型的共享币种挖矿。
不过,目前有相当一大批区块链矿机其实都是采用ASIC芯片进行挖矿,ASIC芯片会针对特定的挖矿程序进行优化,因此,相较于显卡等通用芯片其挖矿效率更高。不过也正因为如此,一般的ASIC矿机在报销之后其实也不能用于AI的训练,造成了巨大的浪费。
为了解决这个问题,BTM计划采用对人工智能ASIC芯片友好型POW算法,使得矿机在闲置或被淘汰后,可用于AI加速服务。
据BTM介绍,BTC矿机和人工智能深度学习具有可比性,它们都是依赖于底层的芯片进行大规模并行计算。深度学习算法绝大多数可以被映射为底层的线性代数运算。线性代数运算有两大特点:一是Tesr的流动非常规整且可预期;二是计算密度很高。这两大特点使得AI深度学习特别合做硬件加速。
BTM认为,如果在挖矿的哈希过程中引入矩阵运算与卷积运算,使得矿机对人工智能ASIC相对于显卡、CPU更友好,那么,区块链共识所需要的计算量同样可以应用于AI硬件加速服务,从而产生较大的社会效益:一方面,矿机市场会刺激人工智能市场,扩大对深度学习ASIC芯片的需求,正如目前GPU友好型PoW区块链,对GPU市场的促进作用;另一方面,被淘汰或闲置的矿机可应用于AI硬件加速服务,节省挖矿成本,形成双赢局面。
不过,有观点认为,Asic固化算法后丧失了通用算法作为PAAS(平台即服务)的能力,在区块链AI早期,过早限定自己的使用场景,并不一定是好事。
而在NebulaAI等企业则集中在显卡以及FPGA上,这些矿机只有一小部分算力会用于记账,而更多的算力则会用来做更有价值的AI计算。
3
模型算法共享
对于人工智能而言,算法模型亦非常重要,要知道,在此之前,人类已经经历了两次人工智能热潮,而之所以前两次热潮没有形成多大社会影响力,一个关键原因其实就是深度学习算法还没有成熟。算法模型的重要性由此可见一斑。
算法是逻辑的表现,目前的困境在于缺乏专家,一个博士生大概需要五年的时间培养,但是五年前还没有博士生开始从事深度学习,所以该领域的专家极度稀缺。
但利用区块链技术其实也可以解决这一问题,一方面,区块链中的每一个节点都可以为算法调参,即利用群体智慧改善现有的人工智能算法;另一方面,也可以构建AI算法交易平台,将最好AI算法共享出去,并获取收益。
比如,Cortex的主要任务就是在链上提供一批最好的机器学习模型,全球的机器学习从业人员都可以将训练好的相应数据模型上传到存储层,其他需要该数据模型的用户可以在其训练好的模型上进行推断,并且支付费用给模型上传者。而且值得一提的是,不少算法共享项目在共享算法的同时,其实还可以帮助算法的进一步升级。
另外,深度学习虽然已经取得了巨大的成就,但人们对它的了解却还是非常不足,知其然却不知其所以然,因此,不少人对人工智能依旧不放心。不过,利用区块链记录AI的每一步步骤,这有望帮助人们更好地了解人工智能的学习过程。
而且,人工智能与区块链智能合约的结合,还有望构成一个免人为干扰、可自动化执行的人工智能自治系统。而且值得一提的是,通过智能合约还可以限制人工智能只能执行某些动作,或许还有望避免人工智能的失控。
4
区块链的瓶颈
在经历了此前疯狂之后,2018年,区块链遭遇到了一泻千里的巨大打击。究其原因,主要在于区块链炒作得太过厉害,区块链的价值被严重高估。但与此同时,区块链在实际落地过程中的种种不足和瓶颈也的确拉了区块链的后腿。
总结来说,区块链的瓶颈主要体现在以下几个方面:
1、能源消耗。BTC等多个主流公链均采用POW挖矿机制,但其对能源的消耗是及其巨大的。如果把全部挖矿的计算能力折算为浮点运算,粗略估算的总体计算能力达到1023FLOPS,已经达到谷歌计算能力的1百万倍,或者全球500强超级计算机总体计算能力的10万倍。而以其消耗的电力计算,POW挖矿总用电量已经超过世界上160多个国家。
能源消耗方面,2017年6月百度的智能楼宇项目一个月内为百度省下了25万度用电量,谷歌旗下AI实验室DeepMind利用人工智能技术帮助谷歌削减了15%的用电量。因此,有理由相信,AI也能够为区块链找到更好的节能减排的措施。
当然,如果这个办法不起效,还可以就像前文那样,利用利用AI挖矿,将白白浪费的能源消耗转变为AI算力。
2、可扩展性。区块链的可扩展性一般指单位时间内能够支撑的最高并发交易个数。然而,相比于中心化机构,去中心化的区块链技术在可扩展性方面却有着天然不足。据了解,使用中心化方式验证交易的VISA信用卡的持续吞吐率能够达到1700TPS以上(VISA官网更是宣称峰值可达65000TPS),而BTC的吞吐率为3.3~7TPS,ETH略高,但也只有30TPS左右。区块链可扩展性的问题将是导致区块链应用欠缺最重要的原因之一。
也许AI能够为区块链项目扩容提供另一条捷径,而不是无意义的分叉。人工智能可以引入新的分散式学习系统,或者使用新的数据分片技术来提高系统的效率。
3、安全性。虽然区块链是去中心化的,本身的安全性是比较高的,但是在交易等环节,目前依旧是中心化的。例如MtGox交易所曾因为钱包的安全性漏洞被盗走3.6亿美元,直接导致交易所破产。
而且,智能合约的安全性也有待加强。智能合约作为区块链自动化交易的关键,其也难以避免又出现漏洞。比如,类似互联网上的钓鱼交易同样能够在区块链中发生,欺诈方通过在合约中埋下特定的陷阱或者钱包地址,实现合约的漏洞执行,此类交易是无法撤销。
我们可以引入人工智能(AI)模型,自动判断交易模型的合理性,并自动嗅探交易漏洞。另外,通过内置AI交易模型,在用户许可下,系统甚至可以自动拒绝不合理交易。实际上,人工智能在防诈骗方面,已经在银行和电商业务中已经得到广泛应用。当非正常刷卡交易发生时,银行会自动发短信提醒安全风险;当网购遇到假冒客服人员时,电商平台会自动提醒注意防骗。因此,人工智能也有望解决区块链的安全问题。
另外,目前正在蓬勃发展的对抗式生成网络提供了将合约和攻击放在统一框架之内进行全面优化的可能性。
MOAC星球交流社群开始招募啦,本社群目前下辖「人工智能」以及「区块链」两大专业社群。
欢迎对「人工智能」或「区块链」感兴趣的同学,在MOAC星球公众号对话界面回复关键字“交流群”,获取入群方式;
欢迎转发至朋友圈
为行业人提供有价值的产业内容
MOAC星球