首页 > 区块链 > 正文

区块链 分布式存储≈超跑 高速公路​

分类:信息四电老陈四电老陈 2020-12-15 20:35

  4月4日,网络安全公司UpGuard的研究人员声称,他们在亚马逊云计算服务器上可公开访问的地方发现了数亿Facebook用户的个人信息记录,这一发现表明,在剑桥分析公司(Cambridge Analytica)的丑闻曝光一年之后,Facebook在保护私人数据方面仍做得不够好。其实,不仅仅是Facebook,哪个社交媒体能保证自己的社交软件不会泄露个人隐私呢?

  面对日趋严峻的隐私数据泄露形势,作为互联网用户的我们决不能再抱着看客的心态。那么,近年来大热的得到技术界人士认可的分布式存储,到底能不能拯救这些被集中的数据呢?下面,我们就来了解一下中心化存储与分布式存储以及二者之间的区别。

  一、中心化云存储

  区块链 分布式存储≈超跑 高速公路​

  传统的云存储方式使用中心化服务器存储数据。自2006年亚马逊推出AWS并获得成功后,各大云服务平台如雨后春笋般相继诞生。短短数年间,大多数数据都存储在了少数几个云平台中,这就导致数据存储出现严重的中心化,由此产生了各种各样的隐患,目前主要表现在4个方面:

  1. 成本较高:固定成本不变甚至逐渐增加,使中心化云服务价格较高。另外,在不同中心化云存储平台之间的数据迁移成本也居高不下。

  2. 数据传输速度慢:中心化云服务器机房通常位于偏远地区,距离实际用户很远,使其数据传输速度较慢。

  3. 安全性低:在物理位置上,中心化云服务器集中在一处或几处,一旦发生停电等故障,往往会导致大量相关业务瘫痪。此外,中心化云服务器发生故障也有使用户数据彻底丢失的风险。

  4. 隐私泄漏:网盘的管理员可以从服务端的平台中直接查看和删除用户上传的文件,用户的隐私容易发生泄漏。

  二、分布式云存储

  从本质上讲,分布式云存储网络的工作方式与中心化存储方式类似。但数据不是在单个公司的服务器上存储数据,而是通过分散的网络进行加密和分发。这意味着除了数据所有者之外,没有任何一方可以访问数据,这使得分散式方法成为目前最安全的云存储解决方案。

  分布式云存储网络可能使用数百万台服务器设备而不是数百或数千台。这意味着存储的可用性通常要高得多,并且存储数据的成本要低得多。通过分布式云存储网络,需要额外存储容量的各方可以更安全,更透明地存储数据,以实现更低的价格。同样,超额存储容量的所有者可以通过以前闲置的硬件赚钱。

  说到分布式存储就不得不提IPFS协议。IPFS(The InterPlanetary File System)是一种点到点的分布式文件系统,一个传输协议。IPFS项目通过整合已有的技术创建一种点对点超媒体协议,致力于实现互联网中的永久可用,数据可以永久保存的全球文件存储系统。IPFS可以作为存储解决方案,因为它提供了更加便宜、安全、稳定的存储解决方案。

  分布式存储的出现得益于云原生应用的发展以及存储硬件的持续演进和优化。随着云计算和互联网 的发展带来了海量数据的爆发,企业亟需更为高效的网络存储系统;与此同时,以闪存为代表的新一代存储介质出现,使文件、块、对象三种形式的存储进一步融合,在此背景下,更为贴合企业用户需求的分布式存储应运而生。

  得益于较低的拥有成本、灵活的扩展能力、线性增长的性能、统一的资源池管理等诸多先天优势,分布式存储逐步替代了传统网络存储,成为有效处理海量业务数据的利器。目前分布式存储系统已经在全球范围内得到广泛认可,相比与传统存储系统,其应用优势如下:

  1. 高性能:分布式存储可以高效地管理读缓存和写缓存,并且支持自动的分级存储,通过将热点区域内的数据映射到高速存储中,以提高系统响应速度。

  2. 分级存储:允许高速存储和低速存储分开部署,或按任意比例混布,在不可预测的业务环境或者敏捷应用情况下,将存储效益发挥极致。

  3. 多副本技术:分布式存储采用多副本备份机制,并使用镜像、条带、分布式校验等方式满足用户对于可靠性不同的需求。

  4. 容灾与备份:分布式存储支持多时间点快照备份,可同时提取多个时间点样本同时恢复,降低了故障定位的难度,结合周期增量备份机制,确保数据安全高可用。

  5. 弹性扩展:得益于合理的分布式架构,还可预估并弹性扩展计算、存储容量和性能,扩展后旧数据会自动迁移至新节点,实现负载均衡,避免单点过热。

  总之,分布式存储在架构、灵活性与成本方面的独特价值为企业用户应用提供了更好的解决方案。

  区块链 分布式存储≈超跑 高速公路​

三、分布式存储的区块链系统

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  区块链 分布式存储≈超跑 高速公路​

  而一个提供数据存储的区块链系统除了需要覆盖以上三个属性之外,由于其提供了存储属性,为了确保存储的状态未来也可以对条件进行制约,需要在其操作码上进行判断逻辑的添加,以保证将存储产生的状态、数据支持的状态都能在链上得到追溯,这就是我们需要对提供存储的区块链系统进行特殊设计的原因。

  具体而言就是,区块链是需要对特定条件下的数据状态进行维护的,状态被保护起来才能保证交易正确之后状态相应改变了。那么如果分布式存储的状态没有通过相应的设计与区块链系统结合的话,就会出现自动执行的一个空隙,如果状态的空隙被人利用的话,就会出现存储过程状态提前被记录,或者滞后被记录,这会影响到区块链系统中账户余额,也就是产生了系统不安全的空间。

  因此,提供分布式存储的区块链系统和一般公链系统不同的部分主要就体现在「状态」这部分,记录某些状态并作出账户上的反馈。

  另外,存储相关状态也使得智能合约可以及时获取状态,从而可以设计出一个能够使用外部数据的子账本,这样在工程上能更好的流程化,也会降低用户由于预言机导致的链上资产损失的可能性。

  四、分布式存储系统的设计和挑战

  分布式存储系统的设计主要解决三个问题:文件如何安全放入;文件如何安全存储;文件如何不被存储提供方「偷走」。

  1.文件如何安全放入

  把数据在客户端上传前做加密和分割,通过分布式存储的分发方式上传到存储提供方的空间内,通过相关的存储心跳检测来保证在用户需要数据的时候可以完整的取回。

  在整个过程中,用户的数据在本地就已进行加密,用户不需要担心数据被偷窥以及存储提供方没有承担明文存储的风险。

  2.文件如何安全存储

  根据分布式存储的冗余存储原理,一般来说对应一个资源,如果要保证任意两个节点(N=2)掉线依旧不影响系统可用性,就需要维护2N 1个资源数。也就是说一份文件需要存给5台服务器。

  按照12个节点为一个批次的设计,那么任意5个节点掉线是不影响可用性的,但是如果遭遇重放攻击,也就是加密后资源被不合理地配置,攻击节点是可以通过某些方法来阻止文件被安全召回的。这就需要对分发方式进行设计,来保障安全的存储。

  此外在存储期间,可以通过相关的评分系统对节点质量进行评分,保证除了共识节点之外提供分布式存储服务的节点的质量。

  3.文件如何不被存储提供方「偷走」

  首先,数据是在用户本地机器上的客户端加密的,这样确保了上传之前的文件已经被加密,存储方是无法看到用户数据的。其次,在冗余存储的部分,每个存储提供方的通信目录中不会包含所有的文件碎片存储方,这样也一定程度上防止了共谋的可能性。

  在解决了以上这三个问题后,该系统就能够被称为一个安全的分布式存储系统,可以提供分布式存储服务了。

  在整个过程中,设计一个合理的分布式存储可取回校验方式是比较大的挑战,它的要求不只是通过问询达到返回结果的可靠,还要通过特殊方式预防重放攻击试探以及攻击,提高存储系统的可用性。

  5. 提供分布式存储的区块链系统的设计和实现

  提供分布式存储的区块链系统主要面向两个对象,一是节点,通过提供存储参与分布式系统的建立,其参与的程度、节点质量的好坏主要反映在提供的存储上;二是使用者,通过智能合约获得存储的状态,并进行账户的收转账。

  那么需要建立一个体系,在这个体系中,节点的存储质量决定了节点能否获得更优的收益,使用者可以在智能合约中使用存储的状态。该系统的特殊设计主要在两个部分,一个在技术部分,主要是解决使用功能性的问题;一个在治理部分,主要解决分布式服务供给方质量的问题。

  从技术的角度,支持分布式存储的区块链系统需要的是对存储状态的更新,以及方便使用,所以需要在原有的虚拟机基础上,增添相应的操作码以及对应的状态逻辑,保证联动时不会造成状态泄露。

  从治理的角度,由于使用了存储这种低功耗的资源,那么在共识上需要对PoS做修改,使用混合共识,节点除了抵押链上资产,还需要对存储系统进行相关的贡献才能出块。

  这样做的好处是:由于存储本身无法产生特别大的收益,那么通过出块收益来补贴提供较大贡献的节点,能够激励节点提供稳定的存储。如果节点达不到出块标准,也可以通过共建出块节点的方式在链内部参与到节点建设中,保证可信任的抵押出块节点能够在出块的列表内。

  除了上述两个角度之外,从经济模型的角度,需要在每一次存储量提升之后,通过帕累托分布对Staking条件进行微调,保证整个系统的抵押分布不会停滞在某一个存储阶段。一系列这样的调整和更新才能保证整个存储生态的正向发展。

  6. 数据的使用

  支持分布式存储的区块链系统能够提供安全的方法存储并使用每个人生产的宝贵数据,并保证用户对其数据的所有权。只有在此基础上,才能进而通过工具,让用户获得这些属于他的数据的价值。

  要实现数据的价值,涉及到如何对存储后的数据进行计算,以及将计算结果进行充分利用等等问题,需要借助于可信计算和更前沿的技术来实现,这是一个需要单独探讨的话题,本文将不做具体讨论。

  五、在现阶段,系统中的数据可通过如下两种方法

  1、智能合约。可记录状态的存储可以丰富智能合约的广度,智能合约在得到数据的支持后,能够产生新的用途,出现新的类型,进而可能带来全新的生态。

  2、跨链。该系统可为其他的区块链系统提供分布式的数据存储服务,也可以对其他区块链的链上状态进行相关的再处理。

  通过提供分布式存储的区块链系统,数据制造者可以维护自己生产的数据,这是一个开始,更进一步,数据制造者可以通过不同的的方法和渠道来实现数据的收益,与此同时,我们也可以通过这样的方式从机器人手中分享数据。

  一个拥有自己数据的所有权,并能够实现数据自由交易的未来,是一个值得为之努力的更好的未来。

  深圳第三届分布式存储大会

  分布式存储技术及应用

  区块链 分布式存储≈超跑 高速公路

上一篇:济南市发布区块链发展行动计划 望加快赋能实体经济

下一篇:朱小黄:很多区块链公司要么是傻子、要么是骗子

猜您喜欢
关于我们联系我们作者投稿APP下载