关键词:
区块链
数据跨域
数据共享
数据流转
融媒体
摘要:
预计到2025年,全球将产生高达180ZB的数据,这些数据蕴含着巨大的价值,能够帮助企业洞察市场趋势、优化运营流程、提升决策水平。然而,由于现有的企业信息系统大多集中部署,数据通常被存储在互不兼容的孤立存储库中,从而导致数据碎片化严重。这不仅在企业间形成了壁垒,阻碍了协作,而且还使得数据共享和融合变得困难。如果能实现数据的跨域共享和流转,将有助于促进不同组织机构之间的协同和创新,释放数据的真正价值。尽管如此,在数据共享及流转过程中,仍然面临着权益控制困难、侵权行为隐蔽和全程监管缺失等挑战。现有基于云的数据共享平台通过结合基于属性的细粒度访问控制方法来确保数据的安全性。然而,随着更多的业务系统接入,访问策略管理变得越来越复杂,数据泄露和滥用的风险也随之增加。更重要的是,由于云平台无法对共享后的数据进行独立监控,这进一步增加了侵权风险。区块链的分布式特性、链式结构的数据验证和存储,以及基于共识的严格数据更新,推动了其在多个利益相关者的无信任场景中的应用,尤其是在数据共享场景中。结合区块链,可以在保护内容版权的同时实现跨组织的数据共享和流转。
本文主要关注数据跨域共享及流转领域的核心问题,对基于区块链技术的解决方案进行了深入研究。通过提出跨域身份认证、分区访问控制和可溯源共识等关键技术,旨在构建一个安全且高效的跨域数据共享和流转模型,以应对数据共享中的各种挑战,并推动数据的跨域流通和利用。本文的主要研究工作如下:
(1)去中心化身份管理和认证方案。为了解决传统基于CA证书的身份管理/认证需要建立共同的证书信任链,而大型组织普遍存在异构的自建CA问题,提出了一种基于跨域组织的分布式身份管理架构和认证协议,旨在建立数据共享的信任基础。该架构允许域组织成员与一个分布式身份注册表关联,该注册表由多个域组织组成的联盟所管理的共享分类账来维护。域组织成员在该注册表上拥有去中心化的身份,并且可以获得保护隐私的可验证凭证。认证协议能够在域组织成员之间安全地共享身份并验证他们的成员关系,且无需修改现有的公钥基础设施架构,从而支撑数据的确权和受控使用。
(2)分布式访问控制方案。大量的跨域交易在数据流转中频繁发生,如果仅依赖单一区块链,由于整个账本对所有组织都可见,将会对数据保密性构成威胁。因此,提出了账本分区和加密的方案以保证数据的可控使用。通过账本分区算法,将具有相同访问策略的数据类划分到同一个子账本中,确保只有对应属性的参与者才能访问该子账本。同时,通过交易写集分组算法确定需要加密的数据类,对这些数据类进行属性加密。随后,通过交易的跨账本提交协议,将加密数据提交至对应的子账本中。这样,只有具有读取权限的参与者才能查看数据对象的明文版本,其他参与者只能看到加密版本,从而实现数据全流程的细粒度权限控制和流转管控。
(3)追踪数据跨域流转过程的共识算法。为解决现有共识机制在支持数据跨域流转管控、全流程存证与违规溯源方面的不足,设计了一种追踪数据跨域流转过程的共识算法。具体而言,该算法将数据流转过程中的所有操作交易转化为一系列有序的命令条目,并将它们记录在命令日志中。经过背书节点的共识验证后,这些命令条目将被安全地存储在MPT树中。通过树根哈希值,这些命令条目与背书节点的区块链账本紧密关联,从而确保命令日志的完整性和防篡改性。相应的交易也将被提交至各分区账本,以供授权参与者进行查询。通过背书节点中的命令日志和MPT树,可以追溯数据在各个环节的操作记录,实现对数据流转的全历史追踪。此外,还提出了一种构建可追溯性图的方法,能够清晰且快速地向数据所有者展示共享数据的整个流转和交互过程。这不仅实现了数据流转的全流程存证与审计,还能进行违规溯源,更好地保障数据相关方的权益。
总之,这三种解决方案相互关联,共同构建了一个安全且高效的跨域数据共享和流转的技术体系。在融媒体平台上进行的实际应用表明,提出的基于区块链的跨域数据共享及流转方案能够支持万级用户、10种以上类别和亿级数据。该方案实现了数据确权、流转管控、权益控制、取证溯源等功能,有效地提高了数据共享的效率和安全性,具有实际应用价值。