LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 行情分析 > 构建数据要素市场可能用到哪些技术?

构建数据要素市场可能用到哪些技术?

2020-04-27 Onchain分布科技 来源:区块链网络

日前,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》(下称《意见》)正式公布,这是中央第一份关于要素市场化配置的文件,而数据首次被正式纳入生产要素范围。

该《意见》强调:要加快培育数据要素市场,首先,要推进政府数据的开放共享,加快推动各地区各部门间数据共享交换;其次,要提升社会数据资源价值,推动各领域数据采集标准化;最后,要加强数据资源整合和安全保护,探索建立统一规范的数据管理制度。数据化不仅仅是指数据本身生产的大量扩展,更是指生产技术与管理方式适应信息革命带来的变化,这种变革能够提高经济中各个生产领域的生产效率,其结果是形成新的经济范式和组织形式,但同时也使得传统产业所蕴含的生产力得以释放。

一、数据要素市场面临的挑战

根据国家信息中心近期发布的《我国构建数据新型要素市场体系面临的挑战与对策》一文,数据作为数字经济时代的全新生产要素,其所具有的外部性、非结构性、非标准化、资源标的多变性、边际成本递减、规模报酬递增等特征,使得数据的权属界定、价格形成、交易流通、开发利用等各个环节均存在诸多待解决的问题和挑战。主要挑战包括:

(一) 数据统筹力度弱

(二) 数据立法待突破

(三) 交易市场培育慢

(四) 创新资源配置难

(五) 数据市场监管难

(六) 数据安全保障难

本文将从以上实际问题出发,重点探讨如何通过新型技术和治理架构帮助打破数据资源的共享壁垒?建立完善“政-政”数据共享、“政-企”数据开放、“企-政”数据汇集和“企-企”数据互通四个方向的数据要素流通公共服务体系。如何解决数据共享过程中,避免数据窃取、数据干涉、数据泄露等安全问题? 如何使用各种密码学技术,充分使得数据政策、隐私法、数据保护法等执行策略得到充分落地?

二、新型数据共享平台技术路线

在更大范围的数据共享和协作背景下,政府内部数据、企业数据以及更大范围的社会数据,无法简单地使用数据归集方案,而是需要建立一种“松散”、“轻量”便于多数据源集成的数据交换平台。

新型数据信息共享平台(以下简称数据共享平台)技术路线需要充分考虑到各数据源实体对于数据安全的顾虑,同时,伴随着国家对个体数据隐私的保护机制日趋完善,整体解决方案需要考虑为用户数据确权和安全保护提供相应的技术手段。在整个数据生态建设过程中,如何让各个数据源有一套标准协议和数据接入模块,帮助数据参与方快速接入数据生态,从而为构建繁荣的数据生态提供良好的技术基础设施。

为此,方案提出了一套基于底层区块链和分布式数据治理框架协议DDGF的技术架构,对数据共享过程进行标准化、规范化,并对数据协作及流通过程进行存证,能够进行回溯,保障数据源及提供者的权益,从而有效连接上下游数据参与方,构建共享的数据生态体系。在此基础上,还将利用联合分析计算,可信执行环境TEE(Trusted Executive Environment),零知识证明技术,在保护数据安全和个体隐私的情况下,进行安全地数据联合分析和计算,如小微企业/个人客户信用评级、黑名单信息共享等。

在这套技术方案中,也同时为数据治理方、监管方提供了完整的技术管理手段,数据监管方可以根据数据市场准入备案制度对数据交易参与方进行管理,包括参与方准入、链的治理、监管规则制定,从而可以确保数据授权和数据交易符合国家政策法规和监管要求。

三、什么是DDGF协议

DDGF(Distributed Data Governance Framework)协议,全称是“分布式数据治理框架协议”,由国内区块链科技公司——Onchain分布科技提出,是以上技术路线的具体实现,该协议基于底层区块链,通过统一的数据开放标准连接了各个业务数据源,支持让数据主体(企业&个人)通过安全可控方式对所拥有的数据进行“确权”,每一个数据协同动作和授权行为会被记录进区块链。平台方则负责保障数据交换过程中的用户授权和数据交换安全可控。

DDGF协议是如何保护数据的?

DDGF协议支持不同数据源采用不同的数据存储方式,协议通过将元数据(Metadata,是描述其它数据的数据)和数据分离的方式将数据提供给数据需求方。所有原始数据通过加密方式提供给数据需求方,对应元数据中定义了对应原始数据的数据格式。协议定义了统一的元数据格式协议,可以支持数据库、Kv(Key-value)数据、二进制数据、JSON数据等等,并可以和大数据平台无缝集成。

整个数据获得流程如下:

数据需求方获得数据主体授权

数据需求方请求对应数据的元数据

数据需求方提出对实际数据的请求

数据需求方基于元数据的格式定义解析对应原始数据。

为满足不同数据源的部署方式,所有数据源中的原始数据必须首先经过数据脱敏后才能交付外部数据访问。

四、如何利用区块链技术?

区块链是点对点通信、数字加密、分布式账本、多方协同共识算法等多个技术的融合,链上数据具有不可篡改、可溯源的特性。从建设数据要素市场的技术支撑角度,区块链是一种基础设施,具体可以起到如下作用:

1) 建立开放、透明的数据流动监管体系

区块链实现数据共享平台全流程管理与监测,对各参与主体进行身份管理,为数据共享平台各个环节的履职与追责提供数据证据。同时基于分布式的架构,实现数据的多方存储与维护,防止技术上、人为上的数据干预风险,保证数据共享平台对数据监督的有效性与客观性。

2) 建立统一的数据目录共享,消除信息孤岛

通过区块链技术,可以实现去中心化数据共享模式,解决了数据不公开、数据未集中、获取难度大等行业痛点,通过去中心化的方式有效降低了实现大一统集中化系统开发成本,并保护了各个机构、部分和子系统的隐私和数据运营的利益。本方案提出基于区块链及智能合约技术实现分布式架构的数据信息共享平台(以下简称共享平台)的技术方案。

通过基于区块链的数据目录共享,可以在不做数据整体物理迁移的情况下完成数据的开放和流通,有效整合分散异构的数据资源,快速消除“信息孤岛”。

3) 建立数字身份和可信数据凭证体系,链接多样身份信息系统

在信息化时代,传统的实体身份在数字世界也有了对应,一个人或物在不同的系统中可能具有不同的数字身份标识。例如,一个人的银行账户、微信账号、学号、工号等刻画一个人的身份的不同标识是分散在不同的系统中,这些系统构成了一个又一个信息孤岛。每个人的身份标识均是由不同系统分配的,身份管理必须借助于这些独立的系统。区块链技术为实现一个自主管理、分布式安全的数字身份和可信凭证体系提供了技术支撑。

分布科技制定了基于区块链身份管理系统的一整套规范。我们所说的凭证,通常指对某个实体的背景知识的认证,例如实体的名字、身份证号、家庭住址、大学学位等等。凭证工作组致力于研究互联网上凭证的存储与交换系统的设计。凭证工作组还制订了一个去中心化身份标识系统——DID(Decentralized Identifiers)的标准,该标准指定了标识符生成算法应满足的条件,标识符描述对象DDO(Digital Data Objects)需要具有的属性和可选属性等。在DID标准中,最重要指定了持有标识符的用户的公钥列表以及标识符控制规则。可验证声明工作组致力于定义可验证声明的数据模型,如声明的标识、声明类型、声明本体、声明签发者、生成时间、过期时间等。

4) 构建数据确权和登记系统

在数据流通中可利用区块链构建数据映射和确权体系,为数据生成唯一的数字身份ID,所有数据在分布式协作网络中的流动均需要使用数字身份ID进行明确的确权。数据提供方将共享数据的元信息登记上链(元信息——Meta Information,是一种关于信息的信息,用于描述信息的结构、语义、用途和用法等),并使用数字签名进行数据授权,授权记录和数据访问记录被永久记录在区块链中。

五、可信计算环境TEE方案

在很多情况下,为支持更复杂的数据分析,数据需要在归集条件下进行分析计算。为解决安全问题,我们将引入基于可信执行环境(TEE——Trusted Executive Environment)技术的安全计算平台,在不泄露业务源数据的情况下完成计算任务。

可信执行环境是主处理器的安全区域,它保证装载在内部的代码和数据在保密性和完整性方面受到保护。TEE作为一个独立的执行环境,提供了一套完整的安全特性,如执行的独立性、使用TEE执行的应用程序的完整性以及它们数据的机密性。

在我们提出的解决方案中,金融机构的私有数据和科技公司的算法都将被加密并传输到平台上,然后在TEE环境中进行计算,最后将结果传输回应用程序端,并消除TEE中的所有内容。

TEE可以保证所有的计算过程,无论是数据还是算法,都不会被外界窃取或篡改。运行时,代码和数据的真实性都可以通过可信硬件进行验证。

六、用户自控的数据容器技术

用户自控的数据容器(User-Controlled Storage)技术支持了用户(数据主体)数据的收集、存储等各个环节的安全性要求。通过区块链让用户数据的授权、交互行为数字化、可追踪、可审计。

在用户自控的数据容器中,数据全程加密,并基于分布科技的Trustless安全通讯框架的技术保障用户私钥安全和数据存储安全。同时,通过各类密码学技术(如门限签名、零知识证明等)来灵活设计对账户的授权控制和最小化隐私暴露。

数据存储、授权、访问的全流程在链上存证,通过区块链“智能合约”技术设计了DToken. 类似于互联网协议中的oAuth协议(Open Authorization), DToken能指定数据资源, URI(Uniform Resource Identifier), 有效期, 状态等等。所有的数据协作行为可以被记录到区块链, 从而可以被追溯和审计。

七、典型案例参考

“贵阳身份链”基于分布科技区块链底层和DDGF协议构建,为贵阳老百姓建立了一个统一、多维、可信的身份管理体系,身份链通过为“人、财、物、事”创建数字身份来实现对场景数据的“穿透式”监管,并实现可信数据的互联互通。自2017年以来,“身份链”持续安全稳定运营,成为贵阳市的一个数字信用名片。“贵阳身份链”是新型数据治理模式的一个应用案例。

作者:肖旻

资深区块链解决方案专家

长期专注区块链,供应链金融,支付,Fintech/创新金融科技,曾在银联数据、国内大型支付机构、专注外汇的初创金融科技公司工作。

微信:wx1489968049

知乎:肖旻FINTECH

END

—-

编译者/作者:Onchain分布科技

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...