胡凯:论数据开放_新华广播_新华网
https://vodpub1.v.news.cn/original/20200610/7991b45157dc4e12b4ea80fb25d9f0d8.mp3

胡凯:论数据开放

2020-06-10 11:17:23

     

北京航空航天大学计算机学院教授/北航云南创新研究院数字经济研究中心主任 胡凯

    在数字经济高速发展的今天,有人比喻数据是“未来的新石油”,有人把数据比喻为蕴藏丰富的矿脉。挖掘有价值的数据就好像在淘金。据权威资料统计,全球数据量在2020年可能达到惊人的40ZB以上,数据产业收入规模将达到 560 亿美元以上,80%的企业将会致力于提升其在所处行业的“数据”能力。数据成为人才、技术、资源之外的另一核心竞争力。数据化为生产要素和数据资产化成为了两大发展趋势,开放是主旋律,包括合法合规的权威无偿开放和有偿市场化开放。

    

    数据与其他生产要素和资产都有着显著不同,面临数据确权、存储、孤岛、定价、交易、合法、互通、融合、隐私、安全、保护、权利、追溯等复杂而敏感的特殊问题。“给我提供一些数据,我就能做一些改变。如果给我提供所有数据,我就能拯救世界”,这个业界呼声表达了对数据开放的渴望和蕴含的巨大经济促进作用,但数据如何开放?靠什么开放?尽管我国从2014年开始中央和很多地方政府就陆续出台了大数据行动纲领和促进办法,出现了数据交易所、数据主管部门等新生事物,但仍然没有形成规模化市场和应用。根据全球权威的数据开发平台对各国数据开放水平的评估,我国与英、美、加等国还存在较大差距。我国的数据开放水平还相对落后,必须急起直追。从全球发展经验来看,促进发展关键在于立法和技术保障,两手都要抓,精髓在于树立“开放和共享”的理念。

    世界各国把数据的开放作为一个重大基础发展战略。早在2009年,英国政府就提出了数据开放计划(Open Data),从2009年至2014年共颁布了11项新政策来推动数据开放,每年带来节省效益300亿英镑以上。美国2009推出数据开放平台Data.gov,2018年推出《开放政府数据法案》等。近年来最具影响力的是2018年5月欧盟发布的“通用数据保护条例”GDPR,全面规范了数据主题、个人数据、数据控制方、数据处理方、数据主体权利、假名数据、匿名数据、目的限制、使用限制、数据删除、隐私设计、问责原则、合法理由、许可、供应商管理等责权利,赋予欧盟公民更多的个人数据控制权,对收集、处理和存储个人数据的公司提出了更高的责任要求,特别是数据泄露方面。GDPR是一个庞大的立法文件,有99篇密集的文章。数据法规的建立和完善,不仅要明确数据的所有权、使用权和收益,还需界定国家数据主权,并促进数据合法合规应用。欧盟相关报告表明,GDPR实施一年就收到了约十余万份数据相关问题举报,开出数千万欧元罚款,促进开放的同时,也大幅减少了虚假数据产生。因此,中央和地方政府层面建立完善相关法规是数据开发繁荣的根本保证,包括建立政府主导的权威数据无偿开放平台、开放研究机构和治理机构。

    在技术手段方面,建立市场化的数据资产化和流通生态,形成数据权益、追踪、监管、流通、交易、信誉、激励等可信数据管理系统和数字治理体系,提供可监管和敏捷服务的平台是数据流通应用的关键。区块链作为下一代互联网的核心技术,以及新基建的重要组成部分,以其非中心化、分布式存储和不可篡改等特点,能够全面提升数据的安全性、可信性、追溯性和流通性,让数据安全有序地在人机物和不同系统间自如流动,以更低成本、更高效率、更安全地解决互不相识的多方交易中的信任问题。

    基于上述目标,与目前集中式数据管理系统不同,我们研发了区块链上的数据管理系统OpenDATA(开放数据),努力打造数据资产化的承载平台和开放共享的服务平台,从技术上全面推动数据的合理、合法和可监管应用。建立以应用群为主体的市场化数字生态,以众智、共识方式形成自组织市场模式,并将生态治理规则写入区块链中,共识产生运行规则,通过各种智能合约预设来实现公开和公平交易,利用激励机制和信誉机制建立数据生产者/加工者/消费者的自组织生态圈,从而建立新型的开放模式。为数据产生者确权和资产化,为供需方提供搓合和交易服务,为数据加工者提供共享和有价数据源,为数据应用者提供数据分析工具和服务。