数字政府建设是推进治理能力现代化的重要支撑,是经济社会高质量发展的必然选择。而盘活数据资源是数字政府建设的关键之举。南方都市报、南都大数据研究院推出系列专题,专访数据开放实践者、治理标准制定者、数据安全护航者、数据立法起草者等,并且挖掘数据应用创新举措,探寻数治能力优秀区域,以“30人访谈为引,以20城案例为鉴”,致力呈现新时代下的“数据新作为”,共谱数智新篇。
同时,面向全国企事业单位、科研机构等征集数据应用优秀案例(资料或线索请发邮箱nandubdi@163.com),我们将组织大数据领域有关权威专家对案例进行解读、评估,并进行更深入采访,实现更广泛推广应用。
数据资源是数字经济深化发展核心引擎,我国数字经济领域首部国家级专项规划——《“十四五”数字经济发展规划》确认了数据的核心要素地位。2022年6月1日,国内首个城市数字经济地方性法规《广州市数字经济促进条例》正式实施,提出将以此为契机,积极培育数据要素交易市场,打造更具有广州特色的数据交易新生态、新模式。那么,数据要素与其他传统要素有何异同?当前数据交易基础设施面临哪些问题?如何通过需求侧拉动数据市场?浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员盘和林接受了南都专访。
制度是激活数据要素市场的决定性因素
南都:数据要素与技术、劳动力、土地、资本等传统要素有何异同?制度、生态、数商(中介)是激活要素市场决定性因素吗?
盘和林:数据要素和其他要素的异同主要表现在:其一、数据要素流通有安全性的要求。其他要素的流通往往由市场自主匹配,政府监管主要面向维护市场交易公平。但数据泄露、数据滥用会造成严重的负面影响,所以数据流通顺畅的前提是政府加强对数据流通的管理能力,尤其是要注重配套技术监管手段,监管的部门要懂技术。
其二、数据要素权属界限并不清晰。其他要素的权属较为明确,数据要素权属却存在很大不确定性。比如有数据分析公司通过公开数据来解读个人用户,甚至将个人用户隐私信息挖出来,在这个过程中公开数据往往不具备隐私保护条件,当前数据产权确定是“谁投入、谁贡献、谁受益”,上述案例就很难确定数据权属,很难分配。另外,数据要素权属是一种权益,而不是所有权,与其他要素不同,权益是可以分割的,是要利益分配的,但事实上数据的权益分配依然是难题。
其三、数据的需求是多元且复杂的,数据价值链条更复杂。其他要素有很明确的供应体系,从供给到需求,是一条完整价值链,数据却不是。数据下游应用范围很广,同样的数据可以应用在不同领域。比如同是销售数据,有人用来分析用户偏好,有人用来分析用户收入水平,有人用来预测未来宏观经济。同是电力数据,可以为电力企业节能去做方案,为企业服务,也可以对宏观经济状况作出预期,来做投资。而其他要素,从供给到需求往往是比较单一价值链条。比如你买天线专利,一般会用在通信设备上,当天线专利出现的时候,我们基本上能够预判哪些领域是需要天线专利的。
制度是激活数据要素市场的决定性因素。数据要素流通有安全性的要求,需要建设完善的制度来监管数据流通,否则会导致严重隐私泄露问题。制度也是为了规范数据要素交易。没有制度,也会有数据交易,只是大量存在于灰色与黑色地带,这样的数据交易不可控,最终会给社会带来不可挽回的负面影响。制度对于数据要素,一方面是将数据要素交易市场纳入到正规渠道进行交易,置于阳光下,另一方面是以制度规范数据要素交易行为,让权益分割,安全隐私保障成为数据要素交易的标配。
生态是激活数据要素市场的重要性因素。数据要素流通目的是释放价值,有序利用数据资源,而形成生态就是为了更好应用数据资源,让更多市场主体参与进来,对数据要素各环节进行填充,丰富、活跃数据交易。
数商(中介)是激活数据要素市场的关键要素。数据要素供需匹配十分复杂,这中间需要大量资源匹配工作,大多数数据需求是定制化的,若没有数商对数据进行收集、清洗、整理、标注、打包,很多数据达不到可交易条件。没有数商,数据价值既不能在供给端被发现,也不能被需求端所接纳。
多从需求方来倒推数据权属
南都:产权是数据交易的基础。没有具体产品的数据市场,如何从法律上确权?数据确权与数据市场究竟是先有鸡还是先有蛋?
盘和林:法律确权方面,“谁投入、谁贡献、谁受益”是当前数据确权总体原则,但实际操作中有很大困难,数据需求往往是定制化的,数据采集针对的数据,有些是明确有贡献者,有些没有贡献者,是公开数据。我认为可以从以下几个方面来完善确权体系:
其一,划定个人信息隐私和公共数据之间的边界。我国颁布《个人信息保护法》对个人信息保护有额外要求,当前个人信息泄露问题比较严重,要加强管理,尤其是个人信息使用方面,要进行脱敏、加匿,要在信息数据产生的时候,就对个人私有信息数据和公共数据加以区分,采用不同管理路径。
其二,多从需求方来倒推数据权属。“谁投入,谁贡献”是从供给侧,而谁受益是从需求侧,由于数据需求很多是定制的,同样数据在使用的时候,目的不同,其权益分配规则和数据责任也不同。例如:数据包中可能存在一些无权属公开数据,也可能包含个人数据,很可能包含个人隐私,或者这些数据可以通过算法挖掘才发现个人隐私。
其三,以案例来确权。应对复杂情况的最好办法是案例说明,能为数据产权裁量提供更多参考,案例积累能为数据交易带来更有参考价值的权属认定标准。
数据确权是数据市场交易的前提,任何市场交易的交易对象都是产权明晰的标的,只有产权明晰,交易才会实施,交易对象的价值才会得以释放。从这个角度看,先有数据确权,再有数据市场交易。但是,数据要素极度复杂,数据市场实际上早已存在,只是以灰色、黑色状态进行,而数据确权是将数据交易纳入到正规之中,减少数据交易的负外部性,减少隐私信息倒卖等违法行为,从现实来看,数据市场早于数据确权。
我国需要一部有关数据交易专门立法
南都:对比美欧等国家或地区数据交易立法,我国数据交易立法仍然可以在哪些方面进行细化?当前数据交易基础设施面临哪些问题?
盘和林:欧洲的数据立法主要体现在:一是抑制个人数据交易。出于隐私保护的考虑,欧洲对个人数据的应用进行了立法限制。二是进非个人数据开放和共享。对于不涉及个人隐私,个人权属的数据信息,欧洲是促进数据开放,比如前几年比较热门的开放银行,要求大银行通过API接口分享数据,促进金融科技企业发展。由于数据所有权尚未明确,采取的是权益分配的管理思路,但数据权属依然十分模糊。欧洲互联网企业少,不肉疼,所以数据管理严格。
而美国的数据立法主要体现在:鼓励数据分享和开放,强调数据推动创新,包括个人数据;隐私保护通过授权同意,透明交易的方式来实现。对于无权属的数据,强调数据安全责任,要求妥善保管。总体而言,美国交易透明度要求很高,但由于互联网企业多,在数据应用上限制较少。
目前,我国数据立法主要体现在:政策推动为主,法治化依然薄弱。随着数据立法的完善,数据执法的跟进,数据法治化程度有所提高,但仍然缺少数据交易立法,问题。数据立法操作性不够强;交易主体单一,数据交易所渠道数据交易的种类单一;数据泛化交易和法律红线边界不够清晰,大量灰黑数据交易依然存在,且是数据交易的主流;规则过于保守,创新性不足;数据权利不清,抑制发展。总体而言,我国需要一部有关数据交易的专门立法来规范数据交易行为。
当前数据交易主要有三大困境
南都:当前数据交易存在哪些困境?如何推动数据拥有者主动让数据向需求者流通?
盘和林:我想当前数据交易主要有三大困境:一是数据集中。数据是一种资源,其在积累到一定规模后,通过算法挖掘能够获得数据价值。互联网提升了数据量级,从而催生了数据应用,数据量级越大,数据价值越高。收集数据的互联网巨头往往掌握大量数据,他们并没有动力主动将数据出售给数据的需求方。比如一家小型的人工智能数据企业在购买数据的时候,既缺少资金,也缺少渠道。大企业在海量数据收集中获取了优势,并继续利用资本力量积累数据。小企业在数据收集方面缺乏渠道,此时强者愈强,赢者通吃现象出现。
针对此问题,解决方案是供给侧施压,逼迫数据拥有者主动去分享,往往很难实现;需求侧激励,让需求方具备更多数据交易竞争优势,诸如排他性交易(只有一个客户)、官方定价等等。
二是数据定价。数据交易复杂多元,数据产权集中。数据定价并不存在公平、均衡的价格体系。由于数据需求方是定制的,数据要素对需求方效用不同,所以不同的数据需求方会有不同的定价。而另一方面数据的供给端存在数据权利集中现象,他们在市场交易中有优势,推动数据流通的意愿不高。数据定价要防止“价格敲诈”,防止数据拥有者利用数据支配地位进行不正当竞争。例如,某教授的论文被Z网使用,Z网未支付教授版权费,但教授自己搜索自己的论文却要付费才能看到。
对此问题,我提出解决方案是数据定价要区分数据的类别,要分数据种类看数据定价的优势在供给方还是在需求方,供方有利则定价原则偏向于需方,需方有利则定价原则偏向于供方。诸如在拍卖定价方面,交替递增出价拍卖方式有利于供方,而交替递减出价拍卖方式有利于需方。在政府数据开放领域可以采取固定定价和拉姆齐定价的模式释放数据活力。
三是数据应用促创新。我们不能放弃规范化,但也要追求科技创新。一方面释放数据要素是为了强化创新。未来从数据到人工智能,从智能终端到数据回传,循环往复。数据、智能的循环对于科技进步至关重要。诸如人工智能识别蛋白质特性(围棋的AlphaGo升级为蛋白质特性的AlphaFold 2),诸如有人用动物动作捕捉来研究动物的习性。另一方面当前数据交易的立法规范集中于供给侧。针对数据交易规则进行限定,同样限制的还有数据交易的种类,数据交易的参与主体。数据需求方对数据的需求是极度个性化的,诸如语音AI、人脸识别AI的数据需求完全不同,自动驾驶视觉AI和智慧城市监控探头的数据需求也完全不同。
当我们限定了数据交易种类和主体的时候,实际上也会限制创新。如果要让数据推动创新,需要让数据重新回到开放、共享的原始状态。总之,要以需求推动数据供给。
先缔造需求再适配规则,以需求划定权属边界
南都:要素市场本质是一个供需关系,有需求才有供给,需求大供给才会大。您提出要通过需求侧拉动数据市场,具体怎么操作?
盘和林:一是先缔造需求,再适配规则。如同古代鼓励农民开荒,开荒后最初几年免赋税。也类似于过去互联网发展模式,先激活产业,先放,再制度规范,再收。数据领域交易极其复杂,数据交易主体多、渠道多、模式多,成文法条的可操作性不高,而在遵守原则背景上以判例和案例作为范本,能很好为数据交易划定边界和红线。在立法上,要提出原则性的法律定义,在执法上,可以参照案例的方式来执法。例如,针对数据交易领域设置一个判例库,作为未来数据领域执法的参考样本。制定个人数据信息使用安全流程,在此基础上鼓励数据交易。
二是以需求划定数据权属边界。数据权属认定要从需求出发,因为数据交易太复杂,尤其是数据应用定制化需求的特性。如利用公开信息来倒推个人隐私,那么这个数据应该是个人权属,属于个人的隐私权益。如果公开信息用来进行社会学分析,那么属于公共数据利用。
三是破除数据集中,需释放供给端。规则化、标准化、程式化的数据交易,会让数据趋于集中。数据拥有者会以破坏用户隐私、影响数据安全为由,拒绝数据流动,从而最终让数据囤积在自己手中。数据市场大买家往往是那些头部的互联网企业,他们拥有数据,还要大量购入其他企业手中的数据,以此增加手中数据的信息维度。比如用户侧画像方面,互联网公司通过自身数据积累和外购多维度数据来了解用户需求,互联网公司比用户更了解用户。对此,解决办法是信息获取最小化原则。数据需求方不能获取额外的数据量。如果超过可以拥有的数据量,要么拒绝收集,要么将数据向中小科技企业转售。现阶段大多数人看到“信息获取最小化原则”都是考虑到供给端,也就是收集必要信息,但在需求侧,这个原则同样有用。
四是振兴需求,防止堕入价值链底端。数据交易产业链要着眼于未来,要有全球视角。数据作为资源处在价值链的底端。中国很多产业有过历史教训,只有自己有需求,产业链才能向价值链的顶端进发。例如:过去,苹果和特斯拉在价值链的顶端,中国的代工、配件厂在价值链的底端。但现在造车和造手机中国自主品牌崛起,向价值链顶端进发。原因就是中国成为新能源汽车和智能手机需求大国。稀土是典型的产业。过去我们一直说稀土被贱卖,关键是过去稀土产业链下游都在外国人手里。
个人简介
盘和林,管理学博士,应用经济学博士后,现为浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员;浙江大学金融科技研究院研究员。工信部信息通信经济专家委员会委员,南方电网专家委员会委员,中新广州知识城智库专家,中国(温州)数据安全港专家委委员、中国联通(广东)互联网产业公司智库专家。广州数字经济促进条例立法咨询专家。先后出版《5G新产业》、《5G大数据》、《宅经济》《新基建》等专著。
出品:南都大数据研究院 数字政府研究中心
统筹:邹莹 研究员:袁炯贤 设计:刘寅杉
编辑:袁炯贤
更多报道请看专题:数据新作为·数据30人20城系列报道解码数治之道