陆铭:中国数据产业发展:弯道超车与待解难题
日前,中央全面深化改革委员会第二十六次会议审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》,明确要加快构建数据基础制度体系,统筹推进数据产权、流通交易、收益分配、安全治理。数据作为一种新的生产要素,需要新的基础制度体系来配套运用。当前,我们在数据确权、隐私保护、安全治理等方面仍有待探索。
1、数据正成为越来越重要的生产要素
数据作为一种新的生产要素,与传统的生产要素如土地、资本、劳动力和技术等,有很大的不同。传统生产要素,往往有越用越少的性质,因此它的积累很难实现量的跃升。有的要素用完了就没有了,或是有折旧。除了技术要素以外,其他要素有边际报酬递减的特征。
但是,数据资源有报酬递增的效果,也即当数据规模越大、种类越多的时候,它越能焕发出强大的生产力作用。此外,数据如果被运用在一些传统领域如生产链、物流等方面,还会产生强大的网络正外部效应。
数据要素不会随着使用逐渐减少,还与数据的另外一种特征有关,也就是数据是在生产和消费的过程中产生的。因此,数据是越生产、越消费,资源越多。
在数据产业方面,中国经济当前正在这个领域弯道超车。中美两国是数据产业的两个超级巨头。由于数据资源成为越来越重要的生产要素,如果中国能把握住这一轮机遇,那么在引领新兴产业发展过程中,我们就有强大的人口规模和经济规模优势。这些优势在一些领域已经可以看到,例如在城市管理方面,中国应用大数据在城市管理方面所产生的一些先进的模式,应该说是走在世界前列。
我们要更好地利用机遇,一方面充分发挥市场的作用,发挥企业的积极性,另一方面,能够通过制度的规范,更好地促进和推动数据相关的产业的发展,和应用场景的实现。在加强管理和推动数据产业发展之间如何平衡,还有很多的问题需要认真探讨,要避免在传统思维方式之下的一些管理思维和模式,可能会形成新兴产业发展的阻碍因素。
2、五大问题待解
数据作为一种新的生产要素,需要新的基础设施建设来配套运用。就当前而言,我们还有以下几个基础制度没有很好地建立起来,这也是全人类共同面临的问题。
第一是数据的产权。传统生产要素的产权相对来说比较明确,所有者、使用者和受益者分别是谁,一目了然。但是数据作为一种资源,存在产生数据的人没有很好地获得回报的问题。
比如消费者在进行消费的时候,产生了数据资源,这些数据对于企业和公共管理者而言,有很大的利用价值,但这种利用价值并不一定被消费者本人所获取。因此,这个数据到底是属于个人,还是属于企业,企业有没有权利利用个人所产生的数据去牟利?如果仅限于在与消费者互动的过程中使用,以提高生产者的效率,那还可以另当别论,但企业有没有可能把消费者产生的数据拿去转让获利,这就比较有争议。
此外,消费者产生的数据具有公共性,当这种公共性被用来进行公共管理的时候,也会涉及到授权的问题。这些问题需要有制度建设来进行明确,数据产权的所有权、使用权和收益权需要好好界定。
第二是隐私保护。公共用途以及企业用途,如何做到保护个人隐私?一段时间以来,在国内外都出现一些大数据被转让、买卖、公开甚至滥用的现象。这些问题让公众对于个人数据隐私安全产生担忧。如何有效地避免,公共权力跟个人隐私的边界在哪里?这些也值得去探讨。
第三是对大数据垄断的担忧。传统经济学对于垄断,主要是由市场份额来进行判断。但是在大数据时代,一些平台经济如果要发挥功能,天然就需要有大规模的用户和数据。这一方面有利于提高资源配置效率,但也客观上存在一些“大数据杀熟”等企业利用大数据优势来侵犯消费者利益的问题;也有一些用户认为,在与平台进行互动的过程中,用户往往因为是弱小的个体而缺乏谈判力。
因此,在大数据时代对垄断的定义,以及对垄断的危害如何界定。这些问题在国内外学术界和政策制定界都还在进一步的探索,还没有完全的定论。
第四是数据的公共安全。这既包括我们把数据汇总到某一公共平台的时候,如何防止数据泄露、滥用或被用于私人进行牟利,也包括一些平台经济在涉及跨国经营的时候,如何保障一国的数据能与其他国之间,既能有效地建立安全边界,又能在特定领域进行跨国协调和配合。
因为大数据本身具有规模经济性,如果数据不流通,可能难以实现应用价值。对此,目前一个比较一致的看法是,算法可以无边界,但原始数据要设立好防火墙。但也有例外,如在抓捕跨境犯罪时,光有算法共享可能也不够,可能还会涉及数据的沟通。再如跨国界的联合开发,如果仅有算法的共享,终端的研发者可能很难在数据上发现价值或者问题,会影响开发效率。这都是理论和实践上需要去探讨的问题。
第五是数据开放共享。公共数据平台在发挥用途的时候,需要向研究者进行开放。正如前文所说,数据具有正外部性的特征,把不同的数据汇集到同一个平台上,比单独利用数据,所焕发出来的效能更大,甚至可以呈几何级数的增长。但这里面就涉及到几个问题:首先是我们通过什么样的机制,让不同的数据归集到同一个平台上来。中国目前在这方面走在世界前列,比如通过政府的协同来打造大数据中心、智慧城市、城市大脑等。但协调仍是一个难题,且不说去协调企业所拥有的大数据,连政府不同的部门之间,其所拥有的数据都很难归集到同一个平台上来。
其次,就算数据都汇集到同一个平台,谁来开发也是个问题。一些平台的数据建设者,本身并不一定直接去开发数据,产出可以解决实际问题的应用场景。而能够开发应用场景的科学家们,如何能够用平台上的数据来做科学研究,科学家利用这些大数据所产生成果如何界定其知识产权?
3、大数据应用前景广阔
展望数据未来的应用,应该说问题很多,但是前景和前途也非常广阔。不妨结合笔者团队所做的工作,来描绘大数据的一些应用场景。有些应用结果,可能具有科学价值,也可能具有公共政策价值,也有可能具有商业价值,或者兼而有之。
第一,将数据应用于构建经济指数,动态地反映经济和社会发展的状态。一个共识是,数据是指导政策和商业运行的非常重要的资料。传统的一些数据,往往有不够及时、度量的指标比较主观等特点,特别是一些依赖于问卷信息构成的指数。此外,一些传统数据的更新频率和颗粒度都不高。但是大数据能够及时、动态和客观地反映真实,只要算力足够,就可以刻画细颗粒度的一些特征。
例如,我们与一家位于昆山的灵活就业平台合作。这个平台上面有数量庞大的流动人口,其主要会员是农民工群体。平台的一端,连接了流动人口群体,另外一端,则连接了有用工需求的制造业企业。随着企业用工需求的波动,如这个月A企业有大量用工需求,B企业没有,而下个月B企业用工需求旺盛,A企业用工需求减少,灵活就业群体可以根据用工需求在不同企业之间变换就业。这样一种在不同企业之间灵活就业的模式,既可以提高企业的用工柔性,又有利于保证灵活就业群体的充分就业。
平台上的用工数量和用工价格,能够很好地反映制造业发展的景气度。我和上海大学的向宽虎利用这个数据,构建了长三角、珠三角地区制造业景气先行指数。这个指数对于政府决策把握宏观经济动态,以及商业机构把握未来制造业的发展趋势,都具有很强的借鉴和指导意义。
第二,将数据应用于指导公共政策。今年3月,《中共中央国务院关于加快建设全国统一大市场的意见》发布,我与郑怡林、李杰伟等在“评驾科技”的汽车大数据支持下,通过分析城市与城市间的车流的强度,很好地度量了城市与城市间的经济联系,并可以在观察城市联系紧密度的基础上,来界定城市群。我们还用汽车大数据回答了中国当前地区之间的市场分割有多严重,并指出了市场不够统一与地方政府行为之间的关系。
我们也曾用来自某超大城市的公共管理投诉大数据,包括公共卫生、公共安全,市政建设等方面的投诉,通对这些大数据进行分析,可以发现城市的人口密度与公共管理之间的关系,有力地回答了很多人担心的,人口规模高会使公共管理变得更加困难的误解。我们用数据告诉大家,其实人口密度的提高有利于提高公共管理的效率。
第三,将数据应用于科学研究。科学研究是大量依赖于实际数据的,但是传统的数据具有频率不够高、时间有滞后性、采样代表性不充分等等问题,大数据给科学研究发现规律,提供了非常重要的数据资源。现在大数据越来越多地用在科学研究上,特别是社会科学研究方面。
比如最近我们用手机信令数据,识别了早高峰时期上海的人口流动方向。可以非常清晰地看到,人们无论是居住在外环以内,还是在外环以外,早高峰时期都在大量向中心城区通勤,表现出一种“向心城市”的特征。也就是说,当一个城市进入到服务业为主的阶段,大量的就业岗位和消费场景,是集中在中心城区的。这个时候,如果把人口从中心城区向外疏散,有可能造成一些产业(特别是服务业)生产效率下降,或者加重城市拥堵的后果。
这又会引起另一个话题,是不是我们也可以同时把产业向外疏散?但我和彭冲通过对大众点评的餐馆消费数据研究表明,人口密度可以提高服务消费的数量、质量和多样性,而这对建设国际消费中心城市而言非常重要。疏散城市人口有可能会产生降低人口密度从而导致不利于服务业发展的后果。
以上例子,希望能帮助读者更好地理解数据资源,在我们今天这个时代,所能焕发的巨大的能量,数据既有利于提高企业的生产效率,又能够提高公共管理的效率,还能够提高居民的福利。关键在于我们能不能通过一种制度,去规范数据资源的应用,让数据资源的应用造福于人民,同时必须警醒,数据滥用会造成对企业和社会福利的伤害,这是我们当下全人类共同面临的主题。
来源:21世纪经济报道
Tags:陆铭,中国数据产业发展,弯道超车与待解难题
责任编辑:admin