数据治理是一个新的话题,但这个话题确实很重要,有很多问题已经在工作中遇到过了,还有很多是未来不得不面对的。我想从经济学的角度提出三点思考。
大数据带来的创新和挑战 大数据是第四次工业革命最主要的内容之一,也是数字经济发展重要的推动力量。大数据应用的成功案例非常多,例如健康码和大数据信用风险评估。
大数据如果应用得当,可能会在五个方面对经济产生大的影响,具体概括为“三升两降”,即扩大规模、提高效率、改善体验、降低成本和控制风险。如果使用不当,则会产生严重的负面效果。
这五个正面效果可能会改变经济运行的一些规律,例如金融领域中的“二八法则”,在大数据分析的支持下,20%和80%之间的界限可能变得不再那么突出,金融机构完全有可能在低成本、高效率的前提下为80%的大众客户提供金融服务。常见的规模报酬递减现象,也可能因为大数据和大型科技平台的应用而改变,因为平台的边际成本非常低,甚至为零。这些都可能给经济与金融带来革命性的变化。
中央提出数据要素的概念非常重要。经济学中有一个生产函数的概念,产出是由几个生产要素决定的,传统的要素包括土地、资本和劳动力。如果把数据加到这个生产函数中,对经济发展过程变化所产生的影响值得研究。它有可能会使得每一个要素将来的边际回报发生改变,规模效应也可能因此发生改变,最终可能导致生产函数的一些基本特征发生改变。
对于后进国家来说,这有可能是新的赶超机会。传统要素中,土地、资本和人力资本在短期内都是给定的,有一些还需要慢慢积累,例如人力资本和资本总量随着经济发展到一定程度才能达到一定的水平。但是数据则有可能实现弯道超车,如果收集得好、分析得好,不会比发达国家差。从这个意义上来说,发展模式甚至也会发生变化。日常生活中存在很多这样的例子。
但是数据要素和传统要素也存在不同之处,将两者进行比较后会发现一些突出的差异,例如权益界定。权益界定的问题比较复杂,数据要素不具备稀缺性,所以使用也不具排他性,这可能是好处,但同时在交易和定价等方面也存在客观困难。
与传统要素的第二点差异在于配置。土地、劳动和资本可以配置在同一场景下,虽然土地无法移动,但是劳动力和资本可以移动配置,进而形成新的生产单位并开展生产。数据方面,有些数据可以配置,有些数据不容易配置,就像和土地关联在一起,在一个地方有用,而在另外一个地方没有用。数据治理有一系列的问题需要解决,包括确权、交易、配置、定价和使用等。
数据要素的合理使用可能会给经济带来革命性的变化,但实施却不太容易,虽然已经有了一些比较成功的案例,但是面对的问题也非常复杂。
把握权益保护和价值发挥之间的平衡 数据应用包括采集和分析,其中涉及到的核心问题是,如何把握权益保护和价值发挥之间的平衡。好的治理能够保护权益、打破孤岛、实现共享、合理定价和科学配置,进而创造最大的经济效益。但实际操作中可能存在比较多的困难。建议采取务实的策略,具体操作过程之中,可能要把握保护隐私、数据安全与实现共享、发挥价值之间的平衡。
首先,安全和创新的平衡。数据保护或者说广义的安全包括国家安全和个人隐私保护,全世界每个地区的差异比较大。欧洲做得最好,但结果是欧洲没有特别成功的平台经济或数字经济的企业;我国数字经济在发展的前期存在较多不规范的现象,但也涌现了一批产业;美国居中,但是我们也无法判断美国是不是最佳状态。
这一版图带来的启示是,必须要加强数据保护,但是也不宜过度保护,如果像欧洲那样做,数字经济可能就无法发展。所以,要合理把握一个度,并对不同类型的数据进行合理的区分,有的数据涉及“私权”,可以管得严一些,另外的一些数据则可以适当管得松一些,因为最终目的是既要保护权益和安全,又要发挥大数据分析的效果,任何一个极端都不是最佳的方案。
其次,共享和效率的平衡。大数据在时间和空间上都是连续的,不是单个小块的数据,今天看到和讨论的“大数据”,大多数不是真正意义上的大数据,而是在特定的生态系统和平台中的数据。真正有意义的数据需要继续进行整合分析,打破信息孤岛、实现数据共享。
实际操作中,有一些比较容易做,有一些则非常困难。其中有两个难点:
第一,数据的整合面临体制约束。很多金融机构服务中小微企业的难点,在于信息不对称,缺乏足够的信息判断企业的信用状况。
广州、浙江、山东以及部分北方地区在数据整合支持金融服务方面已经有了比较好的尝试。当地自主建立了地方金融信息综合服务平台,打通本地已有的“静信息”或“硬信息”,例如社保、税收、司法和水电等相关信息,从而实质性地改善对中小微企业的融资服务。
技术上,通过联邦学习和安全计算等方法可以解决安全问题。这个平台上,企业或个人授权,平台收录,然后进行信用评估,实现了比较好的效果,也可以作为成功的案例进行推广。
难点之一在于,行政部门的条块分割阻碍了数据信息的最大范围共享,无法真正实现数据共享。这些问题需要顶层设计,在保障安全的情况下共享已有数据,打破孤岛,这样才能在提供金融服务方面行稳致远。
第二,大数据征信需要处理好数据迭代和利益分配的问题。我国有两家大数据征信公司,但面临较大的困难。我们曾经和国际货币基金组织以及国际清算银行合作,研究大数据能否应用于信用风险评估。答案是肯定的,但也存在一定的适用条件,即仅限小额和短期的贷款,看风险控制的效果还可以,但是提升额度比较困难,如果额度变大,这套评估方式不一定同样管用。
更重要的是,大数据风控的成功需要两个很重要的前提。
第一,需要不断的迭代。很多数据是非常规数据,基于交易行为产生的信息及相关数据需要不断迭代才能有效反映信用状况、还款能力和还款意愿,如果把这些数据单独拿出来就不见得有效。
这也意味着,系统要能够适应连续、动态迭代的数据特征。这个和传统征信不一样,美国的FICO的分是一个静态的数据,可以帮助金融机构判断信用风险。大数据征信则需要动态的迭代与实时的验证才能对信用风险做出可靠的判断。
第二,大数据征信依赖完整和良性的生态系统。信用风险管理是一个系统工程,大数据信用风险评估只是其中的一个部分,产生数字足迹的大科技平台及其生态系统同样重要,尤其是对于还款管理而言。大数据一旦离开了平台,很难单独形成有效的信用风险评估,更不能保证较低的违约率。
目前的几家大数据征信公司可能有大科技公司的激励不足的问题。作为征信公司的小股东,大科技公司既要共享数据,又要提供分析支持,却只是小股东,这样的共享模式很难成功。
上面的两个例子表明,金融数据共享需要因数据制宜,有的适合共享,就应该创造条件分享,发挥最大的效益。有的不适合简单化的共享,就需要寻找机制,尽可能地放大经济与社会效益。
比如,大科技信贷将没有进入征信系统的白户变成负责任的借款人,这样就会形成借款信息,就会被央行征信系统覆盖,银行就可以提供贷款。这也可以看作大数据共享的一种方法。
数字经济时代下治理的新思路和新措施 我国的数字经济发展还处在初级阶段。全球数字经济大致可以划分为三个市场,美国、中国和世界其他地区。其中,世界其他地区的主导机构基本都是美国公司。全球20家头部独角兽数字科技公司中,中国占半壁江山不到一点,这非常了不起。
但如果做深入的分析就会发现,中国的优势是人口红利、分隔红利,以及由于数据保护相对不充分所带来的创新机会——这些是否能够持续支持我国数字经济的发展,其实是有疑问的。
如果把当前的发展状况纳入世界格局内,在采取治理和管制的时候需要考虑到,我国真正领先的并不是技术,而是规模。如果未来要参与竞争,如何支持创新?尤其是在保护权益的前提下鼓励创新,这是当前最大的挑战。这也许意味着,短期内我国不能简单地学习欧美的做法。
与此相关,还有一个有趣的观察。回顾经济历史,公众对大公司普遍产生反感,往往都是在收入分配持续恶化的阶段。在收入分配不平等的宏观背景下,大公司、大富豪容易招致不满情绪,一些不正当、不平等的经济行为或现象则很容易加剧这种敌意。
从这个角度来看,大数据治理的大方向是支持创新和规范行为,但需要特别突出共同富裕的大方向,创新的结果不能只是创造出几千个亿万富翁。
所以大数据治理也需要新的思维,因为它可能使得经济行为或者运行规律发生改变,例如规模经济、范围经济和边际报酬等。治理方式也需要进行相应的改变,简单沿用传统的治理方法或者学习欧美的方法都可能不是十分合适。
以反垄断为例,反垄断的传统判断标准是市场份额和价格。过去认为一家企业的市场份额只要达到一定水平,就可以被认定为垄断,但现在这个思路可能需要重新考虑。因为平台经济的基本特征是规模经济,规模很小说明做得不成功,成功了规模就会变大。背后根本性的问题其实是可竞争性,即是否存在市场竞争。判断是否存在垄断,看可竞争性可能比看市场份额更可靠。
总之,数字经济发展有许多新的特征与规律,对其治理也需要新的思维,新的手段。