二、大数据与公共管理的结合 公共管理的数据来自何处?弄清楚这个问题,首先要清楚数字和数据的区别,以及数据科学与管理科学是怎样结合在一起的。不但数字与数据有巨大的差别,而且传统数据与大数据也有本质的区别。一个数字只是一个符号,表现为一个数值或者是文本型数字,数字只是数据的一种形式。而数据则是一个很宽泛的概念,“只要是对客观事物记录下来的、可以鉴别的符号都可以称之为数据,包括数字、文字、音频、视频等等”[9]。也就是说,数据是关于某个(些)方面的一组数字,表现形式就不只是数字,而是有更多的表现形式。数字毫无疑问是统计科学的基本素材,但统计主要是对结构化数据进行统计分析,对非结构化数据一般都不会纳入传统统计之内,而实际上,云技术普及应用之后,90%的数据是非结构性数据,而且是富含大量价值的数据。由此可见,数字和数据不但在形式上完全不一样,而且在内容上也是大相径庭的。在云技术出现之前,数据仍然主要表现为以结构性数据为主的传统数据。这种数据虽然也会用于分析和研究,也表现为定量的微观分析,但它所诠释的仍然是一个问题的宏观和整体的状况,而且根据这种数据所进行的决策也仍然是宏观决策。这主要是受制于传统数据的采集方法、分类方法和采集标准。然而,云技术诞生以后,大数据的采集、分类、分析等方法和手段都彻底精细化,这样大数据才能对所涉及的对象进行微观性和个性化的分析。换言之,传统的数据只能算是小数据,小数据揭示问题的宏观现象,而大数据则可以揭示问题的内在本质。
大数据产生之后,数据科学迎来划时代的变革,这种变革的最大表现是数据科学与其他科学的内在结合,并形成基于大数据的新兴科学。数据科学最初与企业管理结合得最紧,主要原因是:随着社会化分工越来越细,企业生产的社会化程度也越来越高,因而企业的管理包括预测、决策等都越来越复杂,越来越依赖于完整的客观数据。而基于云平台和云计算的大数据可以为企业提供这种大数据服务。随着数据科学的迅速发展,公共管理、社会管理等也都全面引入数据科学。尤其是在新世纪,各国在继20世纪90年代推行的各行各业包括政府的“上网工程”之后,各国在新世纪又大力推行大数据战略。所以,大数据已经全面介入公共管理、社会管理之中。在这种情形下,数据科学与管理科学的高度相符嵌入而实现管理实践的巨大飞跃,尤其是使基于大数据之上的精细化管理和微观管理成为现实。在继西方各大国大数据战略之后,中国政府也颁布相应的大数据战略,制定“建立‘用数据说话、用数据决策、用数据管理、用数据创新’的管理机制,实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步”的行动方案[10]。这也表明,大数据将在短期内成为公共管理等领域内的主要技术工具,也是提升政府治理能力的重要技术手段。
既然大数据全面嵌入公共管理,那么,公共管理所依赖的大数据又来自何处呢?众所周知,公共管理的内容非常广泛,公共管理以社会公共事务作为管理对象,而社会公共事务的具体内容分为公共资源、公共项目、社会问题等内容。因此,用于公共管理的大数据并不是单一性的,而是来自各个领域的大数据。几十年互联网的发展为数据积累提供了重要技术平台,加之大数据搜索引擎的发展,使社会产生的所有数据都能够获得迅速且有效的收集和储存。特别是世界各国的电子政务建设为公共管理积累了大量数字化的业务数据,既是政府大数据的重要来源,也是用于公共管理的大数据。这些数据主要来自以下四个方面:
1.来自互联网的大数据。这些数据大多分散在不同储存系统,包括数据库如Oracle、DB2、SQL Server等;Excel、电子邮件服务器等数据源上也积累不少数据源;Hadoop(分布式处理平台)系统如ApcheCloudea、Hortonworks、MapR,以及NoSQL数据库如Cassandra、HBase、MongoDB等也储存大量的数据。此外,云应用如Salesforce.com和社交网站如新浪微博、腾讯微博、搜狐微博等上也产生大量的数据[11]。当然,来自互联网的大数据必须基于搜集技术和保存技术。这种技术的发展是惊人的,例如对用户在网站上行为的记录(访问日记)在20世纪90年代中期,其保存率仅有1%,而在21世纪的第一个十年中的发展已经可以达到100%的保存率。这些数据虽然并非都可以用于公共管理,但公共管理已经越来越离不开来自互联网的数据。以新浪微博的数据为例,新浪微博中产生大量的关于政治参与、反腐倡廉、社会安全、社会问题、公共卫生事件、社会突发事件等的数据,而这些恰恰就是公共管理最重要的数据源之一,甚至这些数据在很大程度上影响公共决策。近年来,来自互联网的数据对公共决策的影响越来越大,有的公共决策甚至直接就是在网民的舆论压力之下进行决策的。例如,2012年8月26日凌晨,陕西省延安市境内发生重大车祸致36人死亡,2人重伤。陕西省安监局局长杨达才视察事故现场开心嬉笑的照片引发轩然大波,网友对他进行“上天入地”的人肉搜索,发现其曾佩戴过多款名表。2012年9月21日,陕西省撤销杨达才的所有职务,并对其严重违纪行为进一步调查。2012年11月28日,网民在微博上发布一组视频和照片,称山东省农业厅副厅长单增德与一单身女性保持不正当关系长达6年,如今想甩掉“包袱”,动用警力非法拘禁其情妇。山东省纪委调查后认定该情况属实,并对单增德立案调查。2012年11月下旬,网络爆料人士实名举报重庆市北碚区委书记雷政富,并发布其不雅视频。2012年11月23日,经重庆市纪委调查核实,互联网流传有关不雅视频中的男性确为北碚区委书记雷政富。重庆市免去雷政富北碚区委书记职务,并对其立案调查。随后,重庆市一次性免去牵涉不雅视频的10名厅级官员和国企高管的职务。2013年1月17日,一则有关陕西省神木县“房姐”的帖子网上热传,该网帖称陕西省神木县农村商业银行副行长龚爱爱在北京有20多套房产,总价值近10亿元,后又被曝有4个户口;1月24日,公安部成立工作组核查“房姐”户口问题;1月31日,北京警方证实,龚爱爱在京拥有41套住房,共9666.9平方米,还有奥迪轿车一辆;2月3日,龚爱爱在北京被专案组抓获,已按程序依法刑事拘留,而为其违法办户口的北京、山西和陕西4名民警也被刑拘。诸如此类的网络事件验证了来自互联网大数据的强大威力。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页