2017年5月26日,在贵阳数博会组委会主办,工信部直属机构中国电子化技术标准化研究所,全国信标委大数据标准工作组、贵阳市质量技术监督局承办的贵阳数博会大数据标准化论坛上,我国大数据行业各位专家纷纷对大数据行业是继续跟随国际技术引领,还是实现弯道超车,利用我国已有的国际标准话语主导权优势,迅速实现中国核心技术国际引领,中国电子技术标准化研究院院长赵波、国标委领导刘大山、全国信标委大数据标准工作组副组长杜小勇以及国际标准制定者、国际信标委国际协调员、柏睿数据董事长刘睿民、华为标准专家光亮等大数据行业权威专家均指出,做为国家未来核心竞争力的大数据行业已经进入数据流爆发的时代,中国必须要尽快制定相关国家标准及行业标准,掌握行业的话语权,引领行业有序健康快速发展,着对我们国家大数据发展至关重要。
作为中国唯一一个大数据领域国际标准主笔人,数据库领军专家刘睿民指出,大数据行业已经进入流数据爆发的时代,中国应充分发挥自身优势,依托中国已经引领制定的2018流数据库国际标准,尽快制定自己的国家标准及相关工业标准,把握现在国际核心技术重新布局过程中,中国现在拥有的话语权,掌握国际大数据市场主导权。
刘睿民介绍,中国在流数据领域拥有国际领先的技术实力。比如,我国提案“SQL对MapReduce及与之相关的流数据处理的支持”得到国际标准为技术专家的高度肯定,WG3在2016年孟菲斯会议全票通过了这个来自中国的首个提案。中国首次作为SC32 WG3“数据库语言工作组”和JTC1 WG10“物联网工作组”的联络员,负责探索流数据处理和WG10工作组的相关性,以便完善我国的提案作为SQL数据库语言ISO国际标准的独立章节。
刘睿民在论坛上还分享了他在国际会议上打败国际数据标准巨头甲骨文的实现弯道超车的核心亮点技术:即原来传统数据库是静态的,所以数据是被进行清洗以后再放在磁盘里,要进行数据分析时,需要到磁盘里提取出数据再进行不同渠道、不同来源 的滞后分析,所以分析不具有实时性,数据对经济实时指导价值不能更有效的体现出来;而流数据库所有数据都存在于在内存里,就如同数据瀑布在流动过程中,就利用数据库内置模块对数据实时打上标签、归并、分析,使数据产生实时分析指导结果;而在流动中打上的这些标签是为今后对数据做进一步处理,将数据进行有序存储,从而进一步成为不断变动的数据的存量历史经验参考依据。因此,实时流数据分析与传统静态查询的区别在于,传统静态查询后即成为沉淀数据,数据价值不能充分发挥,而流数据处理完后不存储,而实时交互式是即席查询,数据的实效性及有效性成百倍千倍提高。而对大数据的实时分析意味着:即席查询使得索引没法预先被计算 。譬如,在线广告匹配、物联网、交通优化,等等。数据的价值如果在秒级,甚至毫秒级来体现,其价值要远远大于若干天后的滞后评估结果带给经济社会的价值,所以,流数据实时处理才是数据的核心价值。这才是和以前技术完全不一样的亮点,这是一项颠覆性技术,也就是这项技术征服了所有的国际技术评委。也只有这样的技术才能使得数据能够实时对经济社会、经营决策产生科学分析,并提供预警预测的指导结果,才能切实指导社会生活及生产经营,使得数据产生最大价值。
目前国际大数据领域意味刘睿民在国际标准化委员会的提案对流数据库开始高度重视,原来传统的国际数据库垄断巨头厂商,像甲骨文、SAP他们这些老牌厂商,在趋势面前也不得不开始从以前的排斥转到现在的追随,因为,他们也已经从中国夺取的此次国际标准所显示的技术,意识到他们一统天下的时代已经终结,未来必然是中国技术引领的流数据的天下。
刘睿民在会上还明确指出,流数据库是2025中国制造巨大支点。原来不管是在工业界还是金融界,使用的数据库95%以上都是甲骨文的,我们整个工业化进程,就是甲骨文在国际社会不断发展壮大的进程,据不完全统计,中国一年至少给甲骨文交的服务费至少在60-70亿美元,这使得我国工业、金融甚至政府的数据全部都在这些国际公司的数据库里,按他们的制定的规则被保存着,我们的数据安全完全依赖这些国际公司的技术,这其中的安全路径里存在的隐患,在不远的将来可能会让中国付出不可估量的代价,这不是杞人忧天,是我们必须正视的问题,所以拥我们自己国际领先技术标准的数据库才是根本解决方案。
刘睿民演讲中还特别强调,数据库一直被成为软件工程皇冠上的明珠,是所有大数据产业的核心技术,只要运用数据的地方就不可能离开数据库的技术支撑,所以我国拥有适合时代发展、引领国际前沿先进技术的自有数据库技术。才能真正为国家数据安全提供有力的保障。我们只有摘下皇冠上的明珠,才能真正成为皇冠的拥有者。