人民大学大数据统计实验室主任刘睿民:用核心技术争夺国际大数据话语权与网络安全

中国的数据库行业如何进行颠覆性改革?中国软件技术市场的发展现状如何?中国软件技术市场如何容错试错?自主创新型企业又该如何保持拥有核心竞争力?对此,工信部国际专家,人民大学大数据统计实验室主任刘睿民先生发表了一番见解。

习近平总书记在主持学习时强调加强网络信息技术自主创新,加快数字经济对经济发展的推动,必须提高数字化管理水平,提高网络管理水平;加快增强网络空间安全防御能力,加快用网络信息技术推进社会治理,加快提升我国对网络空间的国际话语权和规则制定权。所以,我们是时候脚踏实地的探讨大数据到底怎样为社会管理、民生民情、消费生活服务。


那么,中国的数据库行业如何进行颠覆性改革?中国软件技术市场的发展现状如何?中国软件技术市场如何容错试错?自主创新型企业又该如何保持拥有核心竞争力?对此,我们采访了工信部国际专家,人民大学大数据统计实验室主任刘睿民。


刘睿民认为,“总书记的讲话犹如久旱逢甘露,内涵丰富,我们这样一个数据生产大国、使用大国,我们的社会管理、民情民生都越来越高度依赖互联网、依赖大数据,但我们之前一直没有自己自主研发的核心软件基础软件。一谈起核心,大家耳熟能详的无非就是IBM、甲骨文等等,这是历史的必然,因为这些公司最早拥有核心技术知识产权,所以他们能够代表自己的国家参与并影响国际技术标准,制定了国际游戏规则,在一定时期内主宰了国际市场,也正是因为这种影响力自觉不自觉地绑架着中国政府,中国市场影响着中国社会生活的方方面面。究其原因,是在这之前我们没有完全属于中国自主研发的核心软件技术,所以,在国际社会自然没有影响力,也不可能产生话语权。”


从中国大数据“破冰”,29年来首项国际提案“通关”说起


在美国孟菲斯ISO/IEC JTC1/SC32“数据管理与交换”分技术委员会2016年全会上,中国代表团提交的大数据技术提案“SQL对MapReduce及与之相关的流数据处理的支持”完胜美国、德国,获得SC32全会决议通过。会议确认以WG3“数据库语言工作组”和中国国家成员体的名义联合申报新工作项目“数据库语言新技术设计说明第1部分:SQL对流数据的支持”。这是29年来中国首度在国际标准委员会独立提出技术提案并获通过。


该提案的通过,不仅说明中国核心大数据基础技术的发展正在赶超国际水平,历年来由美国、德国一统天下的高端数据库核心技术,已经被中国突破;更使得大数据产业发展能够有章可循、有据可依。


对此, 刘睿民特别强调,“中国技术业已全面突破国际大数据核心技术壁垒实现真正意义上的国产化,只有国产化数据核心技术在自己手里,国家各个层面的数据安全才能得以有效保证。把数据装到别人家的仓库里,由别人的仓库管理员管理自己的数据,再谈数据安全其实是一种安全伪命题。以前不谈是因为技术无法做到,无从谈起,现在技术达到在国际上制定国际标准的领先水平了,我国现在应该可以进入大数据引领的高科技发展快车道。”


“大数据安全事关国家安全和未来,数据库技术建设是国家战略安全无法回避的问题。”在大数据时代,大数据改变人类生活的说法一点儿也不夸张,但如果没有适时建立起大数据安全保障体系,大数据意味着存在安全隐患。对任何企业、机构、机关乃至于社会来讲,大数据分析都是最敏感的资产。大数据分析工作提供了精准、关键的竞争优势;另一方面,如果上述分析被别人掌握或落入别有用心之人手中,则会陷入巨大的风险中,这对企业来讲是如此,对机构来讲是如此,对国家更是如此。


而这次代表中国冲破国际技术封锁,在国际信息化标准委员会里完全用我们中国人自主研发的软件产品标准,说服并获得信标委高票通过,主导2018年国际流数据库这一大数据核心技术标准制定,正如习总书记所说的“加快提升我国对网络空间的国际话语权和规则制定权”这一指导精神的实践。


刘睿民补充道:“我们的分布式流数据库软件每一行底层源代码都是我们自己写的,所以在国际标准委答辩时,尽管有美国、日本、德国专家反复质疑问询,但最后还是以高票通过。国际信标委专家团虽然之前对我们中国人历史软件核心技术创新能力存在质疑,但还是对现在我们拥有的技术实力表示尊敬,为我们在数据处理基础技术上的前瞻性创新而折服。”

打破甲骨文数据库垄断市场,颠覆传统软件技术


工信部一位长期管理软件产业的官员对这一技术很激动也很感慨,他表示,“在没有见到这一技术前,他不知道中国已经产生了这样的核心基础软件技术,以前被甲骨文数据库垄断的市场终于有望被打破,柏睿数据这一技术应该是软件技术革命性的颠覆。做技术的人都知道没有一个系统的使用可以绕得开数据库的,数据量越多对数据库的依赖越强,所以可以说之前没有系统可以绕开得甲骨文的,但现在他可以很负责任地说甲骨文属于过去式。”


甲骨文无疑是计算机单机共享内存时代“皇冠上的明珠”,是核心基础软件中唯一横跨CPU、操作系统的关键性技术。甲骨文的成就一直被追随但从未被超越,而现在柏睿数据所创造的分布式流数据库技术植根于互联网时代的产物,它解决了之前因为数据流多并发导致的系统瘫痪问题,具备真正互联网的基因,解决了海量数据来临时数据处理能力问题。譬如说,我们耳熟能详的高铁订票系统,当遇到高峰访问时系统就会瘫痪,究其原因就是数据库系统对数据多并发处理能力不够。每秒钟同时在网站访问的人次,能够接纳人次越多,数据库对系统的支撑能力也就越强,所以系统好坏在实际应运中比拼的就是像数据库这样的底层软件对数据的处理能力。


以甲骨文为例,目前它的解决能力是20/s并发,如果用甲骨文数据库,则系统每秒处理能力为20*100=2000人,因此,如果订票系统上同时有2000人订票,那么甲骨文数据库支撑没有问题,但是每秒超过2000人,系统就会瘫痪,而我们现在这个分布式内存流数据库技术解决的并发基数,经过联通测试是每毫秒500并发,就是每毫秒500*100=50000人,就是说每毫秒有50000人同时在同一系统访问处理事务,系统依然很平稳,现在这一测试还在继续上调,此次测试的标准为每毫秒1000并发,是每毫秒1000*100=100000人,目前测试各指标依然非常平稳。

中国的技术发展从不缺乏基因和种子,真正缺乏的是土壤。


作为工信部的国际专家,国际数据库标准的主笔专家,分布式流数据库国际专利的拥有者刘睿民在最后指出,“在一批曾在海外工作学习与国际市场接轨的中国归国精尖技术人才的带动下;在长期国内复杂技术应运环境锻炼过的技术精英共同努力下,我国现在已经具备国际技术竞争的实力,我们的部分技术也在国际市场拥有了话语权,至少大数据领域核心基础软件——我们的分布式流数据库在2018年后国际市场都将遵循我们的标准,我们在国际高科技核心技术领域终于拥有了自己的话语权。


但是,我们还是应该清晰的认识到,中国技术的发展,从来不缺乏基因和种子,真正缺乏的是土壤,一块像硅谷般给技术创新企业自由成长的沃土,在那里,巨无霸公司与小公司能拥有公平的参与市场竞争的机会,获得同样市场待遇,市场给予的创新公司试错容错机会很多,所以大量的创新公司能快速成长发展起来;而我们国家创新型企业真的是前有甲骨文这样巨无霸国际技术的拦路虎,后有国内对国有自主创新技术认识普遍不足这样的现实发展障碍,发展起来真的是需要各级政府的积极支持。

中国软件技术市场应给予容错试错


目前存在这样一个现象,所有项目采购好像只要选用甲骨文、IBM这样的公司产品就完全没有错误,技术本身倒不是考量首要因素,这样的选择领导者完全无需担责;但任何人要提用国内技术,就需要各种小心,思考,求证,质疑,就如选秀时把一个璞玉放在显微镜下去求证一样,本身已经失去了公平性本身,何谈扶持国内自主创新技术企业发展呢。


正如这次习总书记的讲话中所提到的,技术发展要的是各方面提高认识,我们如果自己不给自主技术创新企业以市场支持,我们的自主可控核心系统的技术突围将永无实现的可能性。


自主创新型企业应保持核心竞争力


刘睿民认为,大数据时代,是指非常“膨胀”的数据集,用以前传统典型的数据分析软件和工具难以对其进行捕捉、储存、管理、分享、分析以及可视化。


所以,现在真正意义的大数据有四个特征:一是数据的数量大,可以说是真正的海量数据;二是产生或被吸收的速度和频率快,都是一毫秒级刷取;三是数据的多样性,数据来源维度非产广泛繁多;四是数据实时性,所有数据流动价值能够实时变现。


从大数据中“挖出金矿”,是真正考验技术的时间,而这一技术现阶段对全球都是公平的,从一定意义上说中国还具有优势,因为人口基数,在单位领域内产生海量数据的机会远远大于世界任何国家,所以大数据给人类带来的真正机遇是把许多信息碎片拼起来,为我们的决策服务,而符合上述四个特征并且能解决上述问题的,才是真正意义上拥有核心竞争力的自主创新型企业。


相信在高层大力推动之下,中国大数据产业很快就会出现更快速更良性的发展,越来越多掌握尖端核心科技的中国大数据公司在国际竞争中逐步占据优势地位。