近期,由数据中心联盟组织实施的“DCA大数据产品能力评测”正式公布了第七批大数据产品能力评测成果。该评测的评审委员会由中国信息通信研究院、清华大学、中国科学院等单位,以及所有参与评测产品企业专家组成,截至目前,通过DCA大数据产品能力评测的产品数量累计达到134款/次,涵盖了分布式批处理平台、分布式分析型数据库、分布式事务数据库、时序数据库、用户行为分析解决方案、数据挖掘工具、数据集成工具、数据管理平台,以及商务智能(BI)分析工具。据了解,本届大数据产品评测吸引了众多企业的参与,除了大数据技术标准委员会中120家会员之外,还吸引了很多非会员类企业的参与,其中即包括银行、政府、央企等对甲方客户,还包括专注于大数据产品的垂直企业。其中,国双以5款大数据和人工智能产品通过7个能力评测,成为该评测有史以来一次性通过评测数量最多的企业。
提升数据资产质量,推动大数据产业规范化发展
这是一个大数据爆炸的时代,数据无处不在,谁掌握了数据,谁就能够把握成功。大数据产业发展到今天,虽然在技术能力上取得了巨大的进步,但由于企业对于数据资产管理的重要性和能力尚缺乏共识,业内仍然没有形成统一的产品能力评定标准。如何能够高效管理数据资产、如何形成统一判断大数据产品能力的标准,对于整个行业生态的建立至关重要。
中国信息通信研究院云计算与大数据研究所所长何宝宏表示,大数据产品能力测评是标准的落地环节,旨在促进大数据相关技术工具的成熟,帮助用户选择合适的产品,通过技术工具的普及提升数据资产质量、提高数据资产价值挖掘的效率。无论标准还是评测都是推动大数据产业规范化发展的重要部分,能够有效释放技术型企业的活力,为技术深入各行各业保驾护航,让大数据真正成为推动经济转型发展的新动力。
以场景应用为重点,助力大数据应用落地
作为本次评测项目的主要负责人之一,中国信通院云计算与大数据研究所主任魏凯介绍,今年的评测新增加了商务智能和数据挖掘这两个平台,一个是做报表的,另一个是做机器学习建模的,特别贴近客户应用层,稍微进行简单的培训,就能上手。魏主任表示,hadoop要用Java写MapReduce程序,可是很多企业根本没有IT人员,怎么编程序?这就大大增加了企业的使用门槛。如果将一个图形化的大数据软件交付给用户,只需要拖拖拽拽的操作即能够实现大数据能力,那么企业就可以将更多的精力用到产品的技术研发上,从而减少运营实施的压力。笔者观察发现,今年参评的大数据的产品大都提供了可视化的管理界面,例如国双参测的5款大数据产品,全部提供可视化的管理平台,大大减少了用户的使用成本。
除了新增加的两个平台之外,今年数据规模也变得越来越大。据了解,今年的大数据产品评测不但测试了管理上万台机器的能力,而且数据量最高也达到了100TB,已经达到了世界顶级的水平。以国双并行数据仓库系统 (Gridsum ZETA PDW)为例,这个唯一一个通过分布式分析型数据库性能评测的产品,在hadoop性能测试中,TB级数据量下部分SQL执行时间可低于10秒钟,海量数据检索速度也比较领先,为此夺得了SQL性能测试第一名。
国双CTO刘激扬
作为科技创新驱动的大数据和人工智能企业,国双通过此批DCA大数据能力评测意义重大。国双CTO刘激扬表示,对于行业而言,说明中国在大数据行业的整体技术实力正在持续提高,对于国双而言,是长期深耕大数据行业的成果,印证了国双在大数据、人工智能这个领域中领先的技术优势,特别是拥有分析型数据库、数据智能、用户行为分析等在产业互联网领域中都需要用到核心能力和技术。未来,国双还将持续为数字营销、司法、电子政务、工业互联网、数据智能等多领域客户挖掘数据价值,为企业数字化、智能化转型赋能。
“数据管理是一个非常复杂的过程,不可能一筹而就。下一步,中国信息通信研究院作为标准制定和评测的牵头单位,以中国通信标准化协会为平台,与学术界、产业界和领域用户紧密合作,不断完善大数据产品技术标准评测基准,推动我国大数据产品技术水平不断提升,为数据强国提供强有力的基础支撑。魏主任如是说。