慧聪电子网首页 > 行业资讯 > 国际资讯 > 正文

Cloudera入华两年 大数据、人工智能领域交出满意答卷

http://www.ec.hc360.com2017年07月21日11:32 来源:赛迪网T|T

    2017年7月,在Cloudera进入中国两年多之后,赛迪网记者再次见到了Cloudera大中华区总经理及公司副总裁凌琦,与两年前相比,凌琦语速如初,但是语调多了些自信。

Cloudera 大中华区总经理及公司副总裁

Cloudera 大中华区总经理及公司副总裁

    短短两年多,从Cloudera2014年9月在中国正式开张到现在,公司已经有了良好的布局和客户基础,全球Global8000(全球最大的8000家企业)企业,中国约有800-1000家,分布于金融、电信、制造等领域,Cloudera的客户群体也主要聚焦于此。

    作为一家软件平台厂商,Cloudera的软件平台主要是针对大数据、非结构化数据的管理。并且可以部署在任何云上,可跨AWS、Google云平台以及微软Azure和私有云环境部署和管理Cloudera企业产品。

    对于Cloudera能快速在中国发展,并且得到客户的认可,有专家表示,ApacheHadoop作为一种新型的数据平台,虽然可以在同一个平台上多个框架中实现无限量数据的存储及访问,但是,很多时候企业很难将这种技术转化为真正的商业价值。Cloudera的企业版改变了这一现状。它的企业版可以使得Hadoop变得快速、方便而且安全,真正使企业可以专注于结果,而不是技术本身。

    在安全性方面,凌琦表示,大数据的潜力非常巨大,但不能以安全为代价。Cloudera是唯一通过全面安全和监管达到合规性的Hadoop平台,主要功能包括:企业加密和密钥管理、统一的访问策略实施、自动数据管理、专家支持以及安全操作等等。

    除了以上Cloudera引以为豪的以开源为基础的软件平台,Cloudera的业务还包括专业服务以及培训业务。

    软件业务是Cloudera的核心部分。

    凌琦介绍,现在客户运行在Hadoop上的机器学习平台,需要管理大量的数据,这就需要基础软件平台能够让机器学习充分利用所有的数据,而不是一个个分散的竖井式的数据对象。随着这个过程,Cloudera平台所能够管理的规模也越来越大,安全性也随之提高。

    除此之外,公司还大量使用最新的分布式计算引擎Spark,并且也是最早将Spark引入到Hadoop平台并且进行全面支持的厂商。对于这个能力,客户的证言显得尤为重要。美云智数数据云事业部总经理黄侃表示,“Cloudera不仅展示了其对Spark2.0支持、完善的数据安全控制、元数据管理能力、数据容灾和备份能力等优势,还帮助美的进行了整个大数据的安全评测、定期检查系统,保持其高完整性和可用性。在双方的共同努力下,我们正在把高级分析技术的实践经验转换成新的技术输出,赋能中国的其他制造企业。”

    凌琦透露,机器学习现阶段开始有爆发性应用,因此除了传统的数据分析师之外,还加入了很多数据科学家,他们由于语言的限制经常受制于系统。如何让他们自由地选择熟悉的编程语言或者程序库?Cloudera的答案是“数据科学工作台(DataScienceWorkbench)”。它可以帮助数据科学家直接大量地使用Hadoop中的数据而不是仅仅读取一个子集。并且也可以多用户可以使用自己习惯的语言,同时使用Hadoop中的数据,这个工具一经推出就大受好评,也受到了很多数据科学家的欢迎和重视。

    最后谈到Cloudera在助力企业数字化转型中的挑战时,凌琦总结到,首先是人才,因为人工智能、大数据方面相关人才需求很强烈;其次是思维意识的问题,这不是单纯技术领域的问题,而是需要建立大数据思维。最后是开源行业的合作和技术发展的挑战,Cloudera在持续对社区贡献代码的同时,希望得到更多开源社区的支持。

责任编辑:陈彩霞

热门活动更多>>

2017年中国新能源汽车技术研讨会

地点:上海卓美亚喜玛拉雅酒店2F

时间:8月23日下午13:00