在大数据时代,Hadoop技术是最为常见的,随着Hadoop技术应用的逐渐深入,人们对Hadoop的关注也变得炙手可热。
我们首先要介绍一点背景知识:Hadoop属于开源Apache项目,任何用户都可以免费下载其核心组件——其中包括Hadoop Common、Hadoop分布式文件系统(简称HDFS)、Hadoop YARN以及Hadoop MapReduce等。IBM、Amazon Web Services、微软以及Teradata等企业都试图将Hadoop通过打包发行成更易于使用的发行版或者服务项目。每一家企业在战略取向方面都略有不同,但这些方案的核心区别在于,Hadoop拥有将工作负载分布至成千上万台服务器设备中的能力、而这正是将大数据转化为可管理数据的关键所在。
以下三大企业是Hadoop技术领域的巨头。
IBM
当企业用户想到大型IT项目时,我们脑海中首先出现的很可能正是IBM的名号。正因为如此,IBM也不出意料地成为Hadoop项目领域的主要参与者之一。Forrester指出,IBM打造的Hadoop方案目前已经部署到一百多家客户的业务环境当中,其中不少客户所处理的数据规模都达到了PB级别。该公司利用其丰富的网格计算、全球数据中心以及企业级方案实施经验打造出自己的大数据项目。“IBM的路线图当中包括进一步将BigInsights Hadoop解决方案与IBM相关IT资产加以整合,例如SPSS高级分析、高性能计算工作负载管理、商务智能工具以及数据管理与建模工具等等,”Forrester解释道。