什么是大数据?

为大数据提供支持
VMware 和 Cloudera:携手合作,实现 Hadoop 虚拟化。
澄清对 Hadoop 虚拟化的误解
了解有关基于 vSphere 虚拟化 Hadoop 的真实情况。
技术案例:Adobe Systems
Adobe 将 Hadoop 作为 VMware vSphere 上的一项服务进行部署。
成功实施大数据项目的障碍
预算限制
根据 Deloitte 的研究,预算限制和成本是许多公司回避部署大数据的最主要原因。要证明投资新 IT 基础架构以处理大量数据的合理性确实不易,尤其是在企业并没有相关业务案例的情况下更是如此。
IT 专业技能
处理大数据工作负载不同于处理典型企业级应用工作负载。大数据工作负载采用平行的处理方式,而不是按顺序处理。IT 通常会优先处理关键业务工作负载,并安排在夜间或者容量有富余时批量处理优先级较低的作业。但对于大数据分析,很多应用场景必须实时运行以便立即分析并迅速反应。这使 IT 不得不改变数据中心策略,并学习使用新工具来创建、管理和监控这些新工作负载。
平台限制
各公司需要选择合适的基础架构类型来运行他们的应用和数据。采购硬件需要花时间。对于概念证明而言,采用云计算可能是明智之举,但也会带来平台限制风险和安全问题,而且会大规模地产生巨大成本。而且,Cloudera、Hortonworks、MAPR 和 Pivotal 提供的都是互不兼容的竞争性体系架构,各公司必须决定选择哪种 Hadoop 版本。有很多决定,一旦做出,公司以后就很难再进行调整,因此很多公司只好一再推迟讨论是否采用大数据。
VMware 大数据的优势
简单
简化大数据基础架构的运行和维护。
敏捷
按需获取基础架构,让您可以快速实现业务价值。
经济高效
通过集群整合降低 CAPEX 成本。通过自动化和简单工作流降低 OPEX。
灵活
尽早尝试并经常使用主要的大数据技术。借助多租户技术,您可以在同一虚拟机上运行多个 Hadoop 发行版。
高效
池化您的资源并提高服务器利用率。自动实现工作负载移动化可提高处理效率。
安全
确保敏感数据的可控性与合规性。
Hadoop 聚焦
无论是物理基础架构还是虚拟基础架构,其作用都是为应用提供支持。这包括传统关键业务应用以及现代云端应用、移动应用和大数据应用。 行业分析师 Doug Laney 从以下三个方面对大数据进行了定义:
- 卷:TB、记录、交易、表和文件
- 速度:批量、短时间、实时和流
- 种类:结构化、非结构化和半结构化
Apache Hadoop(即 Hadoop)是一款用于大数据分布式存储和处理的开源软件。Cloudera、Hortonworks、MAPR 和 Pivotal 等公司纷纷将 Hadoop 打包并集成在了大版本(即发行版)中,以运行大数据工作负载。对 Hadoop 等大数据应用进行虚拟化可提供诸多优势,这些优势在物理基础架构或云环境中是无法实现的。简化大数据基础架构的管理可以让您更快地取得成果,从而提高成本效益。如同对传统应用的意义一样,对大数据而言,VMware 同样是最好的平台。